Le vol d'essai de HAMERKOP avec l'IA
Bonjour à l'intelligence artificielle chez HAMERKOP et dans le secteur de la finance climatique
Auteur : Jit Ping, printemps 2024
La vague de l'IA (Intelligence Artificielle) a pris le monde d'assaut et aucune personne ou industrie n'est épargnée par ses effets. Le secteur de la finance climatique est bien placé pour tirer parti des pouvoirs de l'IA afin d'offrir une plus grande valeur à toutes les parties prenantes concernées. En effet, nous ne sommes pas très loin d'un monde où l'IA peut évaluer la faisabilité de divers projets carbone et recommander de nouveaux projets dans des endroits auxquels nous n'avions pas pensé auparavant.
En guise d'introduction, je m'appelle Jit Ping et j'ai effectué un stage de deux mois au début de l'année en tant que stagiaire en recherche sur l'IA afin de découvrir comment HAMERKOP et l'industrie au sens large peuvent utiliser l'IA aujourd'hui et à l'avenir. J'ai le plaisir de partager avec vous, dans ce billet de blog, quelques idées tirées de mon expérience au sein de HAMERKOP. (cliquez ici pour en savoir plus sur mon expérience de stage)
Qu'est-ce que l'IA ?
De manière générale, l'IA cherche à accomplir des tâches qui requièrent l'intelligence humaine[1]. Satya Nadella, PDG de Microsoft, résume l'IA de manière succincte lorsqu'il note que l'IA ne consiste pas seulement à fournir des informations aux utilisateurs, mais "à mettre l'intelligence au bout de vos doigts ou l'expertise au bout de vos doigts"[2]. En effet, il a été prouvé que l'IA avait un fort potentiel dans la détection précoce et plus précise de divers cancers[3]. Les capacités de l'IA à changer la vie vont au-delà de l'individu et s'étendent au monde entier. L'IA est utilisée pour déterminer le rythme de fonte des icebergs et l'endroit où concentrer les efforts de nettoyage des océans[4].
Les LLM (Large Language Models) tels que ChatGPT, Gemini et Claude ont marqué l'introduction de l'IA dans la conscience publique et ont suscité un vif intérêt de la part du public en raison de leur facilité d'utilisation et de leur potentiel à remplacer de nombreux emplois de bureau en col blanc que nous considérions auparavant comme irremplaçables. La capacité des LLM à lire et à écrire est illustrée par les excellents résultats du GPT-4 à l'examen du barreau généralement passé par les avocats[5]. Plus important encore, les LLM peuvent analyser et générer des textes à une échelle beaucoup plus grande que les humains. Par exemple, l'IA Claude d'Anthropic peut traiter de longs romans comme The Great Gatsby en une seule requête[6].
Les LLM ne représentent qu'une petite partie de ce que l'IA peut faire. C'est dans le domaine de l'apprentissage automatique que l'IA est la plus prometteuse[7]. L'apprentissage automatique repose sur l'interprétation de données par des systèmes informatiques afin de trouver des relations et de faire des prédictions futures[8]. Le battage médiatique autour de l'apprentissage automatique découle de sa capacité à découvrir des modèles que les humains ne pourraient jamais découvrir et de sa capacité à s'entraîner à l'aide d'un corpus massif de données. Par exemple, les algorithmes d'apprentissage automatique peuvent utiliser des logiciels attachés aux éoliennes pour aider à programmer des travaux de maintenance préventive avant qu'une panne ne se produise[9].
Cas d'utilisation de l'IA 1 - Lire et rédiger des rapports
La capacité des LLM à écrire est inégalée et incontestable. En fait, l'auteur japonais Rie Kudan a remporté le prestigieux prix Akutagawa de son pays pour son livre, tout en révélant que "probablement environ 5 % de l'ensemble du texte est écrit directement à partir de l'I.A. générative" [10].[10]. Les experts estiment que l'IA générative (qui inclut les LLM) a considérablement amélioré la capacité de la technologie à atteindre des aptitudes semblables à celles de l'homme en matière de créativité et de comportements socio-émotionnels[11].
Si les titulaires d'une maîtrise en droit peuvent être bons dans le domaine de la rédaction et de la production d'idées, sont-ils aussi bons dans le monde des affaires ? Après tout, HAMERKOP et la plupart des autres entreprises sont intéressées par la précision et l'exactitude des faits. L'essai de HAMERKOP avec les LLM suggère que, bien qu'elle ait raison la plupart du temps, l'IA produit fréquemment des résultats indubitablement erronés. L'IA a inventé des chiffres qui n'existaient pas dans les rapports et a eu du mal à comprendre le contexte complet de longs documents.
En effet, les échecs des LLM à obtenir des faits de base corrects ou à comprendre des instructions de base sont bien documentés. Les LLM sont conçus pour être "probabilistes et parfois imprévisibles"[12] et ne sont en réalité que de très bons générateurs de phrases. Cela signifie que leur capacité à résoudre 2+2=4 ne repose pas sur une compréhension fondamentale des mathématiques et n'est pas garantie. Les chercheurs en IA qualifient certains échecs de l'IA d'"hallucinations", par exemple lorsqu'elle se contredit dans ses réponses ou invente des faits qui n'existent pas[13].
Il est clair que les MBA ne peuvent pas se voir confier des tâches de manière autonome, sans intervention humaine ni conseils. Cependant, ils ont encore un rôle à jouer chez HAMERKOP et dans d'autres entreprises. Les LLM peuvent être utilisés pour passer au peigne fin de longs documents afin de trouver un point de données spécifique (ou pour se référer à la page pertinente où se trouve l'information) et pour synthétiser des morceaux de textes en un tableau soigné.
Même si les LLM peuvent bien extraire l'information, ils ne seront vraiment prometteurs que s'ils peuvent le faire à grande échelle. À l'heure actuelle, la plupart des informations sur les projets carbone se trouvent dans divers rapports de contrôle et de vérification. Cependant, la présentation de ces informations n'est pas standardisée - parfois l'information se trouve sous la forme d'un symbole mathématique ou n'est tout simplement pas présente du tout. En outre, les gestionnaires du cycle de vie ont des difficultés avec la tabulation mathématique des valeurs lorsque les rapports de vérification remplacent ou complètent des informations antérieures[14]. L'objectif de créer un système capable de traiter des documents en masse tout en garantissant "le coût, la qualité et la généralité" fait toujours l'objet d'une discussion active parmi les universitaires[15]. Espérons qu'une telle technologie se généralisera dans un avenir pas trop lointain.
Cas d'utilisation de l'IA 2 - Faire des prédictions de qualité
L'IA permet de surmonter les deux principaux obstacles à la mise en œuvre réussie d'un projet climatique : le coût de la main-d'œuvre et l'incertitude. Le travail le plus exigeant en termes de main-d'œuvre dans un projet climatique est souvent le travail sur le terrain. Les projets de reboisement nécessitent une longue analyse des terres pour déterminer les réductions d'émissions potentielles et pour contrôler les projets après leur mise en œuvre. L'IA est utilisée pour analyser les images satellite et peut annoter les caractéristiques d'un écosystème et suivre les changements qui se produisent dans sa composition[16].
Les projets nécessitent des investissements pour fonctionner, et les investisseurs ont besoin d'avoir une bonne idée des rendements qu'ils peuvent attendre avant de s'engager dans un financement. L'IA peut analyser de grandes quantités de données passées pour faire des prédictions sur l'avenir. Par exemple, elle peut analyser la quantité attendue de crédits générés par un projet et le prix potentiel de vente de chaque crédit[17].
En effet, une pléthore d'entreprises se lancent dans le secteur en vue d'utiliser l'IA pour aider les entreprises à mettre en œuvre leur projet du début à la fin. Par exemple, certaines utilisent un LLM pour répondre à des questions pertinentes sur le marché du carbone et sur le lancement d'un projet. Ils tentent de fournir des logiciels qui permettent aux propriétaires de projets de recevoir des fonds, de documenter les détails du projet et de se connecter avec d'autres parties prenantes[18]. De même, d'autres travaillent sur une suite de logiciels d'IA qui aideraient à l'analyse géospatiale, au choix de la bonne méthodologie et à la rédaction de documents de description de projet[19].
Les performances des modèles d'IA dans des tâches telles que l'arpentage et les prédictions dépendent en fin de compte de la qualité et de la quantité des données utilisées pour l'apprentissage, ainsi que des méthodes d'apprentissage employées. Toutefois, les développeurs répugnent à divulguer des informations détaillées sur leurs ensembles de données ou leurs méthodes d'apprentissage. Par conséquent, les modèles d'IA, en particulier les réseaux neuronaux, restent souvent des "boîtes noires" opaques, car leur raisonnement interne et le processus par lequel ils parviennent à des résultats spécifiques ne sont pas totalement transparents ou compris[20]. Pour renforcer la confiance dans les résultats des modèles d'IA, les chercheurs auraient intérêt à avoir accès à des explications détaillées sur les processus décisionnels des modèles et à pouvoir reproduire et valider les résultats de manière indépendante.
Conclusion - Utiliser l'IA ou être utilisé par l'IA
Il est clair que la question centrale pour HAMERKOP et d'autres entreprises n'est pas de savoir s'il faut utiliser l'IA, mais plutôt comment bien l'utiliser.
La formation des employés pour qu'ils soient prêts pour l'IA est certainement le facteur le plus important. Tout d'abord, il est important d'être conscient des limites de l'IA. La lecture de cet article vous aurait déjà fait comprendre que l'IA peut inventer des faits et qu'il ne faut pas s'y fier aveuglément. En outre, des chercheurs de la Harvard Business School estiment qu'il existe une "frontière technologique irrégulière" dans laquelle des tâches de difficulté similaire sont soit réalisables par l'IA, soit impossibles à accomplir[21]. Savoir si une tâche se situe à l'intérieur ou à l'extérieur de cette frontière permettra de gagner du temps et de ne pas en perdre lors de l'utilisation de l'IA.
Deuxièmement, de simples techniques d'ingénierie de l'invite peuvent considérablement améliorer les résultats produits par les LLM. Par exemple, les modèles LLM de Claude Anthropic obtiennent des résultats supérieurs de 30 % dans les tests à choix multiples lorsque le texte de référence est placé au début de l'invite et non à la fin[22]. La formation des utilisateurs à l'ingénierie de l'invite peut garantir que l'IA fournit des informations plus précises et dans le format attendu par les utilisateurs.
Le secteur de la finance climatique vient à peine de se lancer dans l'aventure de l'IA. Pour bénéficier du vaste potentiel de l'IA, les entreprises doivent adopter l'IA dans son intégralité - en donnant à tous les employés les compétences nécessaires pour utiliser efficacement les derniers outils d'IA.
[Claude 3 a participé à la relecture de cet article].
Références :
https://www.britannica.com/technology/artificial-intelligence
https://www.weforum.org/podcasts/meet-the-leader/episodes/davos-2024-conversation-microsoft-satya-nadella/
https://health.google/intl/ALL_uk/health-research/imaging-and-diagnostics/
https://www.weforum.org/agenda/2024/02/ai-combat-climate-change/
https://www.reuters.com/technology/bar-exam-score-shows-ai-can-keep-up-with-human-lawyers-researchers-say-2023-03-15/
https://twitter.com/AnthropicAI/status/1656700156518060033?lang=en
https://hammerspace.com/is-2024-the-year-of-the-enterprise-llm/
https://britannicaeducation.com/blog/ai-in-education/
https://plat.ai/blog/predictive-maintenance-machine-learning/
https://www.smithsonianmag.com/smart-news/this-award-winning-japanese-novel-was-written-partly-by-chatgpt-180983641/
https://www.mckinsey.com/capabilities/mckinsey-digital/our-insights/the-economic-potential-of-generative-ai-the-next-productivity-frontier#work-and-productivity
https://medium.com/@glovguy/large-language-models-reasoning-capabilities-and-limitations-951cee0ac642
https://www.vellum.ai/blog/llm-hallucination-types-with-examples
https://bezerocarbon.com/insights/generative-ai-techniques-can-drive-standardisation-and-increased-transparency-to-the-vcm
https://arxiv.org/pdf/2304.09433.pdf
https://medium.com/@Gaurav_writes/machine-learning-for-forest-monitoring-algorithms-use-cases-challenges-4b9f3fb2e766
https://drive.google.com/file/d/1wq5612Ag1FlMwiFsYnAjEXOcN0HZXZVG/view
https://www.ivyprotocol.com/
https://www.nika.eco/carbongpt
https://towardsdatascience.com/why-we-will-never-open-deep-learnings-black-box-4c27cd335118
https://www.hbs.edu/ris/Publication%20Files/24-013_d9b45b68-9e74-42d6-a1c6-c72fb70c7282.pdf
https://www.youtube.com/watch?v=6d60zVdcCV4&t=1741s