L’utilisation de l’IAG se propage comme un réflexe. Faut-il privilégier des IA polyvalentes, mais susceptibles de biais, ou des versions spécialisées, plus précises, fondées sur des données de qualité pour renforcer la compétitivité de l’entreprise ?
L’intelligence artificielle s’accorde au pluriel
En matière d’élaboration de stratégie d’IA, deux approches s’opposent. La première utilise l’IA générative pour répondre à toutes nos questions et attentes. La seconde développe des IA spécialisées selon les secteurs et professions. Cotée en Bourse, le britannique RELX, qui affiche un CA de 9 milliards de livres, a forgé son expertise dans le développement de telles IA. Sa filiale LexisNexis et son IA juridique dédiée, Lexis+ AI, s’appuient sur des bases de données conçues et vérifiées par des professionnels du droit, à raison de plus de 100 milliards de documents, avec plus de 2 millions de nouveaux documents ajoutés chaque jour à partir de plus de 50 000 sources.
Du contenu de confiance
Sur le net, différencier le bon grain de l’ivraie devient de plus en plus difficile. En dépit d’améliorations constantes, les IAG seraient à l’origine de beaucoup de désinformation. Leurs réponses, sujettes aux biais qui émaillent Internet, demeurent vraisemblables mais appellent le doute.
En dépit d’améliorations constantes, les IAG seraient à l’origine de beaucoup de désinformation
Selon Newsguard, organisme qui propose des systèmes et outils d'évaluation de l’information en ligne, il existe plus de sites d’informations frauduleuses que l’inverse. Annonceurs et agences de marketing, les yeux rivés sur leurs objectifs financiers, usent de fake news pour augmenter la fréquentation de leurs sites. C’est là le principal écueil.
Pourtant, Paul Abrahams, directeur de la communication du groupe RELX, est catégorique : “Il est essentiel, non pas de produire du contenu, mais du contenu de confiance.” Raison pour laquelle, les données des différentes IA made in RELX sont régulièrement mises à jour, et ce de manière très précise, notamment sur les secteurs scientifiques. Le domaine de la santé exige notamment que les praticiens et chercheurs vérifient la qualité des documents qui enrichissent les bases de données.
Vers des IA spécialisées
Cet engouement pour les IA spécialisées va à l'encontre de la tendance au scraping, qui permet de collecter des données sur le web, souvent de manière illégale. Ce type de collecte à grande échelle, caractéristique de ChatGPT, sous-tend des dérives comme les hallucinations générées par l’IA, associant des idées fausses ou trompeuses et présentées comme des faits certains, ou encore l’appauvrissement des contenus à force d’apprentissage synthétique.
A contrario, une IA spécialisée ne doit se nourrir que d’informations spécifiques à un secteur. Lexis+ AI, rompue à la prise de décision juridique, n’est alimentée que d’informations issues de ce milieu et s’appuie sur des documents de référence. En outre, elle sait qu’elle s’adresse à un public d’avocats.
De l’importance de la donnée
Selon son dirigeant, l’essor de RELX s’ancre sur quatre piliers. Le système doit reposer sur de grands ensembles d’informations de confiance, qui seront accessibles sur les plateformes globales. Sur cette base, l’entreprise doit affiner sa compréhension des problématiques du client et de son écosystème, afin de mettre au point une analyse pertinente.
"La qualité de la donnée fera la différence entre une approche réactive ou proactive face au risque"
Ainsi, depuis des années, c’est la bonne gestion de la donnée qui a permis au groupe de monter en puissance avec les IA génératives, à partir des IA extractives, qui s’affairaient à la gestion et recherche au sein de leurs bases de données. "En seulement six mois, toute l’entreprise a pris le virage de l’IAG, nous avons pu proposer un produit solide." Le succès se chiffre alors que le groupe enregistre des marges de plus de 30 %.
Intelligence proactive
Les secteurs du retail et celui de la banque détiennent des bases des plus enrichies, grâce auxquelles il est possible de détecter des schémas de fraudes lors de transactions. Les algorithmes alertent en amont sur la forte probabilité d’un scénario de fraude, avant qu’elle ne se produise.
"La qualité de la donnée fera la différence entre une approche réactive ou proactive face au risque", explique le porte-parole du groupe. Le secret du succès est simple : une IA de confiance doit se baser sur des données de confiance. Ce que nul n’est censé ignorer, que le modèle soit spécialisé ou pas.
Alexandra Bui et Sasha Alliel