IA générative : pourquoi est-ce qu’on en parle ?
Article
Actu
Courte introduction à l’IA et ses contextes !
Pourquoi l’intelligence artificielle, et en particulier l’IA générative, s’est aussi vite démocratisée, pourquoi est-elle dans toutes les bouches aujourd’hui ? Tentative de réponse avec cette première partie d’une saga qui nous emmènera de la surface aux profondeurs des secrets de l’IA !
Nous avions d’ailleurs commencé à aborder le sujet lors d’un précédent article : IA, le cerveau de demain !
Vous avez sûrement entendu parler d’« IA générative » ou de « LLM (Large Language Models) », cette capacité à un algorithme de type système d’intelligence artificielle à créer du contenu – texte, image, vidéo, sons etc. – à partir d’une volumétrie importante de données. Ce sujet est en plein essor et des cas d’application arrivent, que ce soit pour le grand public ou dans les entreprises. Mais l’IA générative n’est-elle pas qu’une bulle spéculative ? Y a-t-il un réel intérêt industriel ? Décortiquons ensemble ce sujet passionnant.
Attention à la confusion !
les LLM sont des IA génératives mais toutes les IA génératives ne sont pas des LLM.
Ces derniers sont entrainés sur de vastes ensembles de données textuelles afin d’en apprendre la syntaxe et le sens.
Les LLM sont souvent utilisés pour la traduction automatique, la génération de texte, le résumé automatique, la réponse à des questions…
Ils excellent dans la compréhension du langage et génèrent du texte cohérent et plausible. Cependant leur principale fonction n’est pas la génération créative.
Au contraire, les IA génératives utilisent diverses techniques pour créer un contenu nouveau dans des domaines variés.
Quelques exemples d’IA génératives
Texte
Logo de ChatGPT, une des IA génératives les plus connues
GPT (Generative Pre-trained Transformer). Y compris des variantes telles que GPT-2 et GPT-3.
BERT (Bidirectional Encoder Representations from Transformers). Bien qu’il soit principalement utilisé pour la compréhension du langage, il peut également générer du texte.
Image
Visage de femme généré par StyleGAN, au réalisme quasi parfait.
StyleGAN (Generative Adversarial Network for Style-based Image Generation). Utilisé pour générer des images réalistes avec un contrôle fin sur le style.
VQ-VAE (Vector Quantized Variational AutoEncoder). Utilisé pour la génération d’images et la modélisation de la distribution des pixels.
Musique
Logo de MuseNet, opéré par OpenAI.
MuseNet. Développé par OpenAI, capable de générer de la musique dans différents styles et genres.
Magenta. Une bibliothèque d’IA générative développée par Google pour la création de musique et d’art.
Design et création artistique
Surement l’une des IA génératives les plus connues, Dall-E permet la réalisation de visuels et images.
DALL-E. Un modèle d’IA développé par OpenAI capable de générer des images à partir de descriptions textuelles.
DeepDream. Un projet de Google qui utilise les réseaux neuronaux profonds pour générer des images artistiques à partir de photos existantes.
Animation et création de personnages
Logo de l’IA Cascadeur
Cascadeur. Un outil basé sur l’IA utilisé pour la simulation de mouvements pour les personnages de jeux vidéo et films d’animation.
Génération de jeux vidéo
L’IA générative permet des générations procédurales d’arbres avec Unreal Engine 5.
Procedural Content Generation (PCG). Une méthode qui utilise des algorithmes génératifs pour créer des éléments de jeu : niveaux, environnements, quêtes…
Création de recettes et de plats culinaires
Bon, les robots cuisiniers ne ressembleront pas à ça avant encore quelques années !
Chef Watson. Développé par IBM, il utilise des techniques d’IA pour générer des recettes et des combinaisons d’ingrédients uniques
Psssst…. ya un petit nouveau qui vient d’arriver !
IA génératives, les premiers résultats de Sora, développée par OpenAI, sont bluffants !
Hey, il y a un petit nouveau dans les services de création basés sur l’IA, avec Sora, la solution prompt-to-video d’OpenAI (les créateurs de ChatGPT). Pas encore disponible pour le grand public, les premiers résultats visibles ci-dessus sont bluffants !
IA générative : pourquoi on n’en parle que depuis peu
L’IA générative n’est pas récente puisque des algorithmes de création de contenus ont été réalisés par des chercheurs dans les années 1950, avec des machines capables de générer du langage. Ces recherches ont mêlé des thématiques en psychologie cognitive et en informatique. Elles ont permis de faire évoluer des IA simples vers des IA complexes : aujourd’hui les modèles générés par l’IA dépassent le milliard de paramètres. La technologie informatique, la connaissance scientifique et l’accès aux données ont permis cette révolution.
Une densification du nombre de paramètres !
Les modèles d’IA ont tendance à devenir de plus en plus grands au fil du temps, avec une augmentation significative du nombre de paramètres ces dernières années. Si bien que les modèles GPT-2 et GPT-3 d’OpenAI sont parmi les plus grands modèles de langage disponibles publiquement, avec des centaines de millions, voire des milliards de paramètres.
Cette technologie a pris son essor récemment, avec notamment la sortie en novembre 2022 de « ChatGPT », Chatbot développé par OpenAI. Cet agent artificiel conversationnel est capable de dialoguer avec un être humain, de manière assez bluffante. D’autres modèles d’IA génératrice de texte ont vu le jour depuis, et notamment « LLAMA », développé par Meta et publié en open-source en 2023.
Ce qui fait que l’IA générative est en fort développement aujourd’hui, c’est l’intérêt majeur du grand public pour cette technologie : facilement accessible au grand public et, qui plus est, de manière gratuite. Par ailleurs, il est facile de se projeter dans son utilisation puisque l’interface arrive à adapter sa réponse en fonction des mots choisis par son interlocuteur. Votre question peut concerner des sujets orientés métaphysiques ou bien techniques, par exemple trouver une requête optimisée d’un langage informatique, produire une affiche relative à un contexte très spécifique. Dans le cas des chatbots, il peut également témoigner d’un refus sur des sujets sensibles et même s’excuser quand il s’est trompé. Clairement, on a l’impression de discuter avec un humain. Donc on pourrait même croire que le chatbot a appris des concepts humains et nous partage ses émotions.
Si bien que c’est particulièrement ces chatbots qui ont rendu l’IA plus accessible, plus démocratisée et plus humaine.
IA générative : pourquoi les entreprises veulent l’utiliser ?
Aujourd’hui l’IA fait parler d’elle puisqu’elle peut répondre à de nouveaux besoins. L’IA peut être une vraie valeur ajoutée pour une entreprise, notamment sur la production d’indicateurs internes ou sur ses produits commercialisés. Car au-delà du « buzz » médiatique, les utilisateurs et les dirigeants d’entreprises veulent réellement avoir un gain de temps ou une compréhension de contexte qui n’étaient pas accessibles auparavant.
L’IA générative peut profiter aux entreprises sur plusieurs aspects : idéation, création de contenu, synthèse de documents, compréhension et accès à l’information, aide aux clients ou à la productivité interne. Par exemple, l’outil Copilot de Microsoft aidera les entreprises sur leur création de comptes rendus lors de réunion. Donc, les avantages de l’IA sont multiples, et proposer des services et des aides à la décision est un avantage productif précieux.
Avant qu’une entreprise se lance dans l’IA générative, elle doit se poser les bonnes questions et faire un état des lieux : quels cas d’usages peuvent répondre à son ou ses besoins ? A-t-elle des données exploitables ? Sous quelle forme veut-elle restituer les résultats ? Car la stratégie d’une entreprise dépend également du besoin auquel elle souhaite répondre.
IA générative : la réalité et les problématiques soulevées
Au-delà des avantages, un axe de progression important perdure pour les écosystèmes IA : la vérification des informations restituées. Aujourd’hui l’IA reste une « boîte noire » où les concepteurs restent des humains et une quantité astronomique de données est ingérée. Comment vérifier ces données avant de les utiliser comme une base d’apprentissage ? Ce sera un enjeu majeur pour créer les modèles IA de demain : acquérir des bases de données “propres”.
L’interprétabilité est un mot clé phare dans la conception des modèles IA. Donc, il est même possible que cela soit le nerf de la guerre pour le développement de l’IA dans un futur proche ! Désormais les entreprises souhaitent comprendre les résultats. Des briques algorithmiques permettent de décortiquer et mieux comprendre l’apprentissage des modèles, et avoir une vraie « transparence » des résultats. Des modèles se développent notamment pour la fiabilité des sources utilisées par l’IA. Par exemple, Perplexity.ai fournit des liens de sources à chaque réponse créée, ce qui amène une véracité sur les réponses générées.
Si bien que l’IA générative ouvre le champ des possibles, et son potentiel d’utilisation dans les entreprises croît de manière exponentielle. Les risques de sécurité et d’éthique seront des axes majeurs de développement dans les années futures.
Voilà qui conclut notre première partie sur les raisons de “la mode” de l’intelligence artificielle actuellement. Stay tuned pour le reste de la série d’articles qui s’intéressera plus au fonctionnement de l’IA !