Un aperçu et une comparaison des modèles GPT 1-4, du GPT-55X d'Amazon et plus encore.
Read in English (Lire en anglais).
Ces dernières années, l'intelligence artificielle (IA) a généré bien plus que du contenu. Elle a suscité débats, enthousiasme, critiques et innovations dans un large éventail d'industries. L'une des technologies d'IA les plus remarquables et dont on parle le plus aujourd'hui est GPT, qui est souvent incorrectement assimilée à ChatGPT.
Dans cet article, vous découvrirez ce qu'est GPT, comment il fonctionne et à quoi il sert. Nous comparerons également différents modèles GPT, en commençant par le transformateur original et en terminant par l'entrée la plus récente et la plus avancée du catalogue d'OpenAI : GPT-4.
GPT est un acronyme qui signifie "Generative Pre-trained Transformer" (Transformateur génératif pré-entraîné) et désigne une famille de grands modèles de langage (GML) capables de comprendre et de générer du texte en langage naturel.
Décomposons cet acronyme :
Génératif : L'IA générative est une technologie capable de produire du contenu, comme du texte et des images.
Pré-entraîné : Les modèles pré-entraînés sont des réseaux sauvegardés qui ont déjà été formés, à l'aide d'un vaste ensemble de données, pour résoudre un problème ou accomplir une tâche spécifique.
Transformateur : Un transformateur est une architecture d'apprentissage profond qui transforme une entrée en un autre type de sortie.
L'analyse de l'acronyme ci-dessus nous aide à nous rappeler ce que fait GPT et comment il fonctionne. GPT est une technologie d'IA générative qui a été préalablement entraînée pour transformer ses entrées en un type différent de sorties.
Regardez cette vidéo pour en savoir plus sur ce qu'implique l'utilisation d'un modèle GPT.
Les modèles GPT sont des modèles de prédiction de langage à usage général. En d'autres termes, ce sont des programmes informatiques qui peuvent analyser, extraire, résumer et utiliser autrement des informations pour générer du contenu.
L'un des cas d'utilisation les plus célèbres de GPT est ChatGPT, une application de chatbot d'intelligence artificielle (IA) basée sur le modèle GPT-4 (anciennement basée sur GPT-3.5) qui imite une conversation naturelle pour répondre aux questions et réagir aux invites. GPT a été développé par le laboratoire de recherche en IA OpenAI en 2018. Depuis lors, OpenAI a officiellement publié trois itérations du modèle GPT : GPT-2, GPT-3 et GPT-4.
Le terme grand modèle de langage est utilisé pour décrire tout modèle de langage à grande échelle conçu pour des tâches liées au traitement du langage naturel (TLN). Les modèles GPT sont une sous-classe des GML.
GPT-1 est la première version du modèle de langage d'OpenAI. Il a suivi l'article de Google de 2017 Attention is All You Need, dans lequel des chercheurs ont présenté le premier modèle transformateur général. Le modèle transformateur révolutionnaire de Google sert de cadre pour Google Search, Google Translate, la saisie automatique et tous les grands modèles de langage (GML), y compris Gemini et Chat-GPT.
GPT-2 est le deuxième modèle de langage basé sur un transformateur par OpenAI. Il est open-source, non supervisé et entraîné sur plus de 1,5 milliard de paramètres. GPT-2 a été spécifiquement conçu pour prédire et générer la séquence de texte suivante pour faire suite à une phrase donnée.
La troisième itération du modèle GPT d'OpenAI est entraînée sur 175 milliards de paramètres, une augmentation considérable par rapport à son prédécesseur. Il comprend des textes OpenAI tels que des entrées Wikipédia ainsi que l'ensemble de données open-source Common Crawl. Notamment, GPT-3 peut générer du code informatique et améliorer les performances dans des domaines de niche de création de contenu, comme la narration.
Les versions ultérieures de GPT-3 sont connues sous le nom de GPT-3.5 et GPT-3.5 Turbo.
GPT-4 est le modèle le plus récent d'OpenAI. C'est un grand modèle multimodal (GMM), ce qui signifie qu'il peut analyser des entrées d'images ainsi que du texte. Cette itération est le modèle GPT le plus avancé, présentant des performances de niveau humain à travers une variété de critères dans les domaines professionnel et académique. À titre de comparaison, GPT-3.5 s'est classé dans les 10 pour cent inférieurs des candidats dans un examen du barreau simulé, tandis que GPT-4 s'est classé dans les 10 pour cent supérieurs.
Les itérations plus récentes du modèle GPT-4 incluent GPT-4 Turbo, GPT-4o mini et GPT-4o.
Le Generative Pre-trained Transformer 55X (GPT55X) d'Amazon est un modèle de langage basé sur l'architecture GPT d'OpenAI et amélioré par les chercheurs d'Amazon. Quelques aspects clés du GPT-55X comprennent sa vaste quantité de données d'entraînement, sa capacité à dériver des dépendances contextuelles et des relations sémantiques, et sa nature autorégressive (utilisant des données passées pour informer les données futures).
Plongeons plus profondément dans le fonctionnement des transformateurs génératifs pré-entraînés :
Les GPT sont un type de modèle de réseau de neurones. Pour rappel, les réseaux de neurones sont des algorithmes d'IA qui enseignent aux ordinateurs à traiter l'information comme le ferait un cerveau humain. Le pré-entraînement consiste à entraîner un réseau de neurones sur un grand ensemble de données, comme du texte provenant d'Internet. Durant cette phase, le modèle apprend à prédire le mot suivant dans une phrase et acquiert une compréhension de la grammaire et du contexte.
Les transformateurs sont basés sur des mécanismes d'attention, une technique d'apprentissage profond qui simule l'attention humaine en classant et en priorisant les informations d'entrée par importance. Tant dans nos cerveaux que dans les modèles d'apprentissage automatique, les mécanismes d'attention nous aident à filtrer les informations non pertinentes qui peuvent nous distraire de la tâche à accomplir. Ils augmentent l'efficacité du modèle en recueillant le contexte et la pertinence des relations entre les éléments des données.
GPT commence à saisir le sens des mots en fonction de leur contexte. Les intégrations contextuelles pour un mot particulier génèrent des représentations dynamiques qui changent en fonction des mots environnants dans une phrase.
Après le pré-entraînement, GPT s'affine pour des tâches spécifiques comme rédiger un essai ou répondre à des questions et devient plus habile à ces tâches.
Pour une pratique pratique de l'utilisation de ChatGPT, commencez par le cours d'une heure Use Generative AI as Your Thought Partner enseigné par le PDG de Coursera, Jeff Maggioncalda.
Malgré la complexité des modèles de langage, leurs interfaces sont relativement simples. Si vous avez déjà utilisé ChatGPT, vous trouverez l'interaction texte-entrée, texte-sortie intuitive et facile à utiliser. En fait, vous pouvez jouer avec GPT-4 via tant que vous avez un compte OpenAI. Pour entraîner votre propre modèle ou expérimenter avec l'interface de programmation d'application (API) GPT-4, vous aurez besoin d'un compte développeur OpenAI (inscrivez-vous ici). Après vous être inscrit et connecté, vous aurez accès au Playground, un bac à sable basé sur le web que vous pouvez utiliser pour expérimenter avec l'API.
Si vous avez un abonnement à Chat-GPT Plus, vous pouvez accéder à GPT-4o via . Notez qu'il y a une limite d'utilisation qui dépend de la demande et des performances du système.
GPT-2 est moins convivial que ses successeurs et nécessite une quantité considérable de puissance de traitement. Cependant, il est open-source et peut être utilisé en conjonction avec des ressources et des outils gratuits tels que Google Colab. Pour accéder au modèle GPT-2, commencez par ce dépôt GitHub. Vous y trouverez un ensemble de données, des notes de publication, des informations sur les inconvénients à surveiller et des sujets d'expérimentation auxquels Open-AI s'intéresse.
Approfondissez les cas d'utilisation, les avantages et les risques liés à l'utilisation du modèle GPT en vous inscrivant au cours en ligne de niveau intermédiaire, Generative Pre-trained Transformers (GPT). Ou apprenez à exploiter la puissance de l'IA pour révolutionner votre productivité dans l'écosystème Microsoft grâce à la Microsoft Copilot : Your Everyday AI Companion Specialization.
Équipe éditoriale
L’équipe éditoriale de Coursera est composée de rédacteurs, de rédacteurs et de vérificateurs de fai...
Ce contenu a été mis à disposition à des fins d'information uniquement. Il est conseillé aux étudiants d'effectuer des recherches supplémentaires afin de s'assurer que les cours et autres qualifications suivis correspondent à leurs objectifs personnels, professionnels et financiers.