Présentation de l'IA générative

Ce guide du débutant présente les technologies principales de l'IA générative et explique comment elles s'intègrent pour alimenter les chatbots et les applications. L'IA générative (également appelée genAI ou gen AI) est un domaine du machine learning (ML) qui développe et utilise des modèles de ML pour générer du contenu.

Les modèles d'IA générative sont souvent appelés "grands modèles de langage" (LLM, large language model) en raison de leur grande taille et de leur capacité à comprendre et à générer un langage naturel. Toutefois, en fonction des données sur lesquelles les modèles sont entraînés, ils peuvent comprendre et générer du contenu à partir de plusieurs modalités, y compris du texte, des images, des vidéos et des contenus audio. Les modèles qui fonctionnent avec plusieurs modalités de données sont appelés modèles multimodaux.

Génération de contenu

Pour que les modèles d'IA générative puissent générer du contenu utile dans des applications réelles, ils doivent disposer des fonctionnalités suivantes :

Découvrez comment effectuer de nouvelles tâches :

Les modèles d'IA générative sont conçus pour effectuer des tâches générales. Si vous souhaitez qu'un modèle effectue des tâches propres à votre cas d'utilisation, vous devez pouvoir le personnaliser. Sur Vertex AI, vous pouvez personnaliser votre modèle grâce au réglage du modèle.
Accès à des informations externes :

Les modèles d'IA générative sont entraînés sur de vastes quantités de données. Toutefois, pour être utiles, ces modèles doivent pouvoir accéder à des informations en dehors de leurs données d'entraînement. Par exemple, si vous souhaitez créer un chatbot de service client alimenté par un modèle d'IA générative, celui-ci doit avoir accès aux informations sur les produits et services que vous proposez. Dans Vertex AI, vous utilisez les fonctionnalités d'ancrage et d'appel de fonction pour aider le modèle à accéder à des informations externes.
Bloquer le contenu dangereux :

Les modèles d'IA générative peuvent générer des résultats inattendus, y compris du texte offensant ou insensible. Pour assurer la sécurité et éviter tout usage abusif, les modèles ont besoin de filtres de sécurité pour bloquer les invites et les réponses qui sont considérées comme potentiellement dangereuses. Vertex AI dispose de fonctionnalités de sécurité intégrées qui favorisent l'utilisation responsable de nos services d'IA générative.

Le schéma suivant montre comment ces différentes fonctionnalités interagissent pour générer le contenu souhaité :

Schéma du workflow d'IA générative

Requête

Le workflow de l'IA générative commence généralement par une requête. Une requête est une instruction en langage naturel envoyée à un modèle d'IA générative pour obtenir une réponse. Selon le modèle, une requête peut contenir du texte, des images, des vidéos, de l'audio, des documents et d'autres modalités, voire même des modalités multiples (requête multimodale).

Le fait d'écrire une requête pour obtenir la réponse souhaitée du modèle est une pratique appelée conception de requête. Bien que la conception d'une requête soit un processus expérimental, vous pouvez utiliser des principes et des stratégies de conception de requêtes pour inciter le modèle à se comporter de la manière souhaitée. Vertex AI Studio propose un outil de gestion des requêtes pour vous aider à gérer vos requêtes.

Modèles de fondation

Les requêtes sont envoyées à un modèle d'IA générative afin de générer des réponses. Vertex AI dispose de divers modèles de fondation d'IA générative accessibles via une API, dont les suivants :

API Gemini : raisonnement avancé, chat multitour, génération de code et requêtes multimodales.
API Imagen : génération d'images, modification d'images et description d'images.
MedLM : système de questions-réponses et de synthèse médicales. (DG privée)

La taille, la modalité et les coûts des modèles sont différents. Vous pouvez explorer les modèles Google, ainsi que des modèles Open Source et des modèles de partenaires Google, dans Model Garden.

Personnaliser le modèle

Vous pouvez personnaliser le comportement par défaut des modèles de fondation de Google afin qu'ils génèrent les résultats souhaités de manière cohérente, sans utiliser de requêtes complexes. Ce processus de personnalisation est appelé réglage du modèle. Les réglages de modèles vous aident à réduire le coût et la latence de vos requêtes en vous permettant de simplifier vos requêtes.

Vertex AI propose également des outils d'évaluation de modèle pour vous aider à évaluer les performances de votre modèle réglé. Une fois que votre modèle réglé est prêt pour la production, vous pouvez le déployer sur un point de terminaison et surveiller les performances, comme dans les workflows MLOps standards.

Accéder à des informations externes

Vertex AI propose plusieurs façons de donner au modèle accès à des API externes et à des informations en temps réel.

Ancrage : connecte les réponses du modèle à une source fiable, telle que vos propres données ou une recherche sur le Web, ce qui permet de réduire les hallucinations.
RAG connecte les modèles à des sources de connaissances externes, telles que des documents et des bases de données, afin de générer des réponses plus précises et informatives.
Appel de fonction : permet au modèle d'interagir avec des API externes pour obtenir des informations en temps réel et effectuer des tâches réelles.

Vérification des citations

Une fois la réponse générée, Vertex AI vérifie si les citations doivent être incluses dans la réponse. Si une grande partie du texte de la réponse provient d'une source particulière, cette source est ajoutée aux métadonnées de citation de la réponse.

IA responsable et sécurité

La dernière couche de vérification que la requête et la réponse passent avant d'être renvoyée concernent les filtres de sécurité. Vertex AI vérifie à la fois la requête et la réponse indiquant dans quelle mesure la requête ou la réponse appartient à une catégorie de sécurité. Si le seuil est dépassé pour une ou plusieurs catégories, la réponse est bloquée et Vertex AI renvoie une réponse de remplacement.

Réponse

Si la requête et la réponse réussissent les contrôles de filtre de sécurité, la réponse est renvoyée. En règle générale, la réponse est renvoyée simultanément. Cependant, avec Vertex AI, vous pouvez également recevoir des réponses progressivement au fur et à mesure de leur génération en activant le streaming.

Expériences de la console Vertex AI Studio

Lorsque vous utilisez Vertex AI Studio avec l'essai gratuit ou sans vous connecter à Google Cloud, certaines fonctionnalités ne sont pas disponibles. Pour tester Vertex AI Studio, acceptez les conditions d'utilisation de Vertex AI Studio dans la console Google Cloud.

	Utiliser sans compte Google Cloud	Utiliser avec un compte d'essai gratuit Google Cloud	Utiliser avec un compte Google Cloud existant
Connexion obligatoire	Non	Oui	Oui
Requêtes par minute (RPM)	2 RPM pour tous les modèles multimodaux	Consulter les limites de quota	Consulter les limites de quota
Crédits offerts	0 $	Jusqu'à 300 $ pendant 90 jours	0 $
Galerie de requêtes	Non	Oui	Oui
Outil de conception de requêtes	Oui	Oui	Oui
Enregistrer les invites	Non	Oui	Oui
Historique des invites	Non	Oui	Oui
Paramètres avancés	Non	Non	Oui
Réglage	Non	Non	Oui
Utilisation de l'API	Non	Oui	Oui
Facturation obligatoire	Non	Non	Oui
Premiers pas	Accéder à Vertex AI Studio	S'inscrire à un essai gratuit	Essayer Vertex AI Studio dans votre console

Faites vos premiers pas avec l'IA générative sur Vertex AI.

Suivez un tutoriel de démarrage rapide sur Vertex AI Studio ou sur l'API Vertex AI.
Découvrez les modèles pré-entraînés dans Model Garden.
Explorez la documentation de référence du SDK de l'API Vertex AI Gemini pour Python, Node.js, Java, Go ouC#.
Découvrez les bonnes pratiques d'IA responsable et les filtres de sécurité de Vertex AI.
En savoir plus sur les tarifs.
Découvrez comment appeler Gemini à l'aide de la bibliothèque OpenAI.