Présentation de Generative AI sur Vertex AI

Generative AI sur Vertex AI (également appelé genAI ou gen AI) vous donne accès aux grands modèles d'IA générative de Google afin que vous puissiez les tester, les régler et les déployer pour les utiliser dans vos applications optimisées par l'IA. Cette page présente le workflow d'IA générative sur Vertex AI, les fonctionnalités et les modèles disponibles, et vous redirige vers des ressources pour vous lancer.

Workflow d'IA générative

Le diagramme suivant présente une vue d'ensemble du workflow d'IA générative.

Schéma du workflow d'IA générative

Requête

Requête

Le workflow d'IA générative commence généralement par une invite. Une invite est une requête en langage naturel envoyée à un modèle de langage pour déclencher une réponse. Écrire une invite pour obtenir la réponse souhaitée du modèle est une pratique appelée conception de l'invite. Bien que la conception d'une invite soit un processus expérimental, vous pouvez utiliser des principes et des stratégies de conception d'invites pour inciter le modèle à se comporter de la manière souhaitée.

Modèles de fondation

Modèles de fondation

Les invites sont envoyées à un modèle pour la génération de réponses. Vertex AI dispose de divers modèles de fondation d'IA générative accessibles via une API, y compris les suivants :

  • API Gemini : raisonnement avancé, chat multitour, génération de code et invites multimodales.
  • API PaLM : tâches de langage naturel, représentations vectorielles continues de texte et chat multitour.
  • API Codey : génération de code, complétion de code et chat de code.
  • API Imagen : génération d'images, modification d'images et description d'images.
  • MedLM : système de questions-réponses et de synthèse médicales. (DG privée)

La taille, la modalité et les coûts des modèles sont différents. Vous pouvez explorer les modèles propriétaires de Google et les modèles OSS dans le jardin des modèles.

Personnaliser le modèle

Personnaliser le modèle

Vous pouvez personnaliser le comportement par défaut des modèles de base de Google afin qu'ils génèrent les résultats souhaités de manière cohérente, sans utiliser d'invites complexes. Ce processus de personnalisation est appelé réglage du modèle. Les réglages de modèles vous aident à réduire le coût et la latence de vos requêtes en vous permettant de simplifier vos invites.

Vertex AI propose également des outils d'évaluation de modèle pour vous aider à évaluer les performances de votre modèle réglé. Une fois que votre modèle réglé est prêt pour la production, vous pouvez le déployer sur un point de terminaison et surveiller les performances, comme dans les workflows MLOps standards.

Service d'ancrage Vertex AI

Surface de référence

Si vous souhaitez que les réponses du modèle soient basées sur une source fiable, telle que votre propre corpus de données, vous pouvez utiliser l'ancrage dans Vertex AI. L'ancrage permet de réduire les hallucinations des modèles, en particulier sur des sujets inconnus, et de leur donner accès à de nouvelles informations.

Vérification des citations

Vérification des citations

Une fois la réponse générée, Vertex AI vérifie si les citations doivent être incluses dans la réponse. Si une grande partie du texte de la réponse provient d'une source particulière, cette source est ajoutée aux métadonnées de citation de la réponse.

IA responsable et sécurité

IA responsable et sécurité

La dernière couche de vérification que l'invite et la réponse passent avant d'être renvoyée concernent les filtres de sécurité. Vertex AI vérifie à la fois l'invite et la réponse indiquant dans quelle mesure l'invite ou la réponse appartient à une catégorie de sécurité. Si le seuil est dépassé pour une ou plusieurs catégories, la réponse est bloquée et Vertex AI renvoie une réponse de remplacement.

Réponse

Réponse

Si l'invite et la réponse réussissent les contrôles de filtre de sécurité, la réponse est renvoyée. En règle générale, la réponse est renvoyée simultanément. Cependant, vous pouvez également recevoir des réponses progressivement au fur et à mesure de leur génération en activant le streaming.

API et modèles d'IA générative

Les modèles d'IA générative disponibles dans Vertex AI, également appelés modèles de fondation, sont classés par type de contenu qu'il est conçu pour générer. Ce contenu inclut les textes, le chat, les images, le code, les vidéos, les données multimodales et les représentations vectorielles continues. Chaque modèle est exposé via un point de terminaison d'éditeur spécifique à votre projet Google Cloud. Il est donc inutile de déployer le modèle de fondation, sauf si vous devez le régler pour un cas d'utilisation spécifique.

Offres de l'API Gemini

L'API Vertex AI Gemini contient les points de terminaison de l'éditeur pour les modèles Gemini développés par Google DeepMind.

  • Gemini 1.0 Pro est conçu pour gérer les tâches en langage naturel, le chat textuel et de code multitour, ainsi que la génération de code.
  • Gemini 1.0 Pro Vision accepte les requêtes multimode. Vous pouvez inclure du texte, des images et des vidéos dans vos requêtes d'invite et obtenir des réponses textuelles ou de code.

Offres de l'API PaLM

L'API Vertex AI PaLM contient les points de terminaison de l'éditeur pour les modèles PaLM 2 de Google (Pathways Language Model 2), qui sont de grands modèles de langage (LLM) qui génèrent du texte et du code en réponse aux invites en langage naturel.

  • L'API PaLM pour le texte est parfaitement adaptée à des tâches linguistiques telles que la classification, la synthèse et l'extraction d'entités.
  • L'API PaLM pour le chat est adaptée au chat multitour, où le modèle effectue le suivi des messages précédents dans le chat et l'utilise comme contexte pour générer de nouvelles réponses.

Autres offres d'IA générative

  • Les API Codey génèrent du code. Les API Codey incluent trois modèles qui génèrent du code, suggèrent du code pour la complétion de code et permettent aux développeurs de discuter pour obtenir de l'aide concernant les questions liées au code. Pour en savoir plus, consultez la présentation des modèles de code.

  • L'API Embedding pour le texte génère des représentations vectorielles continues pour le texte d'entrée. Vous pouvez utiliser des représentations vectorielles continues pour des tâches telles que la recherche sémantique, la recommandation, la classification et la détection d'anomalies.

  • Les représentations vectorielles continues multimodales génèrent des vecteurs de représentation vectorielle continue à partir d'images et de textes. Ces représentations vectorielles continues peuvent être utilisées ultérieurement pour d'autres tâches ultérieures, telles que la classification d'images ou les recommandations de contenu. Pour en savoir plus, consultez la page sur les représentations vectorielles continues multimodales.

  • Imagen, notre modèle de fondation de texte-vers-image, permet aux organisations de générer et de personnaliser des images de qualité studio à grande échelle pour répondre à tous les besoins de l'entreprise. Pour en savoir plus, consultez la présentation d'Imagen sur Vertex AI.

  • MedLM est une famille de modèles de fondation affinés pour le secteur de la santé. Pour en savoir plus, consultez la présentation des modèles MedLM.

Vertex AI Studio

Vertex AI Studio est un outil de la console Google Cloud qui permet de prototyper et de tester rapidement des modèles d'IA générative. Vous pouvez tester des exemples d'invites, concevoir vos propres invites et personnaliser les modèles de base pour gérer les tâches qui répondent aux besoins de votre application. Cette page présente les différentes tâches que vous pouvez effectuer dans Vertex AI Studio, y compris les suivantes :

  • tester des modèles à l'aide d'exemples de requêtes ;
  • concevoir et enregistrer vos propres requêtes ;
  • régler un modèle de fondation ;
  • Convertissez entre voix et texte.

Tester des modèles à l'aide d'exemples d'invites

La galerie d'invites, dans la section Langage de Vertex AI Studio, contient divers exemples d'invites préconçus pour illustrer les capacités du modèle. Les exemples d'invites sont classés par type de tâche, tels que la synthèse, la classification et l'extraction. Chaque invite est préconfigurée avec un modèle et une valeur de paramètre spécifiés. Il vous suffit donc d'ouvrir l'exemple d'invite et de cliquer sur Envoyer pour que le modèle génère une réponse.

prompt-ui

Concevoir et enregistrer vos propres invites

La conception d'invite est le processus de création manuelle d'invites qui déclenchent la réponse souhaitée d'un modèle de langage. En concevant soigneusement les invites, vous pouvez inciter le modèle à générer le résultat souhaité. La conception d'une invite peut être un moyen efficace de tester l'adaptation d'un modèle de langage à un cas d'utilisation spécifique.

Vous pouvez créer et enregistrer vos propres invites dans Vertex AI Studio. Lorsque vous créez une invite, vous saisissez le texte de l'invite, spécifiez le modèle à utiliser, configurez les valeurs des paramètres et testez l'invite en générant une réponse. Vous pouvez effectuer une itération sur l'invite et ses configurations jusqu'à obtenir les résultats souhaités. Lorsque vous avez terminé de concevoir l'invite, vous pouvez l'enregistrer dans Vertex AI Studio.

Citations de réponses

Si vous utilisez un modèle de texte dans Vertex AI Studio comme text-bison, vous recevez des réponses textuelles en fonction de votre entrée. Nos fonctionnalités sont destinées à produire du contenu d'origine et à ne pas répliquer du contenu existant dans son intégralité. Si Vertex AI Studio cite une page Web de manière exhaustive, la page est alors citée dans le résultat.

text-citation

Vous pouvez modifier la qualité des réponses en ajustant la température (caractère aléatoire de sortie) et en testant d'autres paramètres de réponse dans Vertex AI Studio.

Les citations sont disponibles dans Vertex AI Studio ainsi que dans l'API. Pour en savoir plus sur l'IA responsable et les citations, consultez la page Métadonnées de citation.

Découvrir des modèles d'IA générative dans Model Garden

Model Garden est une plate-forme qui vous permet de découvrir, de tester, de personnaliser et de déployer des modèles de Google, puis de sélectionner des modèles et des éléments OSS. Pour explorer les modèles d'IA générative et les API disponibles sur Vertex AI, accédez à Model Garden dans la console Google Cloud.

Accéder à la page "Jardin de modèles"

Pour en savoir plus sur Model Garden, y compris sur les modèles et fonctionnalités disponibles, consultez la page Explorer les modèles d'IA dans Model Garden.

Régler un modèle de fondation

Bien que la conception d'invites soit idéale pour les tests rapides, si des données d'entraînement sont disponibles, vous pouvez améliorer la qualité en ajustant le modèle. Le réglage d'un modèle vous permet de personnaliser la réponse du modèle en fonction d'exemples de la tâche que vous souhaitez que le modèle effectue.

Pour savoir comment ajuster un modèle de fondation, consultez la page Ajuster les modèles de fondation.

Convertissez entre voix et texte

L'outil de synthèse vocale de Vertex AI Studio vous permet de prendre un extrait de texte et de le convertir en fichier audio vocal que vous pouvez lire et télécharger. Vous pouvez choisir parmi plusieurs voix et ajuster la vitesse d'élocution.

À l'inverse, si vous avez un fichier audio de texte parlé, vous pouvez également l'importer dans Vertex AI Studio et le transcrire en texte.

Pour en savoir plus, consultez les ressources suivantes :

Essayer Vertex AI Studio

Vertex AI Studio se trouve sur la page "Vertex AI" de la console Google Cloud.

Accéder à Vertex AI Studio

Certifications et contrôles de sécurité

Vertex AI est compatible avec les CMEK, VPC Service Controls, la résidence des données et Access Transparency. Les fonctionnalités d'IA générative sont limitées. Pour plus d'informations, consultez la page Contrôles de sécurité de l'IA générative.

Premiers pas