Documentation de référence de l'API du modèle pour l'IA générative

Generative AI sur Vertex AI (également appelé genai) vous donne accès aux grands modèles d'IA générative de Google dans Vertex AI.

Documentation de référence sur les modèles de fondation de l'IA générative

Nom du modèle Description Peut diffuser des réponses
API Gemini (gemini-1.5-pro, gemini-1.0-pro et gemini-1.0-pro-vision)

Gemini est une famille de modèles d'IA générative développés par Google DeepMind et conçus pour les cas d'utilisation multimodaux. L'API Gemini vous donne accès aux modèles Gemini Pro Vision et Gemini Pro.

PaLM 2 pour le texte (text-bison)

Optimisé pour suivre les instructions en langage naturel et adapté à diverses tâches linguistiques.

Représentations vectorielles continues pour le texte (textembedding-gecko)

Renvoie les représentations vectorielles continues de modèle pour les entrées de texte.

PaLM 2 pour le chat (chat-bison)

Optimisé pour les cas d'utilisation de conversation multitours.

Codey pour la génération de code (code-bison)

Modèle optimisé pour générer du code en fonction d'une description en langage naturel du code souhaité. Par exemple, il peut générer un test unitaire pour une fonction.

Codey pour le chat de code (codechat-bison)

Modèle optimisé pour les conversations de chatbot qui répondent aux questions sur le code.

Codey pour la complétion de code (code-gecko)

Un modèle affiné pour suggérer la complétion de code en fonction du contexte du code écrit.

Imagen pour la génération d'images (imagegeneration)

Ce modèle est compatible avec la génération d'images et peut créer des éléments visuels de haute qualité en quelques secondes.

Représentations vectorielles continues multimodales (multimodalembedding)

Ce modèle génère des vecteurs en fonction de l'entrée que vous fournissez, qui peut inclure une combinaison d'images et de texte.

Sous-titrage d'images (imagetext)

Ce modèle est compatible avec le sous-titrage d'images et peut générer des sous-titres à partir d'une image fournie dans la langue spécifiée.

Visual Question Answering, VQA (imagetext)

Modèle compatible avec les questions et les réponses d'images.

Réponse en streaming des modèles d'IA générative

Les paramètres sont identiques pour les requêtes en streaming et sans streaming vers les API.

Pour afficher des exemples de requêtes et de réponses de code à l'aide de l'API REST, consultez la page Exemples d'utilisation de l'API REST en streaming.

Pour afficher des exemples de requêtes et de réponses de code à l'aide du SDK Vertex AI pour Python, consultez la page Exemples d'utilisation du SDK Vertex AI pour Python pour le streaming.

Régions disponibles

Pour obtenir la liste des régions dans lesquelles les modèles de fondation sont compatibles avec l'IA générative sur Vertex AI, consultez la page Régions.

Référence sur l'IA responsable

Pour en savoir plus sur les attributs spécifiques à la sécurité et afficher des exemples de réponses, consultez la page Filtres et attributs de sécurité. Tout au long de ces références, il existe un paramètre citation. Pour en savoir plus sur les citations, consultez la page Métadonnées des citations.

Étapes suivantes