Versions et cycle de vie des modèles de génération de réponses

Vertex AI Search propose plusieurs versions de modèle que vous pouvez choisir lorsque vous générez des réponses. Vous pouvez choisir les versions du modèle lorsque vous utilisez la fonction de recherche résumés et réponses et suivis.

Modèles disponibles

Vertex AI Search utilise deux types de modèles pour les questions et les réponses cas d'utilisation:

  • Les modèles LLM Vertex AI qui ont été testés sur des questions répondre aux tâches
  • Modèles Vertex AI Search basés sur le LLM Vertex AI modèles de ML et entraînés pour traiter les tâches de question et de réponse

Les modèles Vertex AI Search partagent la même date d'abandon que leurs modèles LLM de Vertex AI de base. Le modèle LLM de base est disponible pendant six mois après la date de sortie de la version suivante du modèle, conformément à la politique de cycle de vie des modèles Vertex AI. Prévoyez suffisamment de temps pour migrer vers les nouveaux modèles avant les dates d'arrêt.

Le tableau suivant présente les spécifications des versions de modèle. Lorsque vous définissez un modèle , l'API utilise le modèle spécifié pour générer des réponses.

Version de modèle Générique Santé
Description Fenêtre de contexte Date d'arrêt Description Fenêtre de contexte Date d'arrêt
stable

Il s'agit du choix par défaut du modèle si la version du modèle n'est pas définie.

La spécification du modèle stable renvoie vers gemini-1.5-flash-001/answer_gen/v1

Le modèle désigné comme stable change régulièrement à mesure que de nouveaux modèles et versions deviennent disponibles.

128 k N/A

Modèle par défaut sélectionné si la version du modèle n'est pas définie.

La spécification du modèle stable renvoie vers gemini-1.5-flash-001/answer_gen/v1

Le modèle désigné comme stable change régulièrement à mesure que de nouveaux modèles et versions deviennent disponibles.

128 k N/A
gemini-1.0-pro-001/answer_gen/v1

Pointe vers le modèle gemini-1.0-pro-001.

Le modèle est figé après le lancement.

32 K 15 février 2024 Non disponible
gemini-1.0-pro-002/answer_gen/v1

Vertex AI Search basé sur la gemini-1.0-pro-002 avec un entraînement supplémentaire pour traiter les tâches liées aux questions et aux réponses.

Le modèle est figé après sa publication.

32 k 9 avril 2025

Modèle Vertex AI Search basé sur gemini-1.0-pro-002 model avec un entraînement supplémentaire pour répondre aux tâches de questions/réponses.

Le modèle est figé après le lancement.

32 k 9 avril 2025
gemini-1.5-flash-001/answer_gen/v1

Un modèle Vertex AI Search basé sur le modèle gemini-1.5-flash-001 avec des réglages supplémentaires pour traiter les tâches liées aux questions et aux réponses

Le modèle est figé après le lancement.

128 k 24 mai 2025

Un modèle Vertex AI Search basé sur le modèle gemini-1.5-flash-001 avec des réglages supplémentaires pour traiter les tâches liées aux questions et aux réponses

Le modèle est figé après le lancement.

128 k 24 mai 2025
gemini-1.5-flash-001/answer_gen/v2

Modèle Vertex AI Search basé sur le modèle gemini-1.5-flash-001 avec un réglage supplémentaire (version 2) sur des données mixtes (structurées et non structurées) pour traiter les tâches liées aux questions et aux réponses.

Le modèle est figé après sa publication.

128 k 24 mai 2025 Non disponible
gemini-1.5-flash-002/answer_gen/v1

Modèle Vertex AI Search basé sur le modèle gemini-1.5-flash-002 avec un réglage supplémentaire pour répondre aux tâches de questions/réponses.

Le modèle est figé après sa publication.

128 k 24 septembre 2025 Non disponible
text-bison@002/answer_gen/v1

Modèle Vertex AI Search basé sur le modèle text-bison@002 avec un entraînement supplémentaire pour répondre aux questions.

Le modèle est figé après sa publication.

8K 9 octobre 2024 Non disponible
medlm-medium/answer_gen/v1 Non disponible Les modèles MedLM ont été entraînés sur des informations Web publiques à grande échelle, des ensembles de données publics et des ensembles de données privés sous licence anonymisés contenant des informations sur la santé et la médecine. 32 000 16 novembre 2024
preview

La spécification du modèle preview renvoie vers la dernière version de gemini-1.5-pro-002 du modèle. Le modèle d'aperçu est susceptible d'être modifié sans notification. Si vous utilisez ce modèle, vous constaterez peut-être des changements dans les réponses modifications du modèle. Si vous souhaitez plus de cohérence dans les réponses, sélectionnez un modèle spécifique.

128 k N/A medlm-medium/answer_gen/v1 32 000 N/A

Étape suivante