Informations sur les anciens modèles

Cette page fournit des informations concernant les anciens modèles d'IA générative sur Vertex AI. Les modèles d'une famille d'anciens modèles ne sont plus mis à jour avec les nouvelles versions stables. Une fois que toutes les versions stables d'un ancien modèle ont atteint leur date d'abandon, la famille de modèles n'est plus prise en charge.

Modèles de l'API PaLM

Le tableau suivant récapitule les anciens modèles de l'API PaLM :

Nom du modèle Description Propriétés du modèle Prise en charge du réglage
PaLM 2 pour le texte
(text-bison)
Conçu pour suivre des instructions en langage naturel, il est adapté à diverses tâches linguistiques, telles que la classification, la synthèse et l'extraction. Nombre maximal de jetons d'entrée : 8 192
Nombre maximal de jetons de sortie : 1 024
Données d'entraînement : jusqu'à février 2023
Supervisé : Oui
RLHF : Oui (Preview)
Distillation : Non
PaLM 2 pour le texte (text-unicorn) Modèle de texte le plus avancé de la famille de modèles PaLM à utiliser avec des tâches complexes de langage naturel. Nombre maximal de jetons d'entrée : 8 192
Nombre maximal de jetons de sortie : 1 024
Données d'entraînement : jusqu'à février 2023
Supervisé : Non
RLHF : Non
Distillation : Oui (preview)
PaLM 2 pour le texte 32k
(text-bison-32k)
Optimisé pour suivre les instructions en langage naturel et adapté à diverses tâches linguistiques. Nombre maximal de jetons (entrée + sortie) : 32 768
Nombre maximal de jetons de sortie : 8 192
Données d'entraînement : jusqu'à août 2023
Supervisé : Oui
RLHF : Oui
Distillation : Non
PaLM 2 pour le chat
(chat-bison)
Optimisé pour les cas d'utilisation de conversation multitours. Nombre maximal de jetons d'entrée : 8 192
Nombre maximal de jetons de sortie : 2 048
Données d'entraînement : jusqu'à février 2023
Nombre maximal de tours : 2 500
Supervisé : Oui
RLHF : Oui
Distillation : Non
PaLM 2 pour le chat 32k
(chat-bison-32k)
Optimisé pour les cas d'utilisation de conversation multitours. Nombre maximal de jetons (entrée + sortie) : 32 768
Nombre maximal de jetons de sortie : 8 192
Données d'entraînement : jusqu'à août 2023
Nombre maximal de tours : 2 500
Supervisé : Oui
RLHF : Oui
Distillation : Non

Modèles des API Codey

Le tableau suivant récapitule les anciens modèles d'API Codey. Notez que le modèle de complétion de code code-gecko n'est pas un ancien modèle.

Nom du modèle Description Propriétés du modèle Prise en charge du réglage
Codey pour la génération de code
(code-bison)
Modèle optimisé pour générer du code en fonction d'une description en langage naturel du code souhaité. Par exemple, il peut générer un test unitaire pour une fonction. Nombre maximal de jetons d'entrée : 6 144
Nombre maximal de jetons de sortie : 1 024
Supervisé : Oui
RLHF : Oui
Distillation : Non
Codey pour la génération de code 32k
(code-bison-32k)
Modèle optimisé pour générer du code en fonction d'une description en langage naturel du code souhaité. Par exemple, il peut générer un test unitaire pour une fonction. Nombre maximal de jetons (entrée + sortie) : 32 768
Nombre maximal de jetons de sortie : 8 192
Supervisé : Oui
RLHF : Oui
Distillation : Non
Codey pour le chat de code
(codechat-bison)
Modèle optimisé pour les conversations de chatbot qui répondent aux questions sur le code. Nombre maximal de jetons d'entrée : 6 144
Nombre maximal de jetons de sortie : 1 024
Supervisé : Oui
RLHF : Oui
Distillation : Non
Codey pour le chat de code 32k
(codechat-bison-32k)
Modèle optimisé pour les conversations de chatbot qui répondent aux questions sur le code. Nombre maximal de jetons (entrée + sortie) : 32 768
Nombre maximal de jetons de sortie : 8 192
Supervisé : Oui
RLHF : Oui
Distillation : Non

Langues acceptées

Les anciens modèles des API Vertex AI PaLM et Codey sont compatibles avec les langues suivantes :

  • Arabe (ar)
  • Bengalî (bn)
  • Bulgare (bg)
  • Chinois simplifié et traditionnel (zh)
  • Croate (hr)
  • République tchèque (cs)
  • Danois (da)
  • Néerlandais (nl)
  • Anglais (en)
  • Estonien (et)
  • Finnois (fi)
  • Français (fr)
  • Allemand (de)
  • Grec (el)
  • Hébreu (iw)
  • Hindi (hi)
  • Hongrois (hu)
  • Indonésien (id)
  • Italien (it)
  • Japonais (ja)
  • Coréen (ko)
  • Letton (lv)
  • Lituanien (lt)
  • Norvégien (no)
  • Polonais (pl)
  • Portugais (pt)
  • Roumain (ro)
  • Russe (ru)
  • Serbe (sr)
  • Slovaque (sk)
  • Slovène (sl)
  • Espagnol (es)
  • Swahili (sw)
  • Suédois (sv)
  • Thaï (th)
  • Turc (tr)
  • Ukrainien (uk)
  • Vietnamien (vi)

Date d'arrêt des anciens modèles

Le tableau suivant indique la date d'arrêt des anciens modèles :

modèle chat-bison Date de disponibilité Date d'arrêt
chat-bison@002 6 décembre 2023 9 octobre 2024
modèle chat-bison-32k Date de disponibilité Date d'arrêt
chat-bison-32k@002 4 décembre 2023 9 octobre 2024
modèle code-bison Date de disponibilité Date d'arrêt
code-bison@002 6 décembre 2023 9 octobre 2024
modèle code-bison-32k Date de disponibilité Date d'arrêt
code-bison-32k@002 4 décembre 2023 9 octobre 2024
modèle codechat-bison Date de disponibilité Date d'arrêt
codechat-bison@002 6 décembre 2023 9 octobre 2024
modèle codechat-bison-32k Date de disponibilité Date d'arrêt
codechat-bison-32k@002 4 décembre 2023 9 octobre 2024
modèle text-bison Date de disponibilité Date d'arrêt
text-bison@002 6 décembre 2023 9 octobre 2024
modèle text-bison-32k Date de disponibilité Date d'arrêt
text-bison-32k@002 4 décembre 2023 9 octobre 2024
modèle text-unicorn Date de disponibilité Date d'arrêt
text-unicorn@001 30 novembre 2023 Au plus tôt le 30 novembre 2024

Anciens modèles compatibles avec le débit provisionné

Ce tableau présente les anciens modèles compatibles avec le débit provisionné, qui est mesuré en caractères par seconde, incréments d'achats minimaux et taux d'utilisation.

Modèle Débit par GSU Incrément d'achat GSU minimal Taux d'utilisation
text-bison, chat-bison, code-bison, codechat-bison 4 000 5 1 caractère d'entrée = 1 caractère
1 caractère de sortie = 2 caractères
text-unicorn 400 5 1 caractère d'entrée = 1 caractère
1 caractère de sortie = 3 caractères