Informations sur les anciens modèles

Cette page fournit des informations concernant les anciens modèles d'IA générative sur Vertex AI. Les modèles d'une famille d'anciens modèles ne sont plus mis à jour avec les nouvelles versions stables. Une fois que toutes les versions stables d'un ancien modèle ont atteint leur date d'abandon, la famille de modèles n'est plus prise en charge.

Modèles de l'API PaLM

Le tableau suivant récapitule les anciens modèles de l'API PaLM :

Nom du modèle	Description	Propriétés du modèle	Prise en charge du réglage
PaLM 2 pour le texte (`text-bison`)	Conçu pour suivre des instructions en langage naturel, il est adapté à diverses tâches linguistiques, telles que la classification, la synthèse et l'extraction.	Nombre maximal de jetons d'entrée : 8 192 Nombre maximal de jetons de sortie : 1 024 Données d'entraînement : jusqu'à février 2023	Supervisé : Oui RLHF : Oui (Preview) Distillation : Non
PaLM 2 pour le texte (`text-unicorn`)	Modèle de texte le plus avancé de la famille de modèles PaLM à utiliser avec des tâches complexes de langage naturel.	Nombre maximal de jetons d'entrée : 8 192 Nombre maximal de jetons de sortie : 1 024 Données d'entraînement : jusqu'à février 2023	Supervisé : Non RLHF : Non Distillation : Oui (preview)
PaLM 2 pour le texte 32k (`text-bison-32k`)	Optimisé pour suivre les instructions en langage naturel et adapté à diverses tâches linguistiques.	Nombre maximal de jetons (entrée + sortie) : 32 768 Nombre maximal de jetons de sortie : 8 192 Données d'entraînement : jusqu'à août 2023	Supervisé : Oui RLHF : Oui Distillation : Non
PaLM 2 pour le chat (`chat-bison`)	Optimisé pour les cas d'utilisation de conversation multitours.	Nombre maximal de jetons d'entrée : 8 192 Nombre maximal de jetons de sortie : 2 048 Données d'entraînement : jusqu'à février 2023 Nombre maximal de tours : 2 500	Supervisé : Oui RLHF : Oui Distillation : Non
PaLM 2 pour le chat 32k (`chat-bison-32k`)	Optimisé pour les cas d'utilisation de conversation multitours.	Nombre maximal de jetons (entrée + sortie) : 32 768 Nombre maximal de jetons de sortie : 8 192 Données d'entraînement : jusqu'à août 2023 Nombre maximal de tours : 2 500	Supervisé : Oui RLHF : Oui Distillation : Non

Modèles des API Codey

Le tableau suivant récapitule les anciens modèles d'API Codey. Notez que le modèle de complétion de code code-gecko n'est pas un ancien modèle.

Nom du modèle	Description	Propriétés du modèle	Prise en charge du réglage
Codey pour la génération de code (`code-bison`)	Modèle optimisé pour générer du code en fonction d'une description en langage naturel du code souhaité. Par exemple, il peut générer un test unitaire pour une fonction.	Nombre maximal de jetons d'entrée : 6 144 Nombre maximal de jetons de sortie : 1 024	Supervisé : Oui RLHF : Oui Distillation : Non
Codey pour la génération de code 32k (`code-bison-32k`)	Modèle optimisé pour générer du code en fonction d'une description en langage naturel du code souhaité. Par exemple, il peut générer un test unitaire pour une fonction.	Nombre maximal de jetons (entrée + sortie) : 32 768 Nombre maximal de jetons de sortie : 8 192	Supervisé : Oui RLHF : Oui Distillation : Non
Codey pour le chat de code (`codechat-bison`)	Modèle optimisé pour les conversations de chatbot qui répondent aux questions sur le code.	Nombre maximal de jetons d'entrée : 6 144 Nombre maximal de jetons de sortie : 1 024	Supervisé : Oui RLHF : Oui Distillation : Non
Codey pour le chat de code 32k (`codechat-bison-32k`)	Modèle optimisé pour les conversations de chatbot qui répondent aux questions sur le code.	Nombre maximal de jetons (entrée + sortie) : 32 768 Nombre maximal de jetons de sortie : 8 192	Supervisé : Oui RLHF : Oui Distillation : Non

Langues acceptées

Les anciens modèles des API Vertex AI PaLM et Codey sont compatibles avec les langues suivantes :

Arabe (ar)
Bengalî (bn)
Bulgare (bg)
Chinois simplifié et traditionnel (zh)
Croate (hr)
République tchèque (cs)
Danois (da)
Néerlandais (nl)
Anglais (en)
Estonien (et)
Finnois (fi)
Français (fr)
Allemand (de)
Grec (el)
Hébreu (iw)
Hindi (hi)
Hongrois (hu)
Indonésien (id)
Italien (it)
Japonais (ja)
Coréen (ko)
Letton (lv)
Lituanien (lt)
Norvégien (no)
Polonais (pl)
Portugais (pt)
Roumain (ro)
Russe (ru)
Serbe (sr)
Slovaque (sk)
Slovène (sl)
Espagnol (es)
Swahili (sw)
Suédois (sv)
Thaï (th)
Turc (tr)
Ukrainien (uk)
Vietnamien (vi)

Date d'arrêt des anciens modèles

Le tableau suivant indique la date d'arrêt des anciens modèles :

modèle chat-bison	Date de disponibilité	Date d'arrêt
chat-bison@002	6 décembre 2023	9 octobre 2024

modèle chat-bison-32k	Date de disponibilité	Date d'arrêt
chat-bison-32k@002	4 décembre 2023	9 octobre 2024

modèle code-bison	Date de disponibilité	Date d'arrêt
code-bison@002	6 décembre 2023	9 octobre 2024

modèle code-bison-32k	Date de disponibilité	Date d'arrêt
code-bison-32k@002	4 décembre 2023	9 octobre 2024

modèle codechat-bison	Date de disponibilité	Date d'arrêt
codechat-bison@002	6 décembre 2023	9 octobre 2024

modèle codechat-bison-32k	Date de disponibilité	Date d'arrêt
codechat-bison-32k@002	4 décembre 2023	9 octobre 2024

modèle text-bison	Date de disponibilité	Date d'arrêt
text-bison@002	6 décembre 2023	9 octobre 2024

modèle text-bison-32k	Date de disponibilité	Date d'arrêt
text-bison-32k@002	4 décembre 2023	9 octobre 2024

modèle text-unicorn	Date de disponibilité	Date d'arrêt
text-unicorn@001	30 novembre 2023	Au plus tôt le 30 novembre 2024

Anciens modèles compatibles avec le débit provisionné

Ce tableau présente les anciens modèles compatibles avec le débit provisionné, qui est mesuré en caractères par seconde, incréments d'achats minimaux et taux d'utilisation.

Modèle	Débit par GSU	Incrément d'achat GSU minimal	Taux d'utilisation
`text-bison`, `chat-bison`, `code-bison`, `codechat-bison`	4 000	5	1 caractère d'entrée = 1 caractère 1 caractère de sortie = 2 caractères
`text-unicorn`	400	5	1 caractère d'entrée = 1 caractère 1 caractère de sortie = 3 caractères