Cette page fournit des informations concernant les anciens modèles d'IA générative sur Vertex AI. Les modèles d'une famille d'anciens modèles ne sont plus mis à jour avec les nouvelles versions stables. Une fois que toutes les versions stables d'un ancien modèle ont atteint leur date d'abandon, la famille de modèles n'est plus prise en charge.
Modèles de l'API PaLM
Le tableau suivant récapitule les anciens modèles de l'API PaLM :
Nom du modèle | Description | Propriétés du modèle | Prise en charge du réglage |
---|---|---|---|
PaLM 2 pour le texte ( text-bison ) |
Conçu pour suivre des instructions en langage naturel, il est adapté à diverses tâches linguistiques, telles que la classification, la synthèse et l'extraction. | Nombre maximal de jetons d'entrée : 8 192 Nombre maximal de jetons de sortie : 1 024 Données d'entraînement : jusqu'à février 2023 |
Supervisé : Oui RLHF : Oui (Preview) Distillation : Non |
PaLM 2 pour le texte (text-unicorn ) |
Modèle de texte le plus avancé de la famille de modèles PaLM à utiliser avec des tâches complexes de langage naturel. | Nombre maximal de jetons d'entrée : 8 192 Nombre maximal de jetons de sortie : 1 024 Données d'entraînement : jusqu'à février 2023 |
Supervisé : Non RLHF : Non Distillation : Oui (preview) |
PaLM 2 pour le texte 32k ( text-bison-32k ) |
Optimisé pour suivre les instructions en langage naturel et adapté à diverses tâches linguistiques. | Nombre maximal de jetons (entrée + sortie) : 32 768 Nombre maximal de jetons de sortie : 8 192 Données d'entraînement : jusqu'à août 2023 |
Supervisé : Oui RLHF : Oui Distillation : Non |
PaLM 2 pour le chat ( chat-bison ) |
Optimisé pour les cas d'utilisation de conversation multitours. | Nombre maximal de jetons d'entrée : 8 192 Nombre maximal de jetons de sortie : 2 048 Données d'entraînement : jusqu'à février 2023 Nombre maximal de tours : 2 500 |
Supervisé : Oui RLHF : Oui Distillation : Non |
PaLM 2 pour le chat 32k ( chat-bison-32k ) |
Optimisé pour les cas d'utilisation de conversation multitours. | Nombre maximal de jetons (entrée + sortie) : 32 768 Nombre maximal de jetons de sortie : 8 192 Données d'entraînement : jusqu'à août 2023 Nombre maximal de tours : 2 500 |
Supervisé : Oui RLHF : Oui Distillation : Non |
Modèles des API Codey
Le tableau suivant récapitule les anciens modèles d'API Codey. Notez que le modèle de complétion de code code-gecko
n'est pas un ancien modèle.
Nom du modèle | Description | Propriétés du modèle | Prise en charge du réglage |
---|---|---|---|
Codey pour la génération de code ( code-bison ) |
Modèle optimisé pour générer du code en fonction d'une description en langage naturel du code souhaité. Par exemple, il peut générer un test unitaire pour une fonction. | Nombre maximal de jetons d'entrée : 6 144 Nombre maximal de jetons de sortie : 1 024 |
Supervisé : Oui RLHF : Oui Distillation : Non |
Codey pour la génération de code 32k ( code-bison-32k ) |
Modèle optimisé pour générer du code en fonction d'une description en langage naturel du code souhaité. Par exemple, il peut générer un test unitaire pour une fonction. | Nombre maximal de jetons (entrée + sortie) : 32 768 Nombre maximal de jetons de sortie : 8 192 |
Supervisé : Oui RLHF : Oui Distillation : Non |
Codey pour le chat de code ( codechat-bison ) |
Modèle optimisé pour les conversations de chatbot qui répondent aux questions sur le code. | Nombre maximal de jetons d'entrée : 6 144 Nombre maximal de jetons de sortie : 1 024 |
Supervisé : Oui RLHF : Oui Distillation : Non |
Codey pour le chat de code 32k ( codechat-bison-32k ) |
Modèle optimisé pour les conversations de chatbot qui répondent aux questions sur le code. | Nombre maximal de jetons (entrée + sortie) : 32 768 Nombre maximal de jetons de sortie : 8 192 |
Supervisé : Oui RLHF : Oui Distillation : Non |
Langues acceptées
Les anciens modèles des API Vertex AI PaLM et Codey sont compatibles avec les langues suivantes :
- Arabe (
ar
) - Bengalî (
bn
) - Bulgare (
bg
) - Chinois simplifié et traditionnel (
zh
) - Croate (
hr
) - République tchèque (
cs
) - Danois (
da
) - Néerlandais (
nl
) - Anglais (
en
) - Estonien (
et
) - Finnois (
fi
) - Français (
fr
) - Allemand (
de
) - Grec (
el
) - Hébreu (
iw
) - Hindi (
hi
) - Hongrois (
hu
) - Indonésien (
id
) - Italien (
it
) - Japonais (
ja
) - Coréen (
ko
) - Letton (
lv
) - Lituanien (
lt
) - Norvégien (
no
) - Polonais (
pl
) - Portugais (
pt
) - Roumain (
ro
) - Russe (
ru
) - Serbe (
sr
) - Slovaque (
sk
) - Slovène (
sl
) - Espagnol (
es
) - Swahili (
sw
) - Suédois (
sv
) - Thaï (
th
) - Turc (
tr
) - Ukrainien (
uk
) - Vietnamien (
vi
)
Date d'arrêt des anciens modèles
Le tableau suivant indique la date d'arrêt des anciens modèles :
modèle chat-bison | Date de disponibilité | Date d'arrêt |
---|---|---|
chat-bison@002 | 6 décembre 2023 | 9 octobre 2024 |
modèle chat-bison-32k | Date de disponibilité | Date d'arrêt |
---|---|---|
chat-bison-32k@002 | 4 décembre 2023 | 9 octobre 2024 |
modèle code-bison | Date de disponibilité | Date d'arrêt |
---|---|---|
code-bison@002 | 6 décembre 2023 | 9 octobre 2024 |
modèle code-bison-32k | Date de disponibilité | Date d'arrêt |
---|---|---|
code-bison-32k@002 | 4 décembre 2023 | 9 octobre 2024 |
modèle codechat-bison | Date de disponibilité | Date d'arrêt |
---|---|---|
codechat-bison@002 | 6 décembre 2023 | 9 octobre 2024 |
modèle codechat-bison-32k | Date de disponibilité | Date d'arrêt |
---|---|---|
codechat-bison-32k@002 | 4 décembre 2023 | 9 octobre 2024 |
modèle text-bison | Date de disponibilité | Date d'arrêt |
---|---|---|
text-bison@002 | 6 décembre 2023 | 9 octobre 2024 |
modèle text-bison-32k | Date de disponibilité | Date d'arrêt |
---|---|---|
text-bison-32k@002 | 4 décembre 2023 | 9 octobre 2024 |
modèle text-unicorn | Date de disponibilité | Date d'arrêt |
---|---|---|
text-unicorn@001 | 30 novembre 2023 | Au plus tôt le 30 novembre 2024 |
Anciens modèles compatibles avec le débit provisionné
Ce tableau présente les anciens modèles compatibles avec le débit provisionné, qui est mesuré en caractères par seconde, incréments d'achats minimaux et taux d'utilisation.
Modèle | Débit par GSU | Incrément d'achat GSU minimal | Taux d'utilisation |
---|---|---|---|
text-bison , chat-bison , code-bison , codechat-bison |
4 000 | 5 | 1 caractère d'entrée = 1 caractère 1 caractère de sortie = 2 caractères |
text-unicorn |
400 | 5 | 1 caractère d'entrée = 1 caractère 1 caractère de sortie = 3 caractères |