Información del modelo heredado

En esta página, se proporciona información sobre los modelos de IA generativa heredados en Vertex AI. Los modelos de una familia de modelos heredados ya no se actualizan con nuevas versiones estables. Después de todas las versiones estables de un modelo heredado alcancen las fechas de interrupción, la familia de modelos ya no será compatible.

Modelos de API de PaLM

En la siguiente tabla, se resumen los modelos heredados de la API de PaLM:

Nombre del modelo Descripción Propiedades del modelo Compatibilidad con los ajustes
PaLM 2 para texto
(text-bison)
Se ajustó para seguir las instrucciones de lenguaje natural y es adecuado para una variedad de tareas de lenguaje, como la clasificación, el resumen, y la extracción. Cantidad máxima de tokens de entrada: 8192
Cantidad máxima de tokens de salida: 1024
Datos de entrenamiento: hasta febrero de 2023
Supervisado:
RLHF: (Vista previa)
Destilación: No
PaLM 2 para texto (text-unicorn) El modelo de texto más avanzado de la familia de modelos PaLM para usar con tareas complejas de lenguaje natural. Cantidad máxima de tokens de entrada: 8192
Cantidad máxima de tokens de salida: 1024
Datos de entrenamiento: hasta febrero de 2023
Supervisado: No
RLHF: No
Destilación: (Vista previa)
PaLM 2 para texto 32k
(text-bison-32k)
Se ajustó para seguir las instrucciones de lenguaje natural y es adecuado para una variedad de tareas de lenguaje. Máximo de tokens (entrada + salida): 32,768
Máximo de tokens de salida: 8192
Datos de entrenamiento: hasta agosto de 2023
Supervisado:
RLHF: No
Destilación: No
PaLM 2 para chat
(chat-bison)
Ajustado para casos de uso de conversaciones de varios turnos. Máximo de tokens de entrada: 8192
Cantidad máxima de tokens de salida: 2048
Datos de entrenamiento: hasta febrero de 2023
turnos máximos: 2500
Supervisado:
RLHF: No
Destilación: No
PaLM 2 para chat 32k
(chat-bison-32k)
Ajustado para casos de uso de conversaciones de varios turnos. Máximo de tokens (entrada + salida): 32,768
Máximo de tokens de salida: 8192
Datos de entrenamiento: hasta agosto de 2023
Cantidad máxima de turnos: 2500
Supervisado:
RLHF: No
Destilación: No

Modelos de APIs de Codey

En la siguiente tabla, se resumen los modelos heredados de las APIs de Codey. Ten en cuenta que el modelo de finalización de código de code-gecko no es un modelo heredado.

Nombre del modelo Descripción Propiedades del modelo Compatibilidad con los ajustes
Codey para la generación de código
(code-bison)
Un modelo ajustado para generar código en función de una descripción de lenguaje natural del código deseado. Por ejemplo, puede generar una prueba de unidades para una función. Cantidad máxima de tokens de entrada: 6144
Cantidad máxima de tokens de salida: 1024
Supervisado:
RLHF: No
Destilación: No
Codey para la generación de código 32k
(code-bison-32k)
Un modelo ajustado para generar código en función de una descripción de lenguaje natural del código deseado. Por ejemplo, puede generar una prueba de unidades para una función. Cantidad máxima de tokens (entrada + salida): 32,768
Tokens de resultado máximo: 8192
Supervisado:
RLHF: No
Destilación: No
Codey para chat de código
(codechat-bison)
Un modelo ajustado para las conversaciones de chatbot que ayudan con las preguntas relacionadas con el código. Cantidad máxima de tokens de entrada: 6144
Cantidad máxima de tokens de salida: 1024
Supervisado:
RLHF: No
Destilación: No
Codey para chat de código 32k
(codechat-bison-32k)
Un modelo ajustado para las conversaciones de chatbot que ayudan con las preguntas relacionadas con el código. Cantidad máxima de tokens (entrada + salida): 32,768
Tokens de resultado máximo: 8192
Supervisado:
RLHF: No
Destilación: No

Idiomas admitidos

Los modelos heredados de API de PaLM de Vertex AI y las APIs de Codey admiten los siguientes lenguajes:

  • Árabe (ar)
  • Bengalí (bn)
  • Búlgaro (bg)
  • Chino simplificado y tradicional (zh)
  • Croata (hr)
  • Checo (cs)
  • Danés (da)
  • Neerlandés (nl)
  • Inglés (en)
  • Estonio (et)
  • Finés (fi)
  • Francés (fr)
  • Alemán (de)
  • Griego (el)
  • Hebreo (iw)
  • Hindi (hi)
  • Húngaro (hu)
  • Indonesio (id)
  • Italiano (it)
  • Japonés (ja)
  • Coreano (ko)
  • Letón (lv)
  • Lituano (lt)
  • Noruego (no)
  • Polaco (pl)
  • Portugués (pt)
  • Rumano (ro)
  • Ruso (ru)
  • Serbio (sr)
  • Eslovaco (sk)
  • Esloveno (sl)
  • Español (es)
  • Suajili (sw)
  • Sueco (sv)
  • Tailandés (th)
  • Turco (tr)
  • Ucraniano (uk)
  • Vietnamita (vi)

Fecha de descontinuación del modelo heredado

En la siguiente tabla, se muestra la fecha de descontinuación de los modelos heredados:

modelo de chat-bison Fecha de lanzamiento Fecha de descontinuación
chat-bison@002 6 de diciembre de 2023 9 de octubre de 2024
modelo de chat-bison-32k Fecha de lanzamiento Fecha de descontinuación
chat-bison-32k@002 Diciembre 4 de 2023 9 de octubre de 2024
modelo de code-bison Fecha de lanzamiento Fecha de descontinuación
code-bison@002 6 de diciembre de 2023 9 de octubre de 2024
modelo code-bison-32k Fecha de lanzamiento Fecha de descontinuación
code-bison-32k@002 Diciembre 4 de 2023 9 de octubre de 2024
modelo codechat-bison Fecha de lanzamiento Fecha de descontinuación
codechat-bison@002 6 de diciembre de 2023 9 de octubre de 2024
Modelo codechat-bison-32k Fecha de lanzamiento Fecha de descontinuación
codechat-bison-32k@002 Diciembre 4 de 2023 9 de octubre de 2024
modelo text-bison Fecha de lanzamiento Fecha de descontinuación
text-bison@002 6 de diciembre de 2023 9 de octubre de 2024
Modelo text-bison-32k Fecha de lanzamiento Fecha de descontinuación
text-bison-32k@002 Diciembre 4 de 2023 9 de octubre de 2024
modelo unicornio de texto Fecha de lanzamiento Fecha de descontinuación
texto-unicornio@001 30 de noviembre de 2023 A partir del 30 de noviembre de 2024

Modelos heredados que admiten la capacidad de procesamiento aprovisionada

En esta tabla, se muestran modelos heredados que admiten la capacidad de procesamiento aprovisionada, que se mide en caracteres por segundo, incrementos mínimos de compra y tasas de gasto.

Modelo Capacidad de procesamiento por GSU Aumento mínimo de compra de GSU Tasas de consumo
text-bison, chat-bison, code-bison, codechat-bison 4,000 5 1 carácter de entrada = 1 caracter
1 carácter de salida = 2 caracteres
text-unicorn 400 5 1 carácter de entrada = 1 carácter
1 carácter de salida = 3 caracteres