Descripción general de modelos de lenguaje

Puedes acceder, ajustar e implementar los modelos de lenguaje de IA generativa de Google mediante las APIs de PaLM de Vertex AI y las de Vertex AI Codey. Usa los modelos de lenguaje para realizar una variedad de flujos de trabajo de Vertex AI, como usar las APIs a fin de interactuar con los modelos y, luego, implementarlos en un notebook de Jupyter. También puedes personalizar modelos de lenguaje para tu caso de uso específico mediante el ajuste de modelos. En esta página, se proporciona una descripción general de los modelos de lenguaje disponibles, las APIs que usas para interactuar con los modelos y formas de personalizar sus comportamientos.

Esquema de nombres del modelo

Los nombres de los modelos de base tienen dos componentes: caso de uso y tamaño del modelo. La convención de nombres tiene el formato <use case>-<model size>. Por ejemplo, text-bison representa el modelo de texto Bison.

Los tamaños del modelo son los siguientes:

  • Unicorn: El modelo más grande de la familia PaLM. Los modelos Unicorn son excelentes para las tareas complejas, como la codificación y la cadena de pensamiento (CoT), debido al amplio conocimiento incorporado en el modelo y sus capacidades de razonamiento.
  • Bison: El mejor modelo PaLM que controla una amplia variedad de tareas de lenguaje, como la clasificación y el resumen. Está optimizado para la exactitud y la latencia a un precio razonable. Las interfaces de texto, chat, código y chat de código simplifican la implementación y la integración en tu aplicación.
  • Gecko: El modelo más pequeño y económico para tareas sencillas.

Puedes usar la versión estable o más reciente de un modelo. Para obtener más información, consulta Versiones de modelo y ciclo de vida.

API de PaLM de Vertex AI

La API de PaLM de Vertex AI te brinda acceso a la familia de modelos PaLM 2, que admiten la generación de texto de lenguaje natural, incorporaciones de texto y código (recomendamos usar las APIs de Vertex AI Codey para la generación de código). PaLM 2 es la segunda generación del modelo de lenguaje de vías desarrollado por Google Labs. Mediante la API de PaLM de Vertex AI, puedes aprovechar las herramientas de MLOps, la seguridad, la privacidad, y la escalabilidad de nivel empresarial que ofrece Vertex AI.

La API de PaLM de Vertex AI expone modelos de PaLM 2 mediante el uso de extremos de publicadores globales que son únicos para cada proyecto de Google Cloud. El siguiente es un ejemplo de un extremo de modelo de publicador:

https://us-central1-aiplatform.googleapis.com/v1/projects/your_project_id/locations/us-central1/publishers/google/models/text-bison:predict

La API de PaLM de Vertex AI tiene extremos de publicador para los siguientes modelos de PaLM 2:

  • text-bison: Optimizado para realizar tareas de lenguaje natural, como clasificación, resumen, extracción, creación de contenido e ideación.
  • chat-bison: Optimizado para el chat de varios turnos, en el que el modelo realiza un seguimiento de los mensajes anteriores en el chat y los usa como contexto a fin de generar respuestas nuevas.
  • textembedding-gecko: Genera incorporaciones de texto para un texto determinado. Puedes usar incorporaciones para tareas como la búsqueda semántica, la recomendación, la clasificación y la detección de valores atípicos.

Para obtener más información sobre estos modelos, consulta Modelos disponibles.

APIs de Vertex AI Codey

Las APIs de Vertex AI Codey están optimizadas para admitir la generación de código, el chat de código y la finalización de código para varios lenguajes de programación. Las APIs de Vertex AI Codey se basan en la familia de modelos PaLM 2. Para obtener más información, consulta Descripción general de los modelos de código.

Diseño de instrucciones

Para interactuar con modelos de base, como PaLM 2, debes enviar las instrucciones en lenguaje natural, también llamadas mensajes, que le indiquen al modelo lo que deseas que genere. Sin embargo, a veces, los LLM pueden comportarse de maneras impredecibles. El diseño de un mensaje es un proceso iterativo de prueba y error que toma tiempo y práctica para dominar el nivel. Para obtener información sobre las estrategias generales de diseño de mensajes, consulta Introducción al diseño de mensajes. Para obtener orientación sobre el diseño de instrucciones específicas para tareas con texto, consulta Diseña instrucciones de texto.

Ajuste de modelo

Si necesitas personalizar los modelos de PaLM 2 para un caso de uso específico, puedes ajustar los modelos mediante un conjunto de datos de ejemplos de entrada y salida. Los modelos ajustados se implementan de forma automática en un extremo nuevo de tu proyecto para entregar solicitudes. Para obtener más información sobre el ajuste del modelo, consulta Ajusta los modelos base.

¿Qué sigue?