Referencia de la API de modelos para la IA generativa

La IA generativa en Vertex AI (también conocida como genai) te brinda acceso a los grandes modelos de IA generativa de Google en Vertex AI.

Referencia de modelos de base de IA generativa

Nombre del modelo Descripción Puede transmitir respuestas
API de Gemini (gemini-1.5-pro, gemini-1.0-pro y gemini-1.0-pro-vision)

Gemini es una familia de modelos de IA generativos desarrollados por Google DeepMind que están diseñados para casos de uso multimodales. La API de Gemini te brinda acceso a los modelos de Gemini Pro Vision y Gemini Pro.

PaLM 2 para texto (text-bison)

Se ajustó para seguir las instrucciones de lenguaje natural y es adecuado para una variedad de tareas de lenguaje.

Incorporaciones para texto (textembedding-gecko)

Muestra las incorporaciones del modelo para las entradas de texto.

PaLM 2 para chat (chat-bison)

Ajustado para casos de uso de conversaciones de varios turnos.

Codey para Generación de código (code-bison)

Un modelo ajustado para generar código en función de una descripción de lenguaje natural del código deseado. Por ejemplo, puede generar una prueba de unidades para una función.

Codey para Chat de código (codechat-bison)

Un modelo ajustado para las conversaciones con chatbots que ayudan con preguntas relacionadas con el programación.

Codey for Completar el código (code-gecko)

Un modelo ajustado para sugerir la finalización del código según el contexto en el código que se escribe.

Imagen para la generación de imágenes (imagegeneration)

Este modelo admite la generación de imágenes y puede crear elementos visuales de alta calidad en segundos.

Incorporaciones para multimodales (multimodalembedding)

Este modelo genera vectores basados en la entrada que proporcionas, que pueden incluir una combinación de imagen y texto.

Subtitulado de imágenes (imagetext)

Este modelo admite subtítulos de imágenes y puede generar subtítulos a partir de una imagen que proporciones según el idioma que especifiques.

MedLM (medlm-medium y medlm-large)

Una familia de modelos de base que se ajustan para la industria de la atención médica.

Búsqueda de respuestas visuales a preguntas (VQA) (imagetext)

Un modelo que admite preguntas y respuestas con imágenes.

Respuesta de transmisión desde modelos de IA generativa

Los parámetros son los mismos para las solicitudes de transmisión y las de no transmisión a las APIs.

Para ver solicitudes de código y respuestas de muestra con la API de REST, consulta Ejemplos que usan la API de REST de transmisión.

Si deseas ver las solicitudes de código y las respuestas de muestra con el SDK de Vertex AI para Python, consulta Ejemplos que usan el SDK de Vertex AI para Python para la transmisión.

Regiones disponibles

Para obtener una lista de regiones en las que los Modelos de base son compatibles con la IA generativa en Vertex AI, consulta regiones.

Referencia de IA responsable

Para obtener información sobre los atributos específicos de seguridad y ver las respuestas de muestra, consulta Filtros y atributos de seguridad. Entre estas referencias, hay un parámetro citation. Para obtener más información sobre las citas, consulta Metadatos de cita.

¿Qué sigue?