La IA generativa en Vertex AI (también conocida como genai) te brinda acceso a los grandes modelos de IA generativa de Google en Vertex AI.
Referencia de modelos de base de IA generativa
Nombre del modelo | Descripción | Puede transmitir respuestas |
---|---|---|
API de Gemini (gemini-1.5-pro , gemini-1.0-pro y gemini-1.0-pro-vision ) |
Gemini es una familia de modelos de IA generativos desarrollados por Google DeepMind que están diseñados para casos de uso multimodales. La API de Gemini te brinda acceso a los modelos de Gemini Pro Vision y Gemini Pro. |
✔ |
PaLM 2 para Texto (text-bison ) |
Se ajustó para seguir las instrucciones de lenguaje natural y es adecuado para una variedad de tareas de lenguaje. |
✔ |
Embeddings para Texto (textembedding-gecko ) |
Muestra las incorporaciones del modelo para las entradas de texto. |
|
PaLM 2 para Chat (chat-bison ) |
Ajustado para casos de uso de conversaciones de varios turnos. |
✔ |
Codey para Generación de Código (code-bison ) |
Un modelo ajustado para generar código en función de una descripción de lenguaje natural del código deseado. Por ejemplo, puede generar una prueba de unidades para una función. |
✔ |
Codey para Chat de Código (codechat-bison ) |
Un modelo ajustado para las conversaciones con chatbots que ayudan con preguntas relacionadas con el programación. |
✔ |
Codey para Completar el Código (code-gecko ) |
Un modelo ajustado para sugerir la finalización del código según el contexto en el código que se escribe. |
|
Imagen para Generación de Imagen (imagegeneration ) |
Este modelo admite la generación de imágenes y puede crear elementos visuales de alta calidad en segundos. |
|
Incorporaciones para Multimodal (multimodalembedding ) |
Este modelo genera vectores basados en la entrada que proporcionas, que pueden incluir una combinación de imagen y texto. |
|
Subtitulado de imágenes (imagetext ) |
Este modelo admite subtítulos de imágenes y puede generar subtítulos a partir de una imagen que proporciones según el idioma que especifiques. |
|
MedLM (medlm-medium y medlm-large ) |
Una familia de modelos de base que se ajustan para la industria de la atención médica. |
✔ |
Búsqueda de respuestas visuales a preguntas (VQA) (imagetext ) |
Un modelo que admite preguntas y respuestas con imágenes. |
Respuesta de transmisión desde modelos de IA generativa
Los parámetros son los mismos para las solicitudes de transmisión y las de no transmisión a las APIs.
Para ver solicitudes de código y respuestas de muestra con la API de REST, consulta Ejemplos que usan la API de REST de transmisión.
Si deseas ver las solicitudes de código y las respuestas de muestra con el SDK de Vertex AI para Python, consulta Ejemplos que usan el SDK de Vertex AI para Python para la transmisión.
Regiones disponibles
Para obtener una lista de regiones en las que los Modelos de base son compatibles con la IA generativa en Vertex AI, consulta regiones.
Referencia de IA responsable
Para obtener información sobre los atributos específicos de seguridad y ver las respuestas de muestra, consulta Filtros y atributos de seguridad.
Entre estas referencias, hay un parámetro citation
. Para obtener más información sobre las citas, consulta Metadatos de cita.
¿Qué sigue?
- La IA generativa en Vertex AI tiene algunas limitaciones. Para obtener más información, consulta Limitaciones de la API de PaLM.
- Prueba un instructivo de guía de inicio rápido con Generative AI Studio o la API de Vertex AI.
- Explora los modelos previamente entrenados en Model Garden.
- Obtén información sobre las cuotas y los límites.
- Más información sobre los precios.