Descripción general de la IA generativa en Vertex AI

La IA generativa en Vertex AI (también conocida como genAI o gen AI) te da acceso a los grandes modelos de IA generativa de Google para que puedas probarlos, implementarlos y ajustarlos en tus aplicaciones impulsadas por IA. En esta página, se proporciona una descripción general del flujo de trabajo de IA generativo en Vertex AI, las características y los modelos disponibles, y se te dirige a los recursos para comenzar.

Flujo de trabajo de IA generativa

En el siguiente diagrama, se muestra una descripción general de alto nivel del flujo de trabajo IA generativa.

Diagrama del flujo de trabajo de IA generativa

Prompt

El flujo de trabajo de la IA generativa generalmente comienza con los prompts. Un prompt es una solicitud de lenguaje natural enviada a un modelo de lenguaje para obtener una respuesta. Escribir un prompt para obtener la respuesta deseada del modelo es una práctica llamada diseño de prompt. Si bien el diseño de un prompt es un proceso de prueba y error, hay principios y estrategias de diseño de prompts que puedes usar para incentivar al modelo a comportarse de la manera deseada.

Modelos de base

Los prompts se envían a un modelo para la generación de respuesta. Vertex AI tiene una variedad de modelos de base de IA generativa a los que se puede acceder a través de una API, incluidos los siguientes:

API de Gemini: Motivos avanzados, chat de varios turnos, generación de código y prompts multimodales.
API de PaLM: usa tareas de lenguaje natural, incorporaciones de texto y chat de varios turnos.
APIs de Codey: generación de código, finalización de código y chat de código.
API de Imagen: generación de imágenes, edición de imágenes y subtítulos visuales.
MedLM: Búsqueda de respuestas y resumen de preguntas médicas. (DG privada)

Los modelos difieren en tamaño, modalidad y costo. Puedes explorar los modelos de OSS y los modelos propiedad de Google en Model Garden.

Personalización del modelo

Puedes personalizar el comportamiento predeterminado de los modelos de base de Google para que generen los resultados deseados de forma coherente sin usar prompts complejos. Este proceso de personalización se denomina ajuste de modelos. El ajuste de modelos te ayuda a reducir los costos y la latencia de tus solicitudes, ya que te permite simplificar los mensajes.

Vertex AI también ofrece herramientas de evaluación de modelos para ayudarte a evaluar el rendimiento de tu modelo ajustado. Una vez que tu modelo ajustado esté listo para la producción, puedes implementarlo en un extremo y supervisar el rendimiento como en flujos de trabajo estándar de MLOps.

Servicio de fundamentación de Vertex AI

Si necesitas que las respuestas de los modelos se basen en una fuente de información, como tu propio corpus de datos, puedes usar la fundamentación en Vertex AI. La fundamentación ayuda a reducir las alucinaciones del modelo, en especial en temas desconocidos, y también le proporciona al modelo acceso a información nueva.

Verificación de citas

Después de que se genera la respuesta, Vertex AI verifica si se deben incluir las citas con la respuesta. Si una cantidad significativa del texto en la respuesta proviene de una fuente específica, esa fuente se agrega a los metadatos de la cita en la respuesta.

IA responsable y seguridad

La última capa de verificaciones que se realizan en la solicitud y la respuesta antes de que se devuelvan son los filtros de seguridad. Vertex AI verifica tanto el mensaje como la respuesta sobre cuánto pertenece la solicitud o la respuesta a una categoría de seguridad. Si se excede el umbral para una o más categorías, la respuesta se bloquea y Vertex AI devuelve una respuesta de resguardo.

Respuesta

Si el mensaje y la respuesta pasan las verificaciones de filtro de seguridad, se devuelve la respuesta. Por lo general, la respuesta se devuelve de una sola vez. Sin embargo, también puedes recibir respuestas de forma progresiva a medida que se generan a través de la habilitación de la transmisión.

APIs y modelos de IA generativa

Los modelos de IA generativa disponibles en Vertex AI, también llamados modelos de base, se clasifican por el tipo de contenido que están diseñados para generar. Este contenido incluye texto, chat, imagen, código, video, incorporaciones y datos multimodales. Cada modelo se expone a través de un extremo de publicador específico para tu proyecto de Google Cloud, por lo que no es necesario implementar el modelo de base, a menos que necesites ajustarlo para un caso de uso específico.

Ofertas de la API de Gemini

La API de Vertex AI Gemini contiene los extremos del publicador para los modelos de Gemini que desarrolló Google DeepMind.

Gemini 1.0 Pro se diseñó para manejar tareas de lenguaje natural, chat de código y texto de varios turnos, y generación de código.
Gemini 1.0 Pro Vision admite mensajes multimodales. Puedes incluir texto, imágenes y video en las solicitudes de prompts y obtener respuestas de texto o código.

Ofertas de la API de PaLM

La API de PaLM de Vertex AI contiene los extremos del publicador para el Pathways Language Model 2 (PaLM 2) de Google, que son modelos grandes de lenguaje (LLM) amplios que generan texto y código en respuesta a indicaciones de lenguaje natural.

La API de PaLM para texto está ajustada para tareas de lenguaje, como clasificación, resumen y extracción de entidades.
La API de PaLM para el chat es ajustada para el chat de varios turnos, en el que el modelo realiza un seguimiento de los mensajes anteriores en el chat y los usa como contexto para generar respuestas nuevas.

Otras ofertas de IA generativa

Las APIs de Codey generan código. Las APIs de Codey incluyen tres modelos que generan código, sugieren código para completarlo y permiten a los desarrolladores chatear para obtener ayuda con preguntas relacionadas con el código. Para obtener más información, consulta Descripción general de los modelos de código.
La API de Text Embedding genera incorporaciones vectoriales para texto de entrada. Puedes usar incorporaciones para tareas como la búsqueda semántica, la recomendación, la clasificación y la detección de valores atípicos.
Las incorporaciones multimodales generan vectores de incorporación en función de entradas de imagen y texto. Estas incorporaciones se pueden usar más adelante para otras tareas posteriores, como la clasificación de imágenes o las recomendaciones de contenido. Para obtener más información, consulta la página de incorporaciones multimodales.
Imagen, nuestro modelo de base de texto a imagen, permite a las organizaciones generar y personalizar imágenes de nivel de estudio a gran escala para cualquier necesidad empresarial. Para obtener más información, consulta la descripción general de Imagen en Vertex AI.
MedLM es una familia de modelos de base que se ajustan para el sector de la atención médica. Para obtener más información, consulta la descripción general de modelos de MedLM.

Vertex AI Studio

Vertex AI Studio es una herramienta de la consola de Google Cloud para crear prototipos de modelos de IA generativa y probarlos con rapidez. Puedes probar instrucciones de muestra, diseñar tus propias instrucciones y personalizar los modelos de base para administrar tareas que satisfagan las necesidades de tu aplicación. En esta página, se presentan las diferentes tareas que puedes realizar en Vertex AI Studio, incluidas las siguientes:

Probar modelos con instrucciones de muestra
Diseñar y guardar tus propias instrucciones
Ajustar un modelo de base
Convertir entre voz y texto.

Probar modelos con prompts de muestra

La galería de prompts, en la sección Lenguaje de Vertex AI Studio, contiene una variedad de prompts de muestra prediseñados para ayudar a demostrar las capacidades del modelo. Los mensajes de muestra se clasifican por el tipo de tarea, como resumen, clasificación y extracción. Cada prompt tiene preconfigurado un modelo y valores de parámetros especificados, de modo que puedes abrir el prompt de muestra y hacer clic en Enviar para obtener un modelo y generar una respuesta.

prompt-ui

Diseña y guarda tus propios prompts

El diseño de mensajes es el proceso de crear manualmente mensajes que activan la respuesta deseada de un modelo de lenguaje. Cuando creas prompts con cuidado, puedes ayudar a que el modelo genere un resultado deseado. El diseño de instrucciones puede ser una forma eficiente de experimentar con la adaptación de un modelo de lenguaje para un caso de uso específico.

Puedes crear y guardar tus propios prompts en Vertex AI Studio. Cuando crees un prompt nuevo, ingresa el texto del prompt, especifica el modelo que usarás, configura los valores de los parámetros y prueba del prompt, mediante la generación de una respuesta. Puedes iterar en el prompt y sus configuraciones hasta que obtengas los resultados deseados. Cuando termines de diseñar el mensaje, puedes guardarlo en Vertex AI Studio.

Citas de respuesta

Si usas un modelo de texto en Vertex AI Studio, como text-bison, recibirás respuestas de texto basadas en tu entrada. Nuestras funciones están diseñadas para producir contenido original y no replicar el contenido existente en su longitud. Si Vertex AI Studio incluye muchas citas de una página web, cita esa página en el resultado.

citas de texto

Puedes cambiar la calidad de las respuestas si modificas la temperatura (aleatoriedad de salida) y experimentas con otros parámetros de respuesta en Vertex AI Studio.

Las citas están disponibles en Vertex AI Studio y en la API. Para obtener más información sobre la IA responsable y las citas, consulta Metadatos de citas.

Explora modelos de IA generativas en Model Garden

Model Garden es una plataforma que te ayuda a descubrir, probar, personalizar e implementar modelos de la propiedad de Google y elegir modelos y recursos de OSS. Para explorar los modelos y las APIs de IA que están disponibles en Vertex AI, ve a Model Garden en la consola de Google Cloud.

Ir a Model Garden

Para obtener más información sobre Model Garden, incluidos los modelos y las funciones disponibles, consulta Explora los modelos de IA en Model Garden.

Ajusta un modelo de base

Si bien el diseño de prompts es ideal para realizar experimentos rápidos, si hay datos de entrenamiento disponibles, se puede lograr una mayor calidad mediante el ajuste del modelo en sí. Ajustar un modelo te permite personalizar su respuesta según los ejemplos de la tarea que deseas que realice el modelo.

Para aprender a ajustar un modelo de base, consulta Ajusta los modelos de base.

Convierte entre voz y texto

En la herramienta de voz de Vertex AI Studio, puedes tomar un fragmento de texto y convertirlo en un archivo de audio de voz que puedas reproducir y descargar. Puedes seleccionar entre varias voces y ajustar la velocidad del habla.

Por el contrario, si tienes un archivo de audio de voz, también puedes subirlo a Vertex AI Studio y transcribirlo a texto.

Para obtener más información, consulta las siguientes páginas:

Prueba Vertex AI Studio

Vertex AI Studio se encuentra en la página de Vertex AI de la consola de Google Cloud.

Ir a Vertex AI Studio

Certificaciones y controles de seguridad

Vertex AI es compatible con CMEK, Controles del servicio de VPC, Residencia de datos y la Transparencia de acceso. Existen algunas limitaciones para las funciones de IA generativa. Para obtener más información, consulta Controles de seguridad de IA generativa.

Comenzar

Prueba un instructivo de guía de inicio rápido con Generative AI Studio o la API de Vertex AI.
Explora los modelos previamente entrenados en Model Garden.
Obtén información para ajustar un modelo de base.
Obtén información sobre las prácticas recomendadas de IA responsable y los filtros de seguridad de Vertex AI.
Obtén información sobre las cuotas y los límites.
Más información sobre los precios.