Introducción a la IA generativa

En esta guía para principiantes, se presentan las tecnologías principales de la IA generativa y se explica cómo se combinan para potenciar chatbots y aplicaciones. La IA generativa (conocida en inglés como genAI o gen IA) es un campo del aprendizaje automático (AA) que desarrolla y usa modelos de AA para generar contenido nuevo.

Los modelos de IA generativa a menudo se denominan modelos grandes de lenguaje (LLM) debido a su gran tamaño y capacidad para comprender y generar lenguaje natural. Sin embargo, según los datos con los que se entrenan los modelos, estos pueden interpretar y generar contenido de varias modalidades, como texto, imágenes, videos y audio. Los modelos que funcionan con varias modalidades de datos se llaman modelos multimodales.

Generación de contenido

Para que los modelos de IA generativa generen contenido útil en aplicaciones del mundo real, deben tener las siguientes capacidades:

Aprende a realizar tareas nuevas:

Los modelos de IA generativa están diseñados para realizar tareas generales. Si deseas que un modelo realice tareas únicas para tu caso de uso, debes poder personalizarlo. En Vertex AI, puedes personalizar tu modelo mediante el ajuste del modelo.
Accede a información externa:

Los modelos de IA generativa se entrenan con grandes cantidades de datos. Sin embargo, para que estos modelos sean útiles, deben poder acceder a información fuera de sus datos de entrenamiento. Por ejemplo, si quieres crear un chatbot de atención al cliente potenciado por un modelo de IA generativa, este debe tener acceso a la información sobre los productos y servicios que ofreces. En Vertex AI, usas las funciones de fundamentación y llamada a función para ayudar al modelo a acceder a información externa.
Bloquea el contenido dañino:

Los modelos de IA generativa pueden generar resultados que no se esperan, incluido un texto que sea ofensivo o insensible. Para mantener la seguridad y evitar el uso inadecuado, los modelos necesitan filtros de seguridad para bloquear las instrucciones y respuestas que se determinen como potencialmente dañinas. Vertex AI tiene funciones de seguridad integradas que promueven el uso responsable de nuestros servicios de IA generativa.

En el siguiente diagrama, se muestra cómo funcionan juntas estas diferentes funciones para generar el contenido que deseas:

Diagrama del flujo de trabajo de IA generativa

Instrucción

El flujo de trabajo de la IA generativa por lo general empieza con las instrucciones. Una instrucción es una solicitud de lenguaje natural enviada a un modelo de IA generativa para obtener una respuesta. Según el modelo, un mensaje puede contener texto, imágenes, videos y audio. , documentos y otras modalidades o incluso varias modalidades (multimodal).

Crear una instrucción para obtener la respuesta deseada del modelo es una práctica llamada diseño de instrucción. Si bien el diseño de una instrucción es un proceso de prueba y error, hay principios y estrategias de diseño de instrucciones que puedes usar para incentivar al modelo a comportarse de la manera deseada. Vertex AI Studio ofrece una herramienta de administración de instrucciones para ayudarte a administrar tus instrucciones.

Modelos de base

Las instrucciones se envían a un modelo de IA generativa para la generación de respuesta. Vertex AI tiene una variedad de modelos de base de IA generativa a los que se puede acceder a través de una API administrada, incluidos los siguientes:

API de Gemini: Motivos avanzados, chat de varios turnos, generación de código y las instrucciones multimodales.
API de Imagen: generación de imágenes, edición de imágenes y subtítulos visuales.
MedLM: Búsqueda de respuestas y resumen de preguntas médicas. (DG privada)

Los modelos difieren en tamaño, modalidad y costo. Puedes explorar modelos de Google, así como modelos abiertos y modelos de socios de Google, en Model Garden.

Personalización de modelos

Puedes personalizar el comportamiento predeterminado de los modelos de base de Google para que generen los resultados deseados de forma coherente sin usar prompts complejos. Este proceso de personalización se llama ajuste de modelos. La optimización del modelo te ayuda a reducir el costo y la latencia de tus solicitudes, ya que te permite simplificar las instrucciones.

Vertex AI también ofrece herramientas de evaluación de modelos para ayudarte a evaluar el rendimiento de tu modelo ajustado. Una vez que tu modelo ajustado esté listo para la producción, puedes implementarlo en un extremo y supervisar el rendimiento como en flujos de trabajo estándar de MLOps.

Cómo acceder a información externa

Vertex AI ofrece varias formas de darle al modelo acceso a las APIs externas y a la información en tiempo real.

Fundamentos: Conecta las respuestas del modelo a una fuente de información, como tus propios datos o la búsqueda web, lo que ayuda a reducir las alucinaciones.
RAG: Conecta los modelos a fuentes de conocimiento externas, como documentos y bases de datos, para generar respuestas más informativas y precisas.
Llamadas a funciones: Permite que el modelo interactúe con APIs externas para obtener información en tiempo real y llevar a cabo tareas reales.

Verificación de citas

Después de que se genera la respuesta, Vertex AI verifica si las citas deben incluirse en la respuesta. Si una cantidad significativa del texto de la respuesta proviene de una fuente en particular, esa fuente se agrega a los metadatos de la cita en la respuesta.

IA responsable y seguridad

La última capa de verificaciones que se realizan en la solicitud y la respuesta antes de que se devuelvan son los filtros de seguridad. Vertex AI verifica la instrucción y la respuesta para determinar en qué medida pertenecen a una categoría de seguridad. Si se excede el umbral para una o más categorías, la respuesta se bloquea y Vertex AI devuelve una respuesta de resguardo.

Respuesta

Si el mensaje y la respuesta pasan las verificaciones de filtro de seguridad, se devuelve la respuesta. Por lo general, la respuesta se devuelve de una sola vez. Sin embargo, con Vertex AI, también puedes recibir respuestas de forma progresiva a medida que se generan a través de la habilitación de la transmisión.

Experiencias de la consola de Vertex AI Studio

Cuando usas Vertex AI Studio con la prueba gratuita o sin acceder a Google Cloud, algunas funciones no están disponibles. Para probar Vertex AI Studio, acepta la ventana de las Condiciones del Servicio de Vertex AI Studio en la consola de Google Cloud.

	Usa sin una cuenta de Google Cloud	Usa con una cuenta de prueba gratuita de Google Cloud	Usa con una cuenta existente de Google Cloud
El acceso es obligatorio	No	Sí	Sí
Consultas por minuto (QPM)	2 QPM para todos los modelos multimodales	Consulta los límites de cuota	Consulta los límites de cuota
Créditos ofrecidos	$0	Hasta $300 por 90 días	$0
Galería de instrucciones	No	Sí	Sí
Diseñador de instrucciones	Sí	Sí	Sí
Guarda instrucciones	No	Sí	Sí
Historial de instrucciones	No	Sí	Sí
Parámetros avanzados	No	No	Sí
Ajuste	No	No	Sí
Uso de la API	No	Sí	Sí
El método de facturación es obligatorio	No	No	Sí
Cómo comenzar	Ir a Vertex AI Studio	Regístrese para obtener una prueba gratuita	Prueba Vertex AI en tu consola

Comienza a usar la IA generativa en Vertex AI

Prueba un instructivo de guía de inicio rápido con Generative AI Studio o la API de Vertex AI.
Explora los modelos previamente entrenados en Model Garden.
Explora la referencia del SDK de la API de Gemini de Vertex AI para Python, Node.js, Java, Go o C#.
Obtén información sobre las prácticas recomendadas de IA responsable y los filtros de seguridad de Vertex AI.
Más información sobre los precios.
Obtén información para llamar a Gemini con la biblioteca de OpenAI.