Google Cloud ofrece una variedad de productos y herramientas para crear aplicaciones de IA generativa con escalamiento, seguridad y observabilidad de nivel empresarial.

Usa esta página para conocer las etapas del desarrollo de una aplicación de IA generativa, elegir los mejores productos y herramientas para tu caso de uso y acceder a la documentación que necesitas para comenzar.

Aprende los aspectos básicos del desarrollo de la IA generativa

Obtén más información sobre cómo desarrollar una aplicación de IA generativa.
Obtén información sobre casos de uso comunes y tipos de modelos de IA generativa.
Identifica si la IA generativa, la IA tradicional o una combinación de ambas podrían adaptarse a tu caso de uso empresarial.
Aprende a abordar los desafíos en cada etapa del desarrollo de una aplicación de IA generativa.

Elige la infraestructura para tu aplicación de IA generativa

Descubre qué productos, frameworks y herramientas son los más adecuados para compilar tu aplicación de IA generativa. Entre los componentes comunes de una aplicación de IA generativa alojada en Cloud se incluyen los siguientes:

  1. Hosting de aplicaciones: Procesamiento para alojar la aplicación. Tu aplicación puede usar las bibliotecas cliente y los SDK de Google Cloud para comunicarse con diferentes productos de Cloud.
  2. Hosting de modelos: Hosting escalable y seguro para un modelo generativo.
  3. Modelo: Modelo generativo para texto, chat, imágenes, código, incorporaciones y multimodal.
  4. Solución de fundamentación: Resultado del modelo de anclaje para fuentes de información actualizadas y verificables.
  5. Base de datos: Almacena los datos de tu aplicación. Puedes reutilizar tu base de datos existente como tu solución de fundamentación, mediante el aumento de las instrucciones a través de una consulta en SQL o el almacenamiento de tus datos como incorporaciones vectoriales con una extensión como pgvector.
  6. Almacenamiento: Almacena archivos como imágenes, videos o frontends web estáticos. También puedes usar Storage para los datos de fundamentación sin procesar (p. ej., PDF) que luego conviertes en incorporaciones y almacenas en una base de datos vectorial.

Diagrama que muestra una descripción general de alto nivel de una infraestructura de hosting de aplicaciones de IA generativa, incluido un modelo y su infraestructura de hosting de modelos, solución de fundamentación, base de datos, almacenamiento y hosting de aplicaciones.

En las siguientes secciones, se explica cada uno de esos componentes y te ayuda a elegir qué productos de Google Cloud probar.

Infraestructura de hosting de aplicaciones

Elige un producto para alojar y entregar la carga de trabajo de tu aplicación, lo que realiza llamadas al modelo generativo.
Árbol de decisión que guía a los usuarios a través de la selección de un servicio adecuado para el hosting de aplicaciones

Comienza a usar:

Infraestructura de hosting de modelos

Google Cloud proporciona múltiples formas de alojar un modelo generativo, desde la plataforma insignia de Vertex AI, hasta hosting personalizable y portátil en Google Kubernetes Engine.

Árbol de decisión que guía a los usuarios para que elijan el modelo adecuado que aloja el servicio en la nube según sus prioridades y requisitos

Comienza a usar:

Modelo

Google Cloud proporciona un conjunto de modelos de base de vanguardia a través de Vertex AI, incluido Gemini. También puedes implementar un modelo de terceros en Vertex AI Model Garden o en el hosting propio en GKE, Cloud Run o Compute Engine.

Árbol de decisión que guía a los usuarios para que elijan un servicio de Vertex AI, para generar texto o código, con opciones para usar incorporaciones de texto, imágenes o videos

Comienza a usar:

Fundamentos

Para garantizar respuestas fundamentadas y precisas del modelo, te recomendamos fundar tu aplicación de IA generativa con datos en tiempo real. Esto se denomina generación aumentada de recuperación (RAG).

Puedes implementar la fundamentación con tus propios datos en una base de datos de vectores, que es un formato óptimo para operaciones como la búsqueda de similitud. Google Cloud ofrece múltiples soluciones de bases de datos vectoriales para diferentes casos de uso.

Nota: También puedes fundamentar con bases de datos tradicionales (no vectoriales). Para ello, solo debes consultar una base de datos existente, como Cloud SQL o Firestore, y usar el resultado en el mensaje del modelo.

Árbol de decisión que guía al usuario a través de la elección de la solución de base de datos vectorial adecuada para sus necesidades.

Comienza a usar:

Fundamentos con APIs

En lugar de (o además) usar tus propios datos para los fundamentos, muchos servicios en línea ofrecen APIs que puedes usar para recuperar datos de los fundamentos para mejorar la instrucción de tu modelo.
Crea, implementa y administra extensiones que conectan modelos de lenguaje grandes a las APIs de sistemas externos.
Explora una variedad de cargadores de documentos e integraciones de API para tus apps de IA generativa, desde YouTube hasta Google Académico.
Si usas modelos alojados en Vertex AI, puedes fundamentar las respuestas del modelo con Vertex AI Search, la Búsqueda de Google o texto intercalado o en archivos.

Comienza a desarrollar

Configura tu entorno de desarrollo

Instala las herramientas que necesitas para compilar una aplicación de IA generativa en Google Cloud.
Herramientas de línea de comandos para configurar un entorno de desarrollo local y, además, interactuar con las APIs de Cloud.
Consulta la documentación y las muestras de la API en tu IDE y acelera el desarrollo local de GKE y Cloud Run.
Aprende a autenticarte en las APIs de Google Cloud desde tu entorno local y desde cargas de trabajo alojadas.
LangChain es un framework de código abierto para apps de IA generativa que te permite crear contexto en tus instrucciones y tomar medidas en función de la respuesta del modelo.

Diseña instrucciones y evalúa modelos

Aprende estrategias para enviar instrucciones y experimenta con diferentes modelos.
Aprende estrategias para diseñar mensajes para diferentes tipos de datos, desde texto y código hasta multimodales.
Aprende a diseñar, probar y administrar tus prompts en Vertex AI Studio.
Mira decenas de ejemplos de instrucciones que abarcan casos de uso, incluidos la clasificación, la ideación y el resumen.
Explora ejemplos de instrucciones para generar, desarrollar y comunicar ideas nuevas.

Muestras de código

Bifurca una muestra en GitHub y comienza a compilar.

Aprende a compilar un chatbot de respuesta a preguntas basado en la Web mediante Vertex AI Agent Builder y Firebase.

Principiante Node.js

Aprende a compilar una aplicación simple de Flask en Python que llame a un modelo de base previamente entrenado en Vertex AI.

Principiante Python

Crea una app web para generar ideas de campañas de marketing con Gemini en Vertex AI, Cloud Run y Streamlit.

Principiante Python

Aprende a usar Vertex AI Search y LangChain para fundamentar los mensajes de modelo a una fuente de conocimiento verificable (informe de Google Cloud).

Nivel intermedio de Python

Obtén información sobre cómo implementar la llamada a función, el proceso de usar un LLM para propagar el cuerpo de una solicitud que luego puedes enviar a una API externa.

Nivel intermedio de Python

App de ejemplo para la generación de aumento de recuperación con AlloyDB para PostgreSQL y Vertex AI. (entrada de blog, codelab).

Nivel intermedio de Python

Guía de arquitectura y soluciones de inicio rápido

Recomendaciones y ejemplos de aplicaciones de IA generativa que son seguras, eficientes, resilientes, de alto rendimiento y rentables.

Usa esta arquitectura de referencia para diseñar la infraestructura y ejecutar una aplicación de IA generativa con generación aumentada (RAG) de recuperación mediante Vertex AI y AlloyDB para PostgreSQL.

Intermedio

Usa esta arquitectura de referencia para diseñar la infraestructura y ejecutar una aplicación de IA generativa con generación aumentada (RAG) a través de GKE, Cloud SQL y herramientas de código abierto como Ray, Hugging Face y LangChain.

Intermedio

En este documento, se proporciona orientación de diseño sobre cómo usar e integrar la variedad de opciones de almacenamiento que ofrece Google Cloud para las cargas de trabajo clave de IA y AA.

Avanzado

Implementa una aplicación de muestra con un clic para resumir documentos largos con Vertex AI.

Intermedio

Implementa una aplicación de ejemplo con un clic que use incorporaciones vectoriales almacenadas en Cloud SQL para mejorar la exactitud de las respuestas de una aplicación de chat.

Intermedio

Implementa una aplicación de ejemplo con un clic que extraiga pares de preguntas y respuestas de un conjunto de documentos, junto con una canalización que active la aplicación cuando se suba un documento.

Intermedio