Compila una aplicación de IA generativa en Google Cloud
Google Cloud ofrece una variedad de productos y herramientas para crear aplicaciones de IA generativa con escalamiento, seguridad y observabilidad de nivel empresarial.
Usa esta página para conocer las etapas del desarrollo de una aplicación de IA generativa, elegir los mejores productos y herramientas para tu caso de uso y acceder a la documentación que necesitas para comenzar.
Aprende los aspectos básicos del desarrollo de la IA generativa
Cuándo usar la IA generativa o la IA tradicional
Descripción general del desarrollo de una aplicación de IA generativa
Elige la infraestructura para tu aplicación de IA generativa
Descubre qué productos, frameworks y herramientas son los más adecuados para compilar tu aplicación de IA generativa. Entre los componentes comunes de una aplicación de IA generativa alojada en Cloud se incluyen los siguientes:
- Hosting de aplicaciones: Procesamiento para alojar la aplicación. Tu aplicación puede usar las bibliotecas cliente y los SDK de Google Cloud para comunicarse con diferentes productos de Cloud.
- Hosting de modelos: Hosting escalable y seguro para un modelo generativo.
- Modelo: Modelo generativo para texto, chat, imágenes, código, incorporaciones y multimodal.
- Solución de fundamentación: Resultado del modelo de anclaje para fuentes de información actualizadas y verificables.
- Base de datos: Almacena los datos de tu aplicación. Puedes reutilizar tu base de datos existente como tu solución de fundamentación, mediante el aumento de las instrucciones a través de una consulta en SQL o el almacenamiento de tus datos como incorporaciones vectoriales con una extensión como pgvector.
- Almacenamiento: Almacena archivos como imágenes, videos o frontends web estáticos. También puedes usar Storage para los datos de fundamentación sin procesar (p. ej., PDF) que luego conviertes en incorporaciones y almacenas en una base de datos vectorial.
En las siguientes secciones, se explica cada uno de esos componentes y te ayuda a elegir qué productos de Google Cloud probar.
Infraestructura de hosting de aplicaciones
Comienza a usar:
Infraestructura de hosting de modelos
Comienza a usar:
Modelo
Comienza a usar:
- Gemini
- Codey
- Imagen
- incorporación de texto
- Vertex AI Model Garden (modelos de código abierto)
- HuggingFace Model Hub (modelos de código abierto)
Fundamentos
Para garantizar respuestas fundamentadas y precisas del modelo, te recomendamos fundar tu aplicación de IA generativa con datos en tiempo real. Esto se denomina generación aumentada de recuperación (RAG).
Puedes implementar la fundamentación con tus propios datos en una base de datos de vectores, que es un formato óptimo para operaciones como la búsqueda de similitud. Google Cloud ofrece múltiples soluciones de bases de datos vectoriales para diferentes casos de uso.
Nota: También puedes fundamentar con bases de datos tradicionales (no vectoriales). Para ello, solo debes consultar una base de datos existente, como Cloud SQL o Firestore, y usar el resultado en el mensaje del modelo.
Comienza a usar:
- Vertex AI Agent Builder (anteriormente Enterprise Search, Gen AI App Builder y Discovery Engine)
- Vector Search (anteriormente Matching Engine)
- AlloyDB para PostgreSQL
- Cloud SQL
- BigQuery
Fundamentos con APIs
Vertex AI Extensions (vista previa privada)
Componentes de Langchain
Fundamentos en Vertex AI
Comienza a desarrollar
Configura tu entorno de desarrollo
Instala Google Cloud CLI
Instala la extensión de Cloud Code en el IDE
Configura la autenticación
Configura LangChain
Diseña instrucciones y evalúa modelos
Introducción al diseño de mensajes
Vertex AI Studio
Muestras de instrucciones de IA generativa
Creación de modelos generativos en Vertex AI
Evaluación de modelos en Vertex AI
Muestras de código
Chatbot web: Responde preguntas sobre Google Store
Aprende a compilar un chatbot de respuesta a preguntas basado en la Web mediante Vertex AI Agent Builder y Firebase.
App de Chat con Eventarc y Vertex AI
Aprende a compilar una aplicación simple de Flask en Python que llame a un modelo de base previamente entrenado en Vertex AI.
Genera una campaña de marketing con Gemini
Crea una app web para generar ideas de campañas de marketing con Gemini en Vertex AI, Cloud Run y Streamlit.
App de búsqueda de respuestas con “Guía del profesional para MLOps”
Aprende a usar Vertex AI Search y LangChain para fundamentar los mensajes de modelo a una fuente de conocimiento verificable (informe de Google Cloud).
Ayudante de solicitudes a la API de Weather: Llamada a función con Gemini
Obtén información sobre cómo implementar la llamada a función, el proceso de usar un LLM para propagar el cuerpo de una solicitud que luego puedes enviar a una API externa.
Asistente del aeropuerto: App de recuperación de bases de datos de IA generativa
App de ejemplo para la generación de aumento de recuperación con AlloyDB para PostgreSQL y Vertex AI. (entrada de blog, codelab).
Guía de arquitectura y soluciones de inicio rápido
Infraestructura para una aplicación de IA generativa compatible con RAG mediante Vertex AI
Usa esta arquitectura de referencia para diseñar la infraestructura y ejecutar una aplicación de IA generativa con generación aumentada (RAG) de recuperación mediante Vertex AI y AlloyDB para PostgreSQL.
Infraestructura para una aplicación de IA generativa compatible con RAG mediante GKE
Usa esta arquitectura de referencia para diseñar la infraestructura y ejecutar una aplicación de IA generativa con generación aumentada (RAG) a través de GKE, Cloud SQL y herramientas de código abierto como Ray, Hugging Face y LangChain.
Diseña almacenamiento para cargas de trabajo de IA y AA en Google Cloud
En este documento, se proporciona orientación de diseño sobre cómo usar e integrar la variedad de opciones de almacenamiento que ofrece Google Cloud para las cargas de trabajo clave de IA y AA.
Solución de inicio rápido: resumen de documentos
Implementa una aplicación de muestra con un clic para resumir documentos largos con Vertex AI.
Solución de inicio rápido: RAG de IA generativa con Cloud SQL
Implementa una aplicación de ejemplo con un clic que use incorporaciones vectoriales almacenadas en Cloud SQL para mejorar la exactitud de las respuestas de una aplicación de chat.
Solución de inicio rápido: Base de conocimiento de la IA generativa
Implementa una aplicación de ejemplo con un clic que extraiga pares de preguntas y respuestas de un conjunto de documentos, junto con una canalización que active la aplicación cuando se suba un documento.