Elige los modelos y la infraestructura para tu aplicación de IA generativa

Descubre qué productos, frameworks y herramientas son los más adecuados para crear tu aplicación de IA generativa. En la siguiente figura se muestran los componentes habituales de una aplicación de IA generativa alojada en la nube.
Diagrama de Venn que muestra los componentes de un sistema de IA generativa Diagrama de Venn que muestra los componentes de un sistema de IA generativa
  1. Hosting de aplicaciones: Compute para alojar tu aplicación. Tu aplicación puede usar las bibliotecas de cliente y los SDKs de Google Cloud para comunicarse con diferentes productos de Cloud.

  2. Alojamiento de modelos: alojamiento escalable y seguro para un modelo generativo.

  3. Modelo: modelo generativo para texto, chat, imágenes, código, incrustaciones y multimodal.

  4. Solución de grounding: ancla la salida del modelo a fuentes de información verificables y actualizadas.

  5. Base de datos: almacena los datos de tu aplicación. Puedes reutilizar tu base de datos como solución de fundamentación aumentando las peticiones mediante consultas SQL o almacenando tus datos como embeddings de vectores con una extensión como pgvector.

  6. Almacenamiento: almacena archivos como imágenes, vídeos o front-ends web estáticos. También puedes usar Storage para los datos de base sin procesar (por ejemplo, PDFs) que luego conviertes en inserciones y almacenas en una base de datos de vectores.

En las secciones que se indican a continuación, se explican cada uno de esos componentes para ayudarte a elegir qué productos de Google Cloud probar.

Infraestructura de alojamiento de aplicaciones

Elige un producto para alojar y servir tu carga de trabajo de la aplicación, que hace llamadas al modelo generativo.

¿Quieres una infraestructura sin servidor gestionada?

cerrar
check
Cloud Run
cerrar

¿Se puede poner tu aplicación en contenedores?

cerrar
check
Kubernetes Engine
cerrar

Infraestructura de alojamiento del modelo

Google Cloud ofrece varias formas de alojar un modelo generativo, desde la plataforma estrella Vertex AI hasta el alojamiento personalizable y portátil en Google Kubernetes Engine.

Usas Gemini y necesitas funciones empresariales como escalabilidad, seguridad, privacidad de los datos y observabilidad

check
cerrar
API para desarrolladores de Gemini
check

¿Quieres una infraestructura totalmente gestionada con herramientas y APIs de IA generativa de primera clase?

cerrar
check
Vertex AI
cerrar

¿Tu modelo requiere un kernel especializado, un SO antiguo o tiene términos de licencia especiales?

cerrar
check
Compute Engine
cerrar

Modelo

Google Cloud ofrece un conjunto de modelos fundacionales de vanguardia a través de Vertex AI , incluido Gemini. También puedes desplegar un modelo de terceros en Model Garden de Vertex AI o en un alojamiento propio en GKE , Cloud Run o Compute Engine.

¿Generar código?

cerrar
check
Codey (Vertex AI)
cerrar

¿Quieres generar imágenes?

cerrar
check
Imagen (Vertex AI)
cerrar

¿Quieres generar embeddings para búsquedas, clasificaciones o agrupaciones?

cerrar
check
text-embedding (Vertex AI)
cerrar

Vale, quieres generar texto. ¿Quieres incluir imágenes o vídeos en tus peticiones de texto? (multimodal)

cerrar
check
Gemini (Vertex AI)
cerrar

De acuerdo, solo peticiones de texto. ¿Quieres aprovechar el modelo insignia más potente de Google?

cerrar
check
Gemini (Vertex AI)
cerrar

Implementa un modelo de código abierto en: Vertex AI (Model Garden) GKE (Hugging Face)

Fundamentación y RAG

Para asegurarte de que las respuestas del modelo sean precisas y estén bien fundamentadas, basa tu aplicación de IA generativa en datos en tiempo real. Este proceso se denomina generación aumentada por recuperación (RAG).

Si quieres generar contenido basado en información actualizada de Internet, los modelos de Gemini pueden evaluar si el conocimiento del modelo es suficiente o si es necesario basarse en la Búsqueda de Google.

Puedes implementar la fundamentación usando un índice de tus datos con un buscador. Muchos buscadores almacenan ahora los embeddings en una base de datos de vectores, que es un formato óptimo para operaciones como la búsqueda de similitud. Google Cloud ofrece varias soluciones de bases de datos de vectores para diferentes casos prácticos.

Nota: Puedes fundamentar la información usando bases de datos no vectoriales consultando una base de datos como Cloud SQL o Firestore, y puedes usar el resultado de la consulta en la petición de tu modelo.

¿Quieres una solución optimizada y totalmente gestionada que admita la mayoría de las fuentes de datos y que impida el acceso directo a las inserciones subyacentes?

cerrar
check
Vertex AI Search
cerrar
Estás creando un buscador para RAG

¿Quieres crear un motor de búsqueda para RAG usando un orquestador gestionado con una interfaz similar a LlamaIndex?

cerrar
check
Motor de RAG de Vertex AI
cerrar
Puedes usar una arquitectura de referencia para crear un buscador personalizado y una base de datos de vectores para casos prácticos de RAG.
cerrar

¿Necesitas una búsqueda vectorial de baja latencia, un servicio a gran escala o una base de datos de vectores especializada y optimizada?

cerrar
check
Búsqueda de Vectores de Vertex AI
cerrar

¿Se accede a sus datos de forma programática (OLTP)? ¿Ya usas una base de datos SQL?

cerrar
check

¿Quieres usar modelos de IA de Google directamente desde tu base de datos? ¿Necesitas una latencia baja?

check
cerrar
cerrar

¿Tiene un gran conjunto de datos analíticos (OLAP)? ¿Necesitas procesamiento por lotes y acceso frecuente a tablas SQL por parte de personas o secuencias de comandos (ciencia de datos)?

check
BigQuery

Fundamentación con APIs

En lugar de usar tus propios datos para fundamentar las respuestas (o además de hacerlo), muchos servicios online ofrecen APIs que puedes usar para obtener datos de fundamentación y mejorar la petición de tu modelo.
Crea, implementa y gestiona extensiones que conecten modelos de lenguaje extensos con las APIs de sistemas externos.
Descubre una gran variedad de cargadores de documentos e integraciones de APIs para tus aplicaciones de IA generativa, desde YouTube hasta Google Académico.
Si usas modelos alojados en Vertex AI, puedes fundamentar las respuestas de los modelos con Vertex AI Search, la Búsqueda de Google o texto insertado o en archivos.

Empezar a desarrollar

LangChain es un framework de código abierto para aplicaciones de IA generativa que te permite añadir contexto a tus peticiones y tomar medidas en función de la respuesta del modelo.

Consulta ejemplos de código para casos prácticos habituales y ejemplos de implementación de aplicaciones de IA generativa que sean seguras, eficientes, resilientes, de alto rendimiento y rentables.