Elige modelos y la infraestructura para tu aplicación de IA generativa

Descubre qué productos, frameworks y herramientas son la mejor opción para compilar tu aplicación de IA generativa. En la siguiente imagen, se muestran los componentes comunes de una aplicación de IA generativa alojada en Cloud.
Diagrama de Venn que muestra los componentes de un sistema de IA generativa Diagrama de Venn que muestra los componentes de un sistema de IA generativa
  1. Alojamiento de aplicaciones: Procesamiento para alojar tu aplicación. Tu aplicación puede usar las bibliotecas cliente y los SDK de Google Cloud para comunicarse con diferentes productos de Cloud.

  2. Alojamiento de modelos: Es un alojamiento escalable y seguro para un modelo generativo.

  3. Modelo: Modelo generativo para texto, chat, imágenes, código, incorporaciones y multimodal.

  4. Solución de anclaje: Anclar el resultado del modelo a fuentes de información verificables y actualizadas.

  5. Base de datos: Almacena los datos de tu aplicación. Puedes reutilizar tu base de datos existente como tu solución de fundamentación, mediante el aumento de las instrucciones a través de una consulta en SQL o el almacenamiento de tus datos como incorporaciones vectoriales con una extensión como pgvector.

  6. Almacenamiento: Almacena archivos, como imágenes, videos o frontends web estáticos. También puedes usar Storage para los datos de puesta a tierra sin procesar (p. ej., PDF) que luego conviertes en incorporaciones y almacenas en una base de datos de vectores.

En las siguientes secciones, se explica cada uno de esos componentes para ayudarte a elegir qué productos de Google Cloud probar.

Infraestructura de hosting de aplicaciones

Elige un producto para alojar y entregar la carga de trabajo de tu aplicación, que realiza llamadas al modelo generativo.

¿Quieres una infraestructura sin servidores administrada?

cerrar
comprobar
Cloud Run
cerrar

¿Se puede alojar tu aplicación en contenedores?

cerrar
comprobar
Kubernetes Engine
cerrar

Infraestructura de hosting de modelos

Google Cloud proporciona múltiples formas de alojar un modelo generativo, desde la plataforma insignia de Vertex AI, hasta hosting personalizable y portátil en Google Kubernetes Engine.

Usar Gemini y necesitar funciones empresariales, como escalamiento, seguridad, privacidad de los datos y observabilidad

comprobar
cerrar
API para desarrolladores de Gemini
comprobar

¿Quieres una infraestructura completamente administrada con herramientas y APIs de IA generativa de primer nivel?

cerrar
comprobar
Vertex AI
cerrar

¿Tu modelo requiere un kernel especializado, un SO heredado o tiene condiciones de licencia especiales?

cerrar
comprobar
Compute Engine
cerrar

Modelo

Google Cloud proporciona un conjunto de modelos de base de última generación a través de Vertex AI, incluido Gemini. También puedes implementar un modelo de terceros en Vertex AI Model Garden o autoalojarlo en GKE, Cloud Run o Compute Engine.

¿Generación de código?

cerrar
comprobar
Codey (Vertex AI)
cerrar

¿Generación de imágenes?

cerrar
comprobar
Imagen (Vertex AI)
cerrar

¿Generación de embeddings para la búsqueda, la clasificación o el agrupamiento en clústeres?

cerrar
comprobar
Embedding de texto (Vertex AI)
cerrar

Muy bien, quieres generar texto. ¿Quieres incluir imágenes o videos en tus instrucciones de texto? (multimodales)

cerrar
comprobar
Gemini (Vertex AI)
cerrar

Muy bien, solo instrucciones de texto. ¿Quieres aprovechar el modelo insignia más capaz de Google?

cerrar
comprobar
Gemini (Vertex AI)
cerrar

Implementa un modelo de código abierto en las siguientes plataformas: Vertex AI (Model Garden) GKE (HuggingFace)

Fundamentos

Para garantizar respuestas del modelo fundamentadas y precisas, te recomendamos que fundamentes tu aplicación de IA generativa con datos en tiempo real. Esto se denomina generación mejorada por recuperación (RAG).

Puedes implementar la conexión a tierra con tus propios datos en una base de datos de vectores, que es un formato óptimo para operaciones como la búsqueda de similitud. Google Cloud ofrece varias soluciones de bases de datos vectoriales para diferentes casos de uso.

Nota: También puedes fundamentar con bases de datos tradicionales (no vectoriales). Para ello, solo debes consultar una base de datos existente, como Cloud SQL o Firestore, y usar el resultado en el mensaje del modelo.

¿Quieres una solución sencilla, sin acceso a las incorporaciones subyacentes?

cerrar
comprobar
Vertex AI Search & Conversation
cerrar

¿Necesitas una búsqueda de vectores de baja latencia, una publicación a gran escala o quieres usar una base de datos de vectores especializada?

cerrar
comprobar
Vector Search de Vertex AI
cerrar

¿Se accede a tus datos de forma programática (OLTP)? ¿Ya usas una base de datos SQL?

cerrar
comprobar

¿Quieres usar modelos de Google AI directamente desde tu base de datos? ¿Necesitas una latencia baja?

comprobar
cerrar
cerrar

¿Tienes un gran conjunto de datos analíticos (OLAP)? ¿Requiere procesamiento por lotes y acceso frecuente a tablas de SQL por parte de humanos o secuencias de comandos (ciencia de datos)?

comprobar
BigQuery

Fundamentos con APIs

En lugar de (o además) usar tus propios datos para los fundamentos, muchos servicios en línea ofrecen APIs que puedes usar para recuperar datos de los fundamentos para mejorar la instrucción de tu modelo.
Crea, implementa y administra extensiones que conectan modelos de lenguaje grandes a las APIs de sistemas externos.
Explora una variedad de cargadores de documentos y integraciones de APIs para tus apps de IA generativa, desde YouTube hasta Google Scholar.
Si usas modelos alojados en Vertex AI, puedes fundamentar las respuestas del modelo con Vertex AI Search, la Búsqueda de Google o texto intercalado o en el archivo.

Comienza con la compilación

LangChain es un framework de código abierto para apps de IA generativa que te permite crear contexto en tus instrucciones y tomar medidas en función de la respuesta del modelo.

Consulta muestras de código para casos de uso populares y ejemplos de implementación de aplicaciones de IA generativa que sean seguras, eficientes, resilientes, de alto rendimiento y rentables.