IA generativa | Generative AI

Esta página se ha traducido con Cloud Translation API.

Elige los modelos y la infraestructura para tu aplicación de IA generativa

Descubre qué productos, frameworks y herramientas son los más adecuados para crear tu aplicación de IA generativa. En la siguiente figura se muestran los componentes habituales de una aplicación de IA generativa alojada en la nube.

Diagrama de Venn que muestra los componentes de un sistema de IA generativa

Hosting de aplicaciones: Compute para alojar tu aplicación. Tu aplicación puede usar las bibliotecas de cliente y los SDKs de Google Cloud para comunicarse con diferentes productos de Cloud.
Alojamiento de modelos: alojamiento escalable y seguro para un modelo generativo.
Modelo: modelo generativo para texto, chat, imágenes, código, incrustaciones y multimodal.
Solución de grounding: ancla la salida del modelo a fuentes de información verificables y actualizadas.
Base de datos: almacena los datos de tu aplicación. Puedes reutilizar tu base de datos como solución de fundamentación aumentando las peticiones mediante consultas SQL o almacenando tus datos como embeddings de vectores con una extensión como pgvector.
Almacenamiento: almacena archivos como imágenes, vídeos o front-ends web estáticos. También puedes usar Storage para los datos de base sin procesar (por ejemplo, PDFs) que luego conviertes en inserciones y almacenas en una base de datos de vectores.

En las secciones que se indican a continuación, se explican cada uno de esos componentes para ayudarte a elegir qué productos de Google Cloud probar.

Infraestructura de alojamiento de aplicaciones

Elige un producto para alojar y servir tu carga de trabajo de la aplicación, que hace llamadas al modelo generativo.

¿Quieres una infraestructura sin servidor gestionada?

cerrar

check

Cloud Run

cerrar

¿Se puede poner tu aplicación en contenedores?

cerrar

check

Kubernetes Engine

cerrar

Compute Engine

Infraestructura de alojamiento del modelo

Google Cloud ofrece varias formas de alojar un modelo generativo, desde la plataforma estrella Vertex AI hasta el alojamiento personalizable y portátil en Google Kubernetes Engine.

Usas Gemini y necesitas funciones empresariales como escalabilidad, seguridad, privacidad de los datos y observabilidad

check

cerrar

API para desarrolladores de Gemini

check

¿Quieres una infraestructura totalmente gestionada con herramientas y APIs de IA generativa de primera clase?

cerrar

check

Vertex AI

cerrar

¿Tu modelo requiere un kernel especializado, un SO antiguo o tiene términos de licencia especiales?

cerrar

check

Compute Engine

cerrar

Kubernetes Engine

Modelo

Google Cloud ofrece un conjunto de modelos fundacionales de vanguardia a través de Vertex AI , incluido Gemini. También puedes desplegar un modelo de terceros en Model Garden de Vertex AI o en un alojamiento propio en GKE , Cloud Run o Compute Engine.

¿Generar código?

cerrar

check

Codey (Vertex AI)

cerrar

¿Quieres generar imágenes?

cerrar

check

Imagen (Vertex AI)

cerrar

¿Quieres generar embeddings para búsquedas, clasificaciones o agrupaciones?

cerrar

check

text-embedding (Vertex AI)

cerrar

Vale, quieres generar texto. ¿Quieres incluir imágenes o vídeos en tus peticiones de texto? (multimodal)

cerrar

check

Gemini (Vertex AI)

cerrar

De acuerdo, solo peticiones de texto. ¿Quieres aprovechar el modelo insignia más potente de Google?

cerrar

check

Gemini (Vertex AI)

cerrar

Implementa un modelo de código abierto en: Vertex AI (Model Garden) GKE (Hugging Face)

Fundamentación y RAG

Para asegurarte de que las respuestas del modelo sean precisas y estén bien fundamentadas, basa tu aplicación de IA generativa en datos en tiempo real. Este proceso se denomina generación aumentada por recuperación (RAG).

Si quieres generar contenido basado en información actualizada de Internet, los modelos de Gemini pueden evaluar si el conocimiento del modelo es suficiente o si es necesario basarse en la Búsqueda de Google.

Puedes implementar la fundamentación usando un índice de tus datos con un buscador. Muchos buscadores almacenan ahora los embeddings en una base de datos de vectores, que es un formato óptimo para operaciones como la búsqueda de similitud. Google Cloud ofrece varias soluciones de bases de datos de vectores para diferentes casos prácticos.

Nota: Puedes fundamentar la información usando bases de datos no vectoriales consultando una base de datos como Cloud SQL o Firestore, y puedes usar el resultado de la consulta en la petición de tu modelo.

¿Quieres una solución optimizada y totalmente gestionada que admita la mayoría de las fuentes de datos y que impida el acceso directo a las inserciones subyacentes?

cerrar

check

Vertex AI Search

cerrar

Estás creando un buscador para RAG

¿Quieres crear un motor de búsqueda para RAG usando un orquestador gestionado con una interfaz similar a LlamaIndex?

cerrar

check

Motor de RAG de Vertex AI

cerrar

Puedes usar una arquitectura de referencia para crear un buscador personalizado y una base de datos de vectores para casos prácticos de RAG.

cerrar

¿Necesitas una búsqueda vectorial de baja latencia, un servicio a gran escala o una base de datos de vectores especializada y optimizada?

cerrar

check

Búsqueda de Vectores de Vertex AI

cerrar

¿Se accede a sus datos de forma programática (OLTP)? ¿Ya usas una base de datos SQL?

cerrar

check

¿Quieres usar modelos de IA de Google directamente desde tu base de datos? ¿Necesitas una latencia baja?

check

cerrar

AlloyDB Cloud SQL

cerrar

¿Tiene un gran conjunto de datos analíticos (OLAP)? ¿Necesitas procesamiento por lotes y acceso frecuente a tablas SQL por parte de personas o secuencias de comandos (ciencia de datos)?

check

BigQuery

Fundamentación con APIs

En lugar de usar tus propios datos para fundamentar las respuestas (o además de hacerlo), muchos servicios online ofrecen APIs que puedes usar para obtener datos de fundamentación y mejorar la petición de tu modelo.

Empezar a desarrollar

Configurar un entorno de desarrollo para Google Cloud

Configurar LangChain

LangChain es un framework de código abierto para aplicaciones de IA generativa que te permite añadir contexto a tus peticiones y tomar medidas en función de la respuesta del modelo.

Ver códigos de ejemplo e implementar aplicaciones de ejemplo

Consulta ejemplos de código para casos prácticos habituales y ejemplos de implementación de aplicaciones de IA generativa que sean seguras, eficientes, resilientes, de alto rendimiento y rentables.

Elige los modelos y la infraestructura para tu aplicación de IA generativa

Infraestructura de alojamiento de aplicaciones

Infraestructura de alojamiento del modelo

Modelo

Fundamentación y RAG

Fundamentación con APIs

Extensiones de Vertex AI (vista preliminar privada)

Componentes de LangChain

Grounding en Vertex AI

Empezar a desarrollar

Configurar un entorno de desarrollo para Google Cloud

Configurar LangChain

Ver códigos de ejemplo e implementar aplicaciones de ejemplo