Criar um aplicativo de IA generativa no Google Cloud
O Google Cloud oferece diversos produtos e ferramentas para criar aplicativos de IA generativa com escalonamento, segurança e observabilidade de nível empresarial.
Use esta página para conhecer as etapas de desenvolvimento de um aplicativo de IA generativa, escolher os melhores produtos e ferramentas para seu caso de uso e acessar a documentação necessária para começar.
Conheça os fundamentos do desenvolvimento de IA generativa
Quando usar IA generativa ou IA tradicional
Informações gerais do desenvolvimento de um aplicativo de IA generativa
Escolher a infraestrutura para seu aplicativo de IA generativa
Saiba quais produtos, frameworks e ferramentas são a melhor opção para criar seu aplicativo de IA generativa. Componentes comuns em um aplicativo de IA generativa hospedado na nuvem incluem:
- Hospedagem de aplicativos:computação para hospedar seu aplicativo. Seu aplicativo pode usar bibliotecas de cliente e SDKs do Google Cloud para se comunicar com diferentes produtos do Cloud.
- Hospedagem de modelos:hospedagem escalonável e segura para um modelo generativo.
- Modelo:modelo generativo para texto, chat, imagens, código, embeddings e multimodal.
- Solução de embasamento: fixe a saída do modelo em fontes de informações verificáveis e atualizadas.
- Banco de dados: armazena os dados do seu aplicativo. É possível reutilizar o banco de dados como solução de embasamento: aumente os comandos com a consulta SQL e/ou armazene os dados como embeddings vetoriais usando uma extensão como pgvector.
- Armazenamento:armazene arquivos como imagens, vídeos ou front-ends estáticos da Web. Também é possível usar o Storage para os dados brutos de embasamento (por exemplo, PDFs) que serão convertidos posteriormente em embeddings e armazenados em um banco de dados de vetores.
As seções abaixo mostram cada um desses componentes para ajudar você a escolher quais produtos do Google Cloud testar.
Infraestrutura de hospedagem de aplicativos
Primeiros passos:
Infraestrutura de hospedagem de modelos
Primeiros passos:
Modelo
Primeiros passos:
- Gemini
- Codey
- Imagen
- text-embedding
- Model Garden da Vertex AI (modelos de código aberto)
- HuggingFace Model Hub (modelos de código aberto)
Altitude de referência
Para garantir respostas de modelo informadas e precisas, baseie seu aplicativo de IA generativa com dados em tempo real. Isso é chamado de geração aumentada por recuperação (RAG, na sigla em inglês).
É possível implementar o embasamento com seus próprios dados em um banco de dados de vetores, que é um formato ideal para operações como a pesquisa por similaridade. O Google Cloud oferece várias soluções de banco de dados de vetores para diferentes casos de uso.
Observação:também é possível embasar com bancos de dados tradicionais (não vetoriais). Basta consultar um banco de dados, como o Cloud SQL ou o Firestore, e usar o resultado no comando do modelo.
Primeiros passos:
- Vertex AI Agent Builder (antigo Enterprise Search, Gen AI App Builder, Discovery Engine)
- Pesquisa de vetor (antigo Matching Engine)
- AlloyDB para PostgreSQL
- Cloud SQL
- BigQuery
Embasamento com APIs
Extensões da Vertex AI (prévia particular)
Componentes da cadeia de Lang
Embasamento na Vertex AI
Comece a criar
Configurar o ambiente de desenvolvimento
Instalar a CLI do Google Cloud
Instalar a extensão do Cloud Code no seu ambiente de desenvolvimento integrado
Configurar a autenticação
Configurar o LangChain
Criar comandos e avaliar modelos
Introdução ao design de prompts
Vertex AI Studio
Amostras de solicitações da IA generativa
Ideação com modelos generativos na Vertex AI
Avaliação de modelos na Vertex AI
Amostras de código
Chatbot da Web: responda a perguntas sobre a Google Store
Aprenda a criar um chatbot para resposta a perguntas baseado na Web usando o Vertex AI Agent Builder e o Firebase.
App de chat com Eventarc e Vertex AI
Aprenda a criar um aplicativo Python Flask simples que chama um modelo de base pré-treinado na Vertex AI.
Gerar uma campanha de marketing com o Gemini
Crie um app da Web para gerar ideias de campanha de marketing usando o Gemini na Vertex AI, no Cloud Run e no Streamlit.
App de respostas a perguntas com "O guia para profissionais de MLOps"
Saiba como usar a Vertex AI para Pesquisa e o LangChain para criar modelos de comandos para uma fonte de conhecimento verificável (artigo do Google Cloud).
Assistente de solicitação da API Weather: chamada de função com o Gemini
Saiba como implementar a chamada de função, o processo que usa um LLM para preencher um corpo de solicitação que pode ser enviado para uma API externa.
Air Assistant: app de recuperação de bancos de dados de IA generativa
App de exemplo para geração aumentada de recuperação com o AlloyDB para PostgreSQL e Vertex AI. (postagem do blog, codelab).
Orientações de arquitetura e soluções de início rápido
Infraestrutura para um aplicativo de IA generativa com capacidade de RAG usando a Vertex AI
Use esta arquitetura de referência para projetar a infraestrutura necessária a fim de executar um aplicativo de IA generativa com geração aumentada de recuperação (RAG) usando a Vertex AI e o AlloyDB para PostgreSQL.
Infraestrutura para um aplicativo de IA generativa com capacidade para RAG usando o GKE
Use esta arquitetura de referência para projetar a infraestrutura necessária a fim de executar um aplicativo de IA generativa com geração aumentada de recuperação (RAG) usando o GKE, o Cloud SQL e ferramentas de código aberto, como Ray, Hugging Face e LangChain.
Planejar armazenamento para cargas de trabalho de IA e ML no Google Cloud
Neste documento, apresentamos orientações de design sobre como usar e integrar as várias opções de armazenamento oferecidas pelo Google Cloud para as principais cargas de trabalho de IA e ML.
Solução de início rápido: resumo de documentos
Implante um aplicativo de amostra com um clique para resumir documentos longos com a Vertex AI.
Solução de início rápido: IA generativa RAG com Cloud SQL
Implantar um aplicativo de amostra com um clique que usa embeddings vetoriais armazenados no Cloud SQL para melhorar a precisão das respostas de um aplicativo de chat.
Soluções de início rápido: base de conhecimento de IA generativa
Implante um aplicativo de amostra com um clique que extraia pares de perguntas e respostas de um conjunto de documentos com um pipeline que aciona o aplicativo quando um documento é enviado.