Escolher a infraestrutura para seu aplicativo de IA generativa
Saiba quais produtos, frameworks e ferramentas são a melhor opção para criar seu aplicativo de IA generativa. Componentes comuns em um aplicativo de IA generativa hospedado na nuvem incluem:
- Hospedagem de aplicativos:computação para hospedar seu aplicativo. Seu aplicativo pode usar bibliotecas de cliente e SDKs do Google Cloud para se comunicar com diferentes produtos do Cloud.
- Hospedagem de modelos:hospedagem escalonável e segura para um modelo generativo.
- Modelo:modelo generativo para texto, chat, imagens, código, embeddings e multimodal.
- Solução de embasamento: fixe a saída do modelo em fontes de informações verificáveis e atualizadas.
- Banco de dados: armazena os dados do seu aplicativo. É possível reutilizar o banco de dados como solução de embasamento: aumente os comandos com a consulta SQL ou armazene os dados como embeddings vetoriais usando uma extensão como pgvector.
- Armazenamento:armazene arquivos como imagens, vídeos ou front-ends estáticos da Web. Também é possível usar o Storage para os dados brutos de embasamento (por exemplo, PDFs) que serão convertidos posteriormente em embeddings e armazenados em um banco de dados de vetores.
As seções a seguir mostram cada um desses componentes para ajudar você a escolher quais produtos do Google Cloud testar.
Infraestrutura de hospedagem de aplicativos
Escolha um produto para hospedar e disponibilizar a carga de trabalho do seu aplicativo, que chama o modelo generativo.
Primeiros passos:
Infraestrutura de hospedagem de modelos
O Google Cloud oferece várias maneiras de hospedar um modelo generativo, desde a plataforma principal da Vertex AI até a hospedagem personalizável e portátil no Google Kubernetes Engine.
Primeiros passos:
Modelo
O Google Cloud oferece um conjunto de modelos de fundação de última geração pela Vertex AI, incluindo o Gemini. Também é possível implantar um modelo de terceiros no Model Garden da Vertex AI ou na auto-hospedagem no GKE, no Cloud Run ou no Compute Engine.
Primeiros passos:
- Gemini
- Codey
- Imagen
- text-embedding
- Model Garden da Vertex AI (modelos de código aberto)
- Hugging Face Model Hub (modelos de código aberto)
Embasamento
Para garantir respostas de modelo informadas e precisas, baseie seu aplicativo de IA generativa com dados em tempo real. Isso é chamado de geração aumentada por recuperação (RAG, na sigla em inglês).
É possível implementar o embasamento com seus próprios dados em um banco de dados de vetores, que é um formato ideal para operações como a pesquisa por similaridade. O Google Cloud oferece várias soluções de banco de dados de vetores para diferentes casos de uso.
Observação: também é possível embasar com bancos de dados tradicionais (não vetoriais). Basta consultar um banco de dados, como o Cloud SQL ou o Firestore, e usar o resultado no comando do modelo.
Primeiros passos:
- Vertex AI Agent Builder (antigo Enterprise Search, Gen AI App Builder, Discovery Engine)
- Pesquisa de vetor (antigo Matching Engine)
- AlloyDB para PostgreSQL
- Cloud SQL
- BigQuery
Embasamento com APIs
Em vez (ou além de) usar seus próprios dados para embasamento, muitos serviços on-line oferecem APIs que podem ser usadas para recuperar dados de embasamento e ampliar o comando do modelo.
Extensões da Vertex AI (prévia particular)
Crie, implante e gerencie extensões que conectam modelos de linguagem grandes às APIs de sistemas externos.
Componentes da cadeia de Lang
Conheça vários carregadores de documentos e integrações de API para seus apps de IA generativa, do YouTube ao Google Acadêmico.
Embasamento na Vertex AI
Se você estiver usando modelos hospedados na Vertex AI, será possível embasar as respostas de modelo usando a Vertex AI para Pesquisa, a Pesquisa Google ou texto inline/infile.
Comece a criar
Configurar o ambiente de desenvolvimento para o Google Cloud
Configurar o LangChain
O LangChain é um framework de código aberto para apps de IA generativa que permite criar contexto nos seus comandos e agir com base na resposta do modelo.
Conferir exemplos de código e implantar aplicativos de exemplo
Conheça exemplos de código selecionados para casos de uso conhecidos e implante exemplos de apps de IA generativa que são seguros, eficientes, resilientes, de alto desempenho e econômicos.