Criar um aplicativo de IA generativa no Google Cloud

O Google Cloud oferece diversos produtos e ferramentas para criar aplicativos de IA generativa com escalonamento, segurança e observabilidade de nível empresarial.

Use esta página para conhecer as etapas de desenvolvimento de um aplicativo de IA generativa, escolher os melhores produtos e ferramentas para seu caso de uso e acessar a documentação necessária para começar.

Conheça os fundamentos do desenvolvimento de IA generativa

Aprender a desenvolver um aplicativo de IA generativa.

Saiba mais sobre os casos de uso comuns e os tipos de modelos da IA generativa.

Quando usar IA generativa ou IA tradicional

Identifique se a IA generativa, a IA tradicional ou uma combinação de ambas podem se adequar ao seu caso de uso de negócios.

Informações gerais do desenvolvimento de um aplicativo de IA generativa

Saiba como enfrentar os desafios de cada fase do desenvolvimento de um aplicativo de IA generativa.

Escolher a infraestrutura para seu aplicativo de IA generativa

Saiba quais produtos, frameworks e ferramentas são a melhor opção para criar seu aplicativo de IA generativa. Componentes comuns em um aplicativo de IA generativa hospedado na nuvem incluem:

Hospedagem de aplicativos:computação para hospedar seu aplicativo. Seu aplicativo pode usar bibliotecas de cliente e SDKs do Google Cloud para se comunicar com diferentes produtos do Cloud.
Hospedagem de modelos:hospedagem escalonável e segura para um modelo generativo.
Modelo:modelo generativo para texto, chat, imagens, código, embeddings e multimodal.
Solução de embasamento: fixe a saída do modelo em fontes de informações verificáveis e atualizadas.
Banco de dados: armazena os dados do seu aplicativo. É possível reutilizar o banco de dados como solução de embasamento: aumente os comandos com a consulta SQL e/ou armazene os dados como embeddings vetoriais usando uma extensão como pgvector.
Armazenamento:armazene arquivos como imagens, vídeos ou front-ends estáticos da Web. Também é possível usar o Storage para os dados brutos de embasamento (por exemplo, PDFs) que serão convertidos posteriormente em embeddings e armazenados em um banco de dados de vetores.

Diagrama com uma visão geral de alto nível de uma infraestrutura de hospedagem de aplicativos de IA generativa, incluindo um modelo e a respectiva infraestrutura de hospedagem de modelo, solução de embasamento, banco de dados, armazenamento e hospedagem de aplicativos.

As seções abaixo mostram cada um desses componentes para ajudar você a escolher quais produtos do Google Cloud testar.

Infraestrutura de hospedagem de aplicativos

Escolha um produto para hospedar e disponibilizar a carga de trabalho do seu aplicativo, que chama o modelo generativo.

Primeiros passos:

Infraestrutura de hospedagem de modelos

O Google Cloud oferece várias maneiras de hospedar um modelo generativo, desde a plataforma principal da Vertex AI até a hospedagem personalizável e portátil no Google Kubernetes Engine.

Árvore de decisão que orienta os usuários a escolher o modelo certo de hospedagem do serviço de nuvem com base nas prioridades e requisitos.

Primeiros passos:

Modelo

O Google Cloud oferece um conjunto de modelos de fundação de última geração pela Vertex AI, incluindo o Gemini. Também é possível implantar um modelo de terceiros no Model Garden da Vertex AI ou na auto-hospedagem no GKE, no Cloud Run ou no Compute Engine.

Árvore de decisão que orienta os usuários a escolher um serviço da Vertex AI para gerar texto ou código, com opções para usar embeddings de texto, imagens ou vídeo.

Primeiros passos:

Gemini
Codey
Imagen
text-embedding
Model Garden da Vertex AI (modelos de código aberto)
HuggingFace Model Hub (modelos de código aberto)

Altitude de referência

Para garantir respostas de modelo informadas e precisas, baseie seu aplicativo de IA generativa com dados em tempo real. Isso é chamado de geração aumentada por recuperação (RAG, na sigla em inglês).

É possível implementar o embasamento com seus próprios dados em um banco de dados de vetores, que é um formato ideal para operações como a pesquisa por similaridade. O Google Cloud oferece várias soluções de banco de dados de vetores para diferentes casos de uso.

Observação:também é possível embasar com bancos de dados tradicionais (não vetoriais). Basta consultar um banco de dados, como o Cloud SQL ou o Firestore, e usar o resultado no comando do modelo.

Árvore de decisão que orienta o usuário na escolha da solução certa de banco de dados de vetores para as necessidades dele.

Primeiros passos:

Vertex AI Agent Builder (antigo Enterprise Search, Gen AI App Builder, Discovery Engine)
Pesquisa de vetor (antigo Matching Engine)
AlloyDB para PostgreSQL
Cloud SQL
BigQuery

Embasamento com APIs

Em vez (ou além de) usar seus próprios dados para embasamento, muitos serviços on-line oferecem APIs que podem ser usadas para recuperar dados de embasamento e ampliar o comando do modelo.

Extensões da Vertex AI (prévia particular)

Crie, implante e gerencie extensões que conectam modelos de linguagem grandes às APIs de sistemas externos.

Componentes da cadeia de Lang

Conheça vários carregadores de documentos e integrações de API para seus apps de IA generativa, do YouTube ao Google Acadêmico.

Embasamento na Vertex AI

Se você estiver usando modelos hospedados na Vertex AI, será possível embasar as respostas de modelo usando a Vertex AI para Pesquisa, a Pesquisa Google ou texto inline/infile.

Comece a criar

Configurar o ambiente de desenvolvimento

Instale as ferramentas necessárias para criar um aplicativo de IA generativa no Google Cloud.

Instalar a CLI do Google Cloud

Ferramentas de linha de comando para configurar um ambiente de desenvolvimento local e interagir com as APIs do Cloud.

Instalar a extensão do Cloud Code no seu ambiente de desenvolvimento integrado

Confira as amostras e a documentação da API no seu ambiente de desenvolvimento integrado e acelere o desenvolvimento local do GKE e do Cloud Run.

Configurar a autenticação

Saiba como se autenticar nas APIs do Google Cloud do seu ambiente local e de cargas de trabalho hospedadas.

Configurar o LangChain

O LangChain é um framework de código aberto para apps de IA generativa que permite criar contexto nos seus comandos e agir com base na resposta do modelo.

Criar comandos e avaliar modelos

Aprenda estratégias de comandos e teste diferentes modelos.

Introdução ao design de prompts

Aprenda estratégias para criar comandos para diferentes tipos de dados, de texto e código a multimodais.

Vertex AI Studio

Saiba como projetar, testar e gerenciar comandos no Vertex AI Studio.

Amostras de solicitações da IA generativa

Confira dezenas de exemplos de comandos que abrangem casos de uso, incluindo classificação, idealização e resumo.

Ideação com modelos generativos na Vertex AI

Explorar exemplos de comandos para gerar, desenvolver e comunicar novas ideias.

Avaliação de modelos na Vertex AI

Use a Vertex AI para realizar avaliações baseadas em métricas ou avaliações lado a lado.

Amostras de código

Bifurque um exemplo no GitHub e comece a criar.

Chatbot da Web: responda a perguntas sobre a Google Store

Aprenda a criar um chatbot para resposta a perguntas baseado na Web usando o Vertex AI Agent Builder e o Firebase.

App de chat com Eventarc e Vertex AI

Aprenda a criar um aplicativo Python Flask simples que chama um modelo de base pré-treinado na Vertex AI.

Gerar uma campanha de marketing com o Gemini

Crie um app da Web para gerar ideias de campanha de marketing usando o Gemini na Vertex AI, no Cloud Run e no Streamlit.

App de respostas a perguntas com "O guia para profissionais de MLOps"

Saiba como usar a Vertex AI para Pesquisa e o LangChain para criar modelos de comandos para uma fonte de conhecimento verificável (artigo do Google Cloud).

Assistente de solicitação da API Weather: chamada de função com o Gemini

Saiba como implementar a chamada de função, o processo que usa um LLM para preencher um corpo de solicitação que pode ser enviado para uma API externa.

Air Assistant: app de recuperação de bancos de dados de IA generativa

App de exemplo para geração aumentada de recuperação com o AlloyDB para PostgreSQL e Vertex AI. (postagem do blog, codelab).

Orientações de arquitetura e soluções de início rápido

Recomendações e exemplos de aplicativos de IA generativa que são seguros, eficientes, resilientes, de alto desempenho e econômicos.