Escolha modelos e infraestrutura para a sua aplicação de IA generativa

Saiba que produtos, frameworks e ferramentas são mais adequados para criar a sua aplicação de IA generativa. A figura seguinte mostra os componentes comuns numa aplicação de IA generativa alojada na nuvem.
Diagrama de Venn que mostra os componentes de um sistema de IA generativa Diagrama de Venn que mostra os componentes de um sistema de IA generativa
  1. Alojamento de aplicações: use o Compute para alojar a sua aplicação. A sua aplicação pode usar as bibliotecas cliente e os SDKs do Google Cloud para comunicar com diferentes produtos do Google Cloud.

  2. Alojamento de modelos: alojamento escalável e seguro para um modelo generativo.

  3. Modelo: modelo generativo para texto, chat, imagens, código, incorporações e multimodal.

  4. Solução de fundamentação: ancorar o resultado do modelo a origens de informações atualizadas e verificáveis.

  5. Base de dados: armazene os dados da sua aplicação. Pode reutilizar a sua base de dados existente como solução de fundamentação, aumentando os comandos através de uma consulta SQL e/ou armazenando os seus dados como incorporações de vetores através de uma extensão como pgvector.

  6. Armazenamento: armazene ficheiros como imagens, vídeos ou front-ends Web estáticos. Também pode usar o armazenamento para os dados de base brutos (por exemplo, PDFs) que converte posteriormente em incorporações e armazena numa base de dados vetorial.

As secções abaixo explicam cada um desses componentes, ajudando a escolher os produtos Google Cloud que quer experimentar.

Infraestrutura de alojamento de aplicações

Escolha um produto para alojar e publicar a carga de trabalho da sua aplicação, que faz chamadas para o modelo generativo.

Quer uma infraestrutura sem servidores gerida?

fechar
verificar
Cloud Run
fechar

A sua aplicação pode ser contentorizada?

fechar
verificar
Kubernetes Engine
fechar

Infraestrutura de alojamento de modelos

O Google Cloud oferece várias formas de alojar um modelo generativo, desde a plataforma principal Vertex AI até ao alojamento personalizável e portátil no Google Kubernetes Engine.

Usar o Gemini e precisar de funcionalidades empresariais como escalabilidade, segurança, privacidade de dados e observabilidade

verificar
fechar
API Gemini Developer
verificar

Quer uma infraestrutura totalmente gerida com APIs e ferramentas de IA generativa de primeira classe?

fechar
verificar
Vertex AI
fechar

O seu modelo requer um kernel especializado, um SO antigo ou tem termos de licenciamento especiais?

fechar
verificar
Compute Engine
fechar

Modelo

O Google Cloud oferece um conjunto de modelos de base de última geração através da Vertex AI , incluindo o Gemini. Também pode implementar um modelo de terceiros no Vertex AI Model Garden ou alojá-lo de forma autónoma no GKE , no Cloud Run ou no Compute Engine.

Quer gerar código?

fechar
verificar
Codey (Vertex AI)
fechar

Quer gerar imagens?

fechar
verificar
Imagen (Vertex AI)
fechar

Está a gerar incorporações para pesquisa, classificação ou agrupamento?

fechar
verificar
text-embedding (Vertex AI)
fechar

OK, quer gerar texto. Quer incluir imagens ou vídeos nos seus comandos de texto? (multimodal)

fechar
verificar
Gemini (Vertex AI)
fechar

OK, apenas comandos de texto. Quer tirar partido do modelo principal mais avançado da Google?

fechar
verificar
Gemini (Vertex AI)
fechar

Implemente um modelo de código aberto para: Vertex AI (Model Garden) GKE (HuggingFace)

Fundamentação e RAG

Para garantir respostas informadas e precisas do modelo, fundamente a sua aplicação de IA generativa com dados em tempo real. Isto é denominado geração aumentada de recuperação (RAG).

Se quiser gerar conteúdo baseado em informações atualizadas da Internet, os modelos Gemini podem avaliar se o conhecimento do modelo é suficiente ou se é necessário o fundamento com a Pesquisa Google.

Pode implementar a fundamentação através de um índice dos seus dados com um motor de pesquisa. Muitos motores de pesquisa armazenam agora incorporações numa base de dados vetorial, que é um formato ideal para operações como a pesquisa de semelhanças.A Google Cloud oferece várias soluções de bases de dados vetoriais para diferentes exemplos de utilização.

Nota: pode fundamentar usando bases de dados não vetoriais consultando uma base de dados existente, como o Cloud SQL ou o Firestore, e pode usar o resultado da consulta no comando do modelo.

Quer uma solução otimizada totalmente gerida que suporte a maioria das origens de dados e impeça o acesso direto às incorporações subjacentes?

fechar
verificar
Vertex AI Search
fechar
Está a criar um motor de pesquisa para RAG

Quer criar um motor de pesquisa para RAG usando um orquestrador gerido com uma interface semelhante à do LlamaIndex?

fechar
verificar
Vertex AI RAG Engine
fechar
Pode usar uma arquitetura de referência para criar um motor de pesquisa personalizado e uma base de dados vetorial para exemplos de utilização de RAG.
fechar

Precisa de uma pesquisa vetorial de baixa latência, de publicação em grande escala ou de uma base de dados vetorial especializada e otimizada?

fechar
verificar
Vertex AI Vector Search
fechar

Os seus dados são acedidos de forma programática (OLTP)? Já usa uma base de dados SQL?

fechar
verificar

Quer usar os modelos de IA da Google diretamente a partir da sua base de dados? Precisa de baixa latência?

verificar
fechar
fechar

Tem um grande conjunto de dados analíticos (OLAP)? Requerem processamento em lote e acesso frequente a tabelas SQL por parte de humanos ou scripts (ciência de dados)?

verificar
BigQuery

Fundamentação com APIs

Em vez de (ou além de) usar os seus próprios dados para fundamentação, muitos serviços online oferecem APIs que pode usar para obter dados de fundamentação para aumentar o comando do modelo.
Crie, implemente e faça a gestão de extensões que ligam grandes modelos de linguagem às APIs de sistemas externos.
Explore uma variedade de carregadores de documentos e integrações de APIs para as suas apps de IA gen, desde o YouTube ao Google Scholar.
Se estiver a usar modelos alojados na Vertex AI, pode fundamentar as respostas do modelo com a Vertex AI Search, a Pesquisa Google ou texto inline/infile.

Começar a criar

O LangChain é um framework de código aberto para apps de IA generativa que lhe permite criar contexto nos seus comandos e tomar medidas com base na resposta do modelo.

Veja exemplos de código para exemplos de utilização populares e implemente exemplos de aplicações de IA generativa que sejam seguras, eficientes, resilientes, de elevado desempenho e rentáveis.