Escolha modelos e infraestrutura para a sua aplicação de IA generativa


Alojamento de aplicações: use o Compute para alojar a sua aplicação. A sua aplicação pode usar as bibliotecas cliente e os SDKs do Google Cloud para comunicar com diferentes produtos do Google Cloud.
Alojamento de modelos: alojamento escalável e seguro para um modelo generativo.
Modelo: modelo generativo para texto, chat, imagens, código, incorporações e multimodal.
Solução de fundamentação: ancorar o resultado do modelo a origens de informações atualizadas e verificáveis.
Base de dados: armazene os dados da sua aplicação. Pode reutilizar a sua base de dados existente como solução de fundamentação, aumentando os comandos através de uma consulta SQL e/ou armazenando os seus dados como incorporações de vetores através de uma extensão como pgvector.
Armazenamento: armazene ficheiros como imagens, vídeos ou front-ends Web estáticos. Também pode usar o armazenamento para os dados de base brutos (por exemplo, PDFs) que converte posteriormente em incorporações e armazena numa base de dados vetorial.
As secções abaixo explicam cada um desses componentes, ajudando a escolher os produtos Google Cloud que quer experimentar.
Infraestrutura de alojamento de aplicações
Escolha um produto para alojar e publicar a carga de trabalho da sua aplicação, que faz chamadas para o modelo generativo.
Infraestrutura de alojamento de modelos
O Google Cloud oferece várias formas de alojar um modelo generativo, desde a plataforma principal Vertex AI até ao alojamento personalizável e portátil no Google Kubernetes Engine.
Usar o Gemini e precisar de funcionalidades empresariais como escalabilidade, segurança, privacidade de dados e observabilidade
Quer uma infraestrutura totalmente gerida com APIs e ferramentas de IA generativa de primeira classe?
O seu modelo requer um kernel especializado, um SO antigo ou tem termos de licenciamento especiais?
Modelo
O Google Cloud oferece um conjunto de modelos de base de última geração através da Vertex AI , incluindo o Gemini. Também pode implementar um modelo de terceiros no Vertex AI Model Garden ou alojá-lo de forma autónoma no GKE , no Cloud Run ou no Compute Engine.
Está a gerar incorporações para pesquisa, classificação ou agrupamento?
OK, quer gerar texto. Quer incluir imagens ou vídeos nos seus comandos de texto? (multimodal)
OK, apenas comandos de texto. Quer tirar partido do modelo principal mais avançado da Google?
Implemente um modelo de código aberto para: Vertex AI (Model Garden) GKE (HuggingFace)
Fundamentação e RAG
Para garantir respostas informadas e precisas do modelo, fundamente a sua aplicação de IA generativa com dados em tempo real. Isto é denominado geração aumentada de recuperação (RAG).
Se quiser gerar conteúdo baseado em informações atualizadas da Internet, os modelos Gemini podem avaliar se o conhecimento do modelo é suficiente ou se é necessário o fundamento com a Pesquisa Google.
Pode implementar a fundamentação através de um índice dos seus dados com um motor de pesquisa. Muitos motores de pesquisa armazenam agora incorporações numa base de dados vetorial, que é um formato ideal para operações como a pesquisa de semelhanças.A Google Cloud oferece várias soluções de bases de dados vetoriais para diferentes exemplos de utilização.
Nota: pode fundamentar usando bases de dados não vetoriais consultando uma base de dados existente, como o Cloud SQL ou o Firestore, e pode usar o resultado da consulta no comando do modelo.
Quer uma solução otimizada totalmente gerida que suporte a maioria das origens de dados e impeça o acesso direto às incorporações subjacentes?
Quer criar um motor de pesquisa para RAG usando um orquestrador gerido com uma interface semelhante à do LlamaIndex?
Precisa de uma pesquisa vetorial de baixa latência, de publicação em grande escala ou de uma base de dados vetorial especializada e otimizada?
Os seus dados são acedidos de forma programática (OLTP)? Já usa uma base de dados SQL?
Quer usar os modelos de IA da Google diretamente a partir da sua base de dados? Precisa de baixa latência?
Tem um grande conjunto de dados analíticos (OLAP)? Requerem processamento em lote e acesso frequente a tabelas SQL por parte de humanos ou scripts (ciência de dados)?
Fundamentação com APIs
Extensões do Vertex AI (pré-visualização privada)
Componentes LangChain
Fundamentação na Vertex AI
Começar a criar
Configure o LangChain
O LangChain é um framework de código aberto para apps de IA generativa que lhe permite criar contexto nos seus comandos e tomar medidas com base na resposta do modelo.
Veja exemplos de código e implemente aplicações de exemplo
Veja exemplos de código para exemplos de utilização populares e implemente exemplos de aplicações de IA generativa que sejam seguras, eficientes, resilientes, de elevado desempenho e rentáveis.