Migrar do Gemini no Google AI para a Vertex AI

Se você é iniciante no Gemini, usar os guias de início rápido é a maneira mais rápida de começar.

No entanto, à medida que suas soluções de IA generativa se desenvolverem, talvez você precise de uma plataforma para criar e implantar aplicativos e soluções de IA generativa de ponta a ponta. O Google Cloud oferece um ecossistema abrangente de ferramentas para permitir que os desenvolvedores aproveitem o poder da IA generativa, desde os estágios iniciais de desenvolvimento de aplicativos até a implantação e hospedagem de aplicativos e gerenciamento de dados complexos em escala.

A plataforma da Vertex AI do Google Cloud oferece um conjunto de ferramentas de MLOps que simplificam o uso, a implantação e o monitoramento de modelos de IA para eficiência e confiabilidade. Além disso, as integrações com bancos de dados, ferramentas de DevOps, geração de registros, monitoramento e IAM fornecem uma abordagem holística para gerenciar todo o ciclo de vida da IA generativa.

Casos de uso comuns das ofertas do Google Cloud

Aqui estão alguns exemplos de casos de uso comuns adequados para as ofertas do Google Cloud.

  • Produza seus apps e soluções. Produtos como o Cloud Run functions e o Cloud Run permitem que você implante apps com escalonamento, segurança e privacidade de nível empresarial. Encontre mais detalhes sobre segurança e privacidade no guia Segurança, privacidade e conformidade na nuvem no Google Cloud.
  • Use a Vertex AI para desenvolver recursos completos de MLOps, desde o ajuste até a pesquisa de similaridade vetorial e pipelines de ML.
  • Acione sua chamada do LLM com arquitetura orientada a eventos com o Cloud Functions ou o Cloud Run.
  • Monitore o uso do aplicativo com o Cloud Logging e o BigQuery.
  • Armazene seus dados com segurança de nível empresarial e em escala com serviços como BigQuery, Cloud Storage e Cloud SQL.
  • Faça a geração de recuperação aumentada (RAG, na sigla em inglês) usando dados na nuvem com o BigQuery ou o Cloud Storage.
  • Criar e programar pipelines de dados. É possível programar jobs usando o Cloud Scheduler.
  • Aplique LLMs aos seus dados na nuvem. Se você armazenar dados no Cloud Storage ou no BigQuery, será possível solicitar LLMs nesses dados. Por exemplo, para extrair informações, resumir ou fazer perguntas sobre elas.
  • Use as políticas de governança/residência de dados do Google Cloud para gerenciar o ciclo de vida dos seus dados.

Diferenças entre a IA do Google e a Vertex AI

A seguinte tabela resume as principais diferenças entre a IA do Google e a Vertex AI para ajudar você a decidir qual é a opção ideal para seu caso de uso:

Recursos API Gemini da IA do Google API Gemini da Vertex AI
Modelos do Gemini Gemini 1.5 Flash, Gemini 1.5 Pro, Gemini 1.0 Pro, Gemini 1.0 Pro Vision (descontinuado) Gemini 1.5 Flash, Gemini 1.5 Pro, Gemini 1.0 Pro, Gemini 1.0 Pro Vision, Gemini 1.0 Ultra e Gemini 1.0 Ultra Vision
Inscreva-se Conta do Google Conta do Google Cloud (com contrato e faturamento de termos)
Authentication Chave de API Conta de serviço do Google Cloud
Playground de interface do usuário o Google AI Studio; Vertex AI Studio
API e SDK SDKs de servidor e cliente para dispositivos móveis/Web
  • Servidor: Python, Node.js, Go, Dart
  • Cliente para dispositivos móveis/Web: Android (Kotlin/Java), Swift, Web, Flutter
SDKs de servidor e cliente para dispositivos móveis/Web
  • Servidor: Python, Node.js, Go, Java
  • Cliente para dispositivos móveis/Web (pela Vertex AI para Firebase): Android (Kotlin/Java), Swift, Web, Flutter
Uso sem custo da API e do SDK Sim, quando aplicável Crédito de US$ 300 do Google Cloud para novos usuários
Cota (solicitações por minuto) Varia de acordo com o modelo e o plano de preços (consulte as informações detalhadas) Varia de acordo com o modelo e a região (consulte as informações detalhadas)
Suporte empresarial Não Chave de criptografia do cliente
Nuvem privada virtual
Residência de dados
Transparência no acesso
Infraestrutura escalonável para hospedagem de aplicativos
Bancos de dados e armazenamento de dados
MLOps Não MLOps completas na Vertex AI (exemplos: avaliação de modelo, monitoramento de modelos, registro de modelos)

Migrar para a Vertex AI

Nesta seção, mostramos como migrar do Gemini na IA do Google para a Vertex AI.

Considerações ao migrar

Faça as seguintes considerações ao migrar:

Comece a usar o Vertex AI Studio

O processo de migração para a Vertex AI é diferente, dependendo se você já tem uma conta do Google Cloud ou é iniciante no Google Cloud.

Para saber como migrar para a Vertex AI, clique em uma das guias a seguir, dependendo do status da sua conta do Google Cloud:

Já usa o Google Cloud

  1. Faça login no Google AI Studio.
  2. Na parte inferior do painel de navegação à esquerda, clique em Criar com a Vertex AI no Google Cloud.

    A página Testar a Vertex AI e o Google Cloud gratuitamente abre.

  3. Clique em Concordar e continuar.

    A caixa de diálogo Começar a usar o Vertex AI Studio é exibida.

  4. Para ativar as APIs necessárias para executar a Vertex AI, clique em Concordar e continuar.

    O console da Vertex AI é exibido. Para saber como migrar seus dados do Google AI Studio, consulte Migrar comandos.

Ainda não conhece o Google Cloud?

  1. Faça login no Google AI Studio.
  2. Na parte inferior do painel de navegação à esquerda, clique em Criar com a Vertex AI no Google Cloud.

    A página Criar uma conta para começar a usar o Google Cloud abre.

  3. Clique em Concordar e continuar.

    A página Vamos confirmar sua identidade é exibida.

  4. Clique em Começar gratuitamente.

    A caixa de diálogo Começar a usar o Vertex AI Studio é exibida.

  5. Para ativar as APIs necessárias para executar a Vertex AI, clique em Concordar e continuar.

  6. Opcional: para saber como migrar seus dados do Google AI Studio, consulte "Migrar comandos" nesta página.

Python: migrar para a API Vertex AI Gemini

As seções a seguir mostram snippets de código que ajudam você a migrar seu código Python para usar a API Vertex AI Gemini.

Configuração do SDK da Vertex AI para Python

Na Vertex AI, você não precisa de uma chave de API. Em vez disso, o Gemini na Vertex AI é gerenciado usando o acesso ao IAM, que controla a permissão de um usuário, um grupo ou uma conta de serviço para chamar a API Gemini usando o SDK da Vertex AI.

muitos modos de autenticação, o método mais fácil de autenticação em um ambiente de desenvolvimento é instalar a CLI do Google Cloud e usar sua credenciais de usuário para fazer login na CLI.

Para fazer chamadas de inferência para a Vertex AI, você também precisa verificar se sua conta de usuário ou de serviço tem a função do usuário da Vertex AI.

Exemplo de código para instalar o cliente

IA do Google Vertex AI
# To install the Python SDK, use this CLI command:
# pip install google-generativeai

import google.generativeai as genai
from google.generativeai import GenerativeModel

API_KEY="API_KEY"
genai.configure(api_key=API_KEY)
        
# To install the Python SDK, use this CLI command:
# pip install google-cloud-aiplatform

import vertexai
from vertexai.generative_models import GenerativeModel, Image

PROJECT_ID = "PROJECT_ID"
REGION = "REGION"  # e.g. us-central1
vertexai.init(project=PROJECT_ID, location=REGION)
        

Exemplo de código para gerar texto com base em um comando

IA do Google Vertex AI
model = GenerativeModel("gemini-1.5-flash")

response = model.generate_content("The opposite of hot is")
print(response.text) #  The opposite of hot is cold.
        
model = GenerativeModel("gemini-1.5-flash")

response = model.generate_content("The opposite of hot is")
print(response.text) #  The opposite of hot is cold.
        

Exemplo de código para gerar texto com base em texto e imagem

IA do Google Vertex AI
import PIL.Image

multimodal_model = GenerativeModel("gemini-1.5-flash")

image = PIL.Image.open("image.jpg")

response = multimodal_model.generate_content(["What is this picture?", image])
print(response.text) # A cat is shown in this picture.
        
multimodal_model = GenerativeModel("gemini-1.5-flash")

image = Image.load_from_file("image.jpg")

response = multimodal_model.generate_content(["What is shown in this image?", image])

print(response.text) # A cat is shown in this picture.
        

Exemplo de código para gerar um chat multiturno

IA do Google Vertex AI
model = GenerativeModel("gemini-1.5-flash")

chat = model.start_chat()

print(chat.send_message("How are you?").text)
print(chat.send_message("What can you do?").text)
        
model = GenerativeModel("gemini-1.5-flash")

chat = model.start_chat()

print(chat.send_message("How are you?").text)
print(chat.send_message("What can you do?").text)
        

Migrar comandos para o Vertex AI Studio

Os dados de comandos do Google AI Studio são salvos em uma pasta do Google Drive. Nesta seção, mostramos como migrar seus comandos para o Vertex AI Studio.

  1. Abra o Google Drive.
  2. Acesse a pasta AI_Studio em que os comandos estão armazenados. Localização das solicitações no Google Drive
  3. Baixe os comandos do Google Drive para um diretório local.

  4. Abra o Vertex AI Studio no console do Google Cloud.

  5. No menu da Vertex AI, clique em Comandos salvos.

  6. Clique em Importar comando.

  7. No campo Arquivo de comandos, clique em Procurar e selecione um comando no seu diretório local.

    Para fazer upload em massa dos comandos, é necessário combinar manualmente os comandos em um único arquivo JSON.

  8. Clique em Fazer upload.

    As solicitações são enviadas para a guia Meus comandos.

Fazer upload de dados de treinamento para o Vertex AI Studio

Para migrar seus dados de treinamento para a Vertex AI, você precisa fazer upload dos dados para um bucket do Cloud Storage. Para mais informações, consulte Introdução ao ajuste .

Excluir chaves de API não usadas

Se você não precisar mais usar sua chave da API Gemini da IA do Google, siga as práticas recomendadas de segurança e exclua a chave.

Para excluir uma chave de API:

  1. Abra a página Credenciais da API Google Cloud.

  2. Encontre a chave de API que você quer excluir e clique no ícone Ações.

  3. Selecione Excluir chave de API.

  4. No modal Excluir credencial, selecione Excluir.

    A remoção de uma chave de API leva alguns minutos para ser propagada. Após o término da propagação, todo tráfego que usar a chave de API excluída será recusado.

A seguir