A Vertex AI é uma plataforma de machine learning (ML) que permite treinar, ajustar e implantar modelos de ML e aplicativos de IA. Para adicionar recursos de IA generativa a um serviço atual do Cloud Run, use a Vertex AI para acessar modelos de IA generativa, como Gemini, PaLM, Imagen, Codey e muito mais.
Neste guia, mostramos como usar as integrações do Cloud Run para configurar rapidamente o acesso à Vertex AI para seu serviço do Cloud Run.
Antes de começar
- Verifique se o serviço do Cloud Run com que você está integrando já está implantado.
- Consulte a página de preços da Vertex AI. A cobrança é feita com base nos recursos individuais usados na integração.
Funções exigidas
Para usar as integrações do Cloud Run, você ou seu administrador precisa conceder papéis do IAM em dois principais diferentes.
Clique para conferir os papéis necessários da sua Conta do Google
Para receber as permissões necessárias para usar as integrações do Cloud Run, peça ao administrador para conceder à sua Conta do Google os seguintes papéis do IAM no projeto:
- Desenvolvedor do Cloud Run (
roles/run.developer
) - Leitor do Compute (
roles/compute.viewer
) - Desenvolvedor de integrações sem servidor (
roles/runapps.developer
) - Operador de integrações sem servidor (
roles/runapps.operator
) - Usuário da conta de serviço (
roles/iam.serviceAccountUser
)
Clique para conferir os papéis necessários para a conta de serviço
Para implantar o serviço do Cloud Run, use a conta de serviço padrão do Compute Engine criada automaticamente ou especifique uma conta de serviço gerenciado pelo usuário. Essa conta de serviço precisa ter os seguintes papéis:
- Desenvolvedor do Cloud Run (
roles/run.developer
) - Gravador de bucket de registros (
roles/logging.bucketWriter
) - Usuário da conta de serviço (
roles/iam.serviceAccountUser
) - Administrador do Storage (
roles/storage.admin
) - Administrador de projetos do IAM (
roles/project.iamAdmin
)
Conectar um serviço à Vertex AI
Quando você usa as integrações do Cloud Run para se conectar à Vertex AI, a integração faz o seguinte:
- Permite que a API Vertex AI para o serviço do Cloud Run acesse os modelos de IA generativa da Vertex AI.
- Concede à identidade do serviço os papéis necessários.
É possível criar a integração usando o console ou a linha de comando.
Console
No console do Google Cloud, acesse a página do Cloud Run.
Clique no serviço na lista de serviços que você quer usar na integração.
Clique na guia Integrations.
Clique em Adicionar integração.
Clique em Vertex AI.
Use o nome padrão ou mude o nome para o valor que você quer usar.
Se for necessário ativar uma lista de APIs, clique em Ativar e aguarde a ativação das APIs.
Clique em Enviar e aguarde a conclusão da integração. Isso pode levar até um minuto.
Linha de comando
Atualizar para a versão mais recente da Google Cloud CLI:
gcloud components update
Criar a integração:
gcloud beta run integrations create \ --type=vertex-genai \ --service=SERVICE \
Substitua:
- SERVICE pelo nome do serviço do Cloud Run.
Se quiser, inclua a flag
--service-account=SERVICE_ACCOUNT_EMAIL
.Substitua SERVICE_ACCOUNT_EMAIL pelo endereço de e-mail da conta de serviço gerenciado pelo usuário (
PROJECT_NUMBER-compute@developer.gserviceaccount.com
) que é usado para implantar o serviço. Omita essa flag se quiser usar a conta de serviço padrão do Compute (SERVICE_ACCOUNT_ID@PROJECT_ID.iam.gserviceaccount.com
).Para continuar usando a conta de serviço especificada ao implantar integrações do Cloud Run, execute:
gcloud config set runapps/deployment-service-account
Aguarde um minuto. Durante esse tempo, o serviço do Cloud Run recebe permissões para chamar a API Vertex AI.
[vertex-genai] integration [vertex-genai-xxx] has been created successfully.
É possível verificar o status usando
gcloud beta run integrations describe
.
Conferir integrações da Vertex AI
Para conferir o status atual das integrações da Vertex AI para seu serviço do Cloud Run:
Console
No console do Google Cloud, acesse a página do Cloud Run.
Clique no serviço na lista de serviços que você quer usar na integração.
Clique na guia Integrations.
Localize a integração da Vertex AI em que você tem interesse e clique em Ver detalhes.
Linha de comando
Use o comando a seguir para ver uma lista de integrações disponíveis:
gcloud beta run integrations list
Usando um nome da lista retornada, exiba os detalhes:
gcloud beta run integrations describe INTEGRATION_NAME
Substitua INTEGRATION_NAME pelo nome da sua integração da Vertex AI.
Excluir integrações da Vertex AI
A exclusão de uma integração também exclui todos os recursos do Google Cloud associados a ela, mas não exclui o serviço do Cloud Run.
Para excluir uma integração da Vertex AI do seu serviço do Cloud Run:
Console
No console do Google Cloud, acesse a página do Cloud Run.
Clique no serviço do qual você quer excluir uma integração.
Clique na guia Integrations.
Localize a integração da Vertex AI do seu interesse e clique no ícone de reticências à direita da integração e, em seguida, em Excluir.
Linha de comando
Use o comando a seguir para obter uma lista de integrações disponíveis:
gcloud beta run integrations list
Usando um nome da lista retornada, exclua a integração:
gcloud beta run integrations delete INTEGRATION_NAME
Substitua:
- INTEGRATION_NAME pelo nome da sua integração da Vertex AI.
Se preferir, use as seguintes flags opcionais:
Opção Descrição --service-account
O endereço de e-mail da conta de serviço gerenciado pelo usuário para executar a operação de exclusão.
Acessar modelos de IA generativa da Vertex AI no seu código
Depois de concluir a integração, será possível enviar solicitações às APIs do modelo da Vertex AI e usar o Vertex AI Studio para testar rapidamente e e personalizar modelos de IA generativa no seu aplicativo.
Limitações
As integrações do Cloud Run são compatíveis apenas com determinadas regiões. Se você precisar usar uma região não compatível com as integrações do Cloud Run, consulte Locais da Vertex AI.