Conecte-se aos modelos de IA generativa da Vertex AI

A Vertex AI é uma plataforma de machine learning (ML) que permite treinar, ajustar e implantar modelos de ML e aplicativos de IA. Para adicionar recursos de IA generativa a um serviço atual do Cloud Run, use a Vertex AI para acessar modelos de IA generativa, como Gemini, PaLM, Imagen, Codey e muito mais.

Neste guia, mostramos como usar as integrações do Cloud Run para configurar rapidamente o acesso à Vertex AI para seu serviço do Cloud Run.

Antes de começar

  • Verifique se o serviço do Cloud Run com que você está integrando já está implantado.
  • Consulte a página de preços da Vertex AI. A cobrança é feita com base nos recursos individuais usados na integração.

Funções exigidas

Para usar as integrações do Cloud Run, você ou seu administrador precisa conceder papéis do IAM em dois principais diferentes.

Clique para conferir os papéis necessários da sua Conta do Google

Para receber as permissões necessárias para usar as integrações do Cloud Run, peça ao administrador para conceder à sua Conta do Google os seguintes papéis do IAM no projeto:

Clique para conferir os papéis necessários para a conta de serviço

Para implantar o serviço do Cloud Run, use a conta de serviço padrão do Compute Engine criada automaticamente ou especifique uma conta de serviço gerenciado pelo usuário. Essa conta de serviço precisa ter os seguintes papéis:

Conectar um serviço à Vertex AI

Quando você usa as integrações do Cloud Run para se conectar à Vertex AI, a integração faz o seguinte:

  • Permite que a API Vertex AI para o serviço do Cloud Run acesse os modelos de IA generativa da Vertex AI.
  • Concede à identidade do serviço os papéis necessários.

É possível criar a integração usando o console ou a linha de comando.

Console

  1. No console do Google Cloud, acesse a página do Cloud Run.

    Acesse o Cloud Run

  2. Clique no serviço na lista de serviços que você quer usar na integração.

  3. Clique na guia Integrations.

  4. Clique em Adicionar integração.

  5. Clique em Vertex AI.

  6. Use o nome padrão ou mude o nome para o valor que você quer usar.

  7. Se for necessário ativar uma lista de APIs, clique em Ativar e aguarde a ativação das APIs.

  8. Clique em Enviar e aguarde a conclusão da integração. Isso pode levar até um minuto.

Linha de comando

  1. Atualizar para a versão mais recente da Google Cloud CLI:

    gcloud components update
  2. Criar a integração:

    gcloud beta run integrations create \
    --type=vertex-genai \
    --service=SERVICE \

    Substitua:

    • SERVICE pelo nome do serviço do Cloud Run.

    Se quiser, inclua a flag --service-account=SERVICE_ACCOUNT_EMAIL.

    • Substitua SERVICE_ACCOUNT_EMAIL pelo endereço de e-mail da conta de serviço gerenciado pelo usuário (PROJECT_NUMBER-compute@developer.gserviceaccount.com) que é usado para implantar o serviço. Omita essa flag se quiser usar a conta de serviço padrão do Compute (SERVICE_ACCOUNT_ID@PROJECT_ID.iam.gserviceaccount.com).

      Para continuar usando a conta de serviço especificada ao implantar integrações do Cloud Run, execute:

      gcloud config set runapps/deployment-service-account
  3. Aguarde um minuto. Durante esse tempo, o serviço do Cloud Run recebe permissões para chamar a API Vertex AI.

    [vertex-genai] integration [vertex-genai-xxx] has been created successfully.

    É possível verificar o status usando gcloud beta run integrations describe.

Conferir integrações da Vertex AI

Para conferir o status atual das integrações da Vertex AI para seu serviço do Cloud Run:

Console

  1. No console do Google Cloud, acesse a página do Cloud Run.

    Acesse o Cloud Run

  2. Clique no serviço na lista de serviços que você quer usar na integração.

  3. Clique na guia Integrations.

  4. Localize a integração da Vertex AI em que você tem interesse e clique em Ver detalhes.

Linha de comando

  1. Use o comando a seguir para ver uma lista de integrações disponíveis:

    gcloud beta run integrations list
  2. Usando um nome da lista retornada, exiba os detalhes:

    gcloud beta run integrations describe INTEGRATION_NAME

    Substitua INTEGRATION_NAME pelo nome da sua integração da Vertex AI.

Excluir integrações da Vertex AI

A exclusão de uma integração também exclui todos os recursos do Google Cloud associados a ela, mas não exclui o serviço do Cloud Run.

Para excluir uma integração da Vertex AI do seu serviço do Cloud Run:

Console

  1. No console do Google Cloud, acesse a página do Cloud Run.

    Acesse o Cloud Run

  2. Clique no serviço do qual você quer excluir uma integração.

  3. Clique na guia Integrations.

  4. Localize a integração da Vertex AI do seu interesse e clique no ícone de reticências à direita da integração e, em seguida, em Excluir.

Linha de comando

  1. Use o comando a seguir para obter uma lista de integrações disponíveis:

    gcloud beta run integrations list
  2. Usando um nome da lista retornada, exclua a integração:

    gcloud beta run integrations delete INTEGRATION_NAME

    Substitua:

    • INTEGRATION_NAME pelo nome da sua integração da Vertex AI.

    Se preferir, use as seguintes flags opcionais:

    Opção Descrição
    --service-account O endereço de e-mail da conta de serviço gerenciado pelo usuário para executar a operação de exclusão.

Acessar modelos de IA generativa da Vertex AI no seu código

Depois de concluir a integração, será possível enviar solicitações às APIs do modelo da Vertex AI e usar o Vertex AI Studio para testar rapidamente e e personalizar modelos de IA generativa no seu aplicativo.

Limitações

As integrações do Cloud Run são compatíveis apenas com determinadas regiões. Se você precisar usar uma região não compatível com as integrações do Cloud Run, consulte Locais da Vertex AI.