Provisionar GPUs e ativar as APIs pré-treinadas da Vertex AI

Cada serviço da Vertex AI exige recursos de computação diferentes, incluindo unidades de processamento gráfico (GPUs), conforme descrito em Requisitos de computação e planejamento de capacidade. Nesta página, descrevemos como provisionar recursos de GPU para executar cargas de trabalho de inteligência artificial (IA) e machine learning (ML) em um ambiente de GPU. Esta página também mostra como ativar as APIs pré-treinadas da Vertex AI no dispositivo isolado do Google Distributed Cloud (GDC) para começar a implementar os recursos da Vertex AI.

A maioria das tarefas para configurar recursos de GPU e ativar ou desativar APIs pré-treinadas da Vertex AI exige acesso de administrador. Se você não tiver as permissões necessárias, peça para o administrador ativar as GPUs e as APIs pré-treinadas da Vertex AI em seu nome.

A Vertex AI no dispositivo isolado do GDC inclui três APIs, uma para cada um dos modelos pré-treinados. Para saber mais sobre esses modelos pré-treinados, consulte a seguinte documentação:

Use o console do GDC para ativar, desativar e conferir os endpoints das APIs pré-treinadas da Vertex AI.

Antes de começar

Para receber as permissões necessárias para ativar APIs pré-treinadas, peça ao administrador do IAM da organização ou do projeto para conceder a você o papel de administrador do AI Platform (ai-platform-admin) no namespace do projeto.

Para informações sobre esse papel, consulte Preparar permissões do IAM. Para saber como conceder permissões a um assunto, consulte Conceder e revogar acesso.

Siga estas etapas para provisionar GPUs antes de ativar as APIs pré-treinadas:

  1. Configure um projeto para usar a Vertex AI.
  2. Verifique se o projeto tem a comunicação de entrada adequada configurada.
  3. Gerenciar cargas de trabalho de GPU.
  4. Faça login no console do GDC. Se não for possível fazer login, consulte Recuperar o dispositivo se o provedor de identidade não estiver disponível.

Ativar APIs pré-treinadas

É possível ativar as APIs pré-treinadas de OCR, Speech-to-Text e Vertex AI Translation usando o console do GDC.

Depois de atender aos pré-requisitos, siga estas etapas para ativar as APIs pré-treinadas:

  1. Faça login no console do GDC.
  2. No menu de navegação, clique em Vertex AI > APIs pré-treinadas.
  3. Na página APIs pré-treinadas, clique em Ativar em um serviço específico para ativar essa API.

  4. Na caixa de diálogo de confirmação, clique em Ativar. Uma mensagem de progresso é exibida.

A duração da ativação varia. Isso pode levar de 15 a 45 minutos.

Para conferir o status das APIs pré-treinadas, consulte o status e os endpoints do serviço.

Desativar APIs pré-treinadas

É possível desativar as APIs pré-treinadas de OCR, Speech-to-Text e Vertex AI Translation usando o console do GDC.

Depois de atender aos pré-requisitos, siga estas etapas para desativar as APIs pré-treinadas:

  1. Faça login no console do GDC.
  2. No menu de navegação, clique em Vertex AI > APIs pré-treinadas.
  3. Na página APIs pré-treinadas, clique em Desativar em um serviço específico para desativar essa API.

  4. Na caixa de diálogo de confirmação, digite disable no campo de texto para confirmar que você quer realizar essa ação. Depois, clique em Desativar. Uma mensagem de progresso vai aparecer.

Para conferir o status das APIs pré-treinadas, consulte o status e os endpoints do serviço.