Dados de texto do Hello: configurar o projeto e o ambiente

Se você planeja usar o SDK da Vertex AI para Python, verifique se a conta de serviço que inicializa o cliente tem o papel do IAM do Agente de serviço da Vertex AI (roles/aiplatform.serviceAgent).

Nesta parte do tutorial, você configurará seu projeto do Google Cloud para usar a Vertex AI e um bucket do Cloud Storage que conterá os documentos para treinar seu modelo do AutoML.

Este tutorial tem várias páginas:

  1. Como configurar o projeto e o ambiente

  2. Como criar um conjunto de dados de classificação de texto .

  3. Como treinar um modelo do AutoML de classificação de textos.

  4. Implantar o modelo em um endpoint e fazer uma previsão.

  5. Como limpar o projeto.

Cada página pressupõe que você já tenha realizado as instruções das páginas anteriores do tutorial.

Configurar o projeto e o ambiente

Conclua as etapas a seguir antes de usar a funcionalidade da Vertex AI.

  1. No console do Google Cloud, acesse a página do seletor de projetos.

    Acessar o seletor de projetos

  2. Selecione ou crie um projeto do Google Cloud.

  3. Verifique se a cobrança está ativada para o seu projeto do Google Cloud.

  4. Abra o Cloud Shell. O Cloud Shell é um ambiente shell interativo para o Google Cloud que permite gerenciar projetos e recursos a partir do navegador da Web.
  5. Acesse o Cloud Shell
  6. No Cloud Shell, defina o projeto atual como o ID do projeto do Google Cloud e armazene-o na variável de shell projectid:
      gcloud config set project PROJECT_ID &&
      projectid=PROJECT_ID &&
      echo $projectid
    Substitua PROJECT_ID pela ID do seu projeto. Localize o ID do projeto no console do Google Cloud. Para mais informações, consulte Encontrar o ID do projeto.
  7. Ative as APIs IAM, Compute Engine, Notebooks, Cloud Storage, and Vertex AI:

    gcloud services enable iam.googleapis.com  compute.googleapis.com notebooks.googleapis.com storage.googleapis.com aiplatform.googleapis.com
  8. Atribua os papéis à sua Conta do Google. Execute uma vez o seguinte comando para cada um dos seguintes papéis do IAM: roles/aiplatform.user, roles/storage.admin

    gcloud projects add-iam-policy-binding PROJECT_ID --member="user:EMAIL_ADDRESS" --role=ROLE
    • Substitua PROJECT_ID pela ID do seu projeto.
    • Substitua EMAIL_ADDRESS pelo seu endereço de e-mail.
    • Substitua ROLE por cada papel individual.
  9. O papel do IAM do usuário da Vertex AI (roles/aiplatform.user) fornece acesso para usar todos os recursos na Vertex AI. O Administrador do Storage (roles/storage.admin) permite armazenar o conjunto de dados de treinamento do documento no Cloud Storage.

Crie um bucket do Cloud Storage e copie o conjunto de dados de amostra

Crie um bucket do Cloud Storage para armazenar os documentos que serão usados para treinar o modelo do AutoML.

  1. Abra o Cloud Shell.

  2. Defina a variável PROJECT_ID como o ID do seu projeto.

    export PROJECT_ID=PROJECT_ID
  3. Defina a variável BUCKET, que você usará para criar um bucket do Cloud Storage.

    export BUCKET=${PROJECT_ID}-lcm
  4. Crie um bucket do Cloud Storage na região us-central1 com a variável BUCKET.

    gsutil mb -p ${PROJECT_ID} -l us-central1 gs://${BUCKET}/
  5. Copie o conjunto de dados de treinamento de amostra happiness.csv para seu bucket.

    gsutil -m cp -R gs://cloud-ml-data/NL-classification/happiness.csv gs://${BUCKET}/text/

A seguir

Siga a próxima página deste tutorial para usar o console da Vertex AI para criar um conjunto de dados de classificação de textos e importar os documentos que você copiou para o bucket do Cloud Storage.