Dados de texto do Hello: criar um conjunto de dados de classificação de texto e importar documentos

Use o console da AI Platform para criar um conjunto de dados de classificação de texto. Depois que seu conjunto de dados for criado, use o CSV que você copiou para o bucket do Cloud Storage para importar esses documentos para o conjunto de dados.

Este tutorial tem várias páginas:

  1. Como configurar o projeto e o ambiente.

  2. Como criar um conjunto de dados de classificação de texto.

  3. Como treinar um modelo do AutoML de classificação de textos.

  4. Implantar o modelo em um endpoint e fazer uma previsão.

  5. Como limpar o projeto.

Cada página pressupõe que você já tenha realizado as instruções das páginas anteriores do tutorial.

  1. Acesse o console da Vertex AI.

  2. Na página Primeiros passos com a Vertex AI, clique em Criar conjunto de dados.

  3. Especifique detalhes sobre o conjunto de dados.

    1. Especifique um nome para esse conjunto de dados, como text_classification_tutorial.

    2. Na seção Selecionar um tipo de dados e um objetivo, clique em Texto e selecione Classificação de texto (Rótulo único).

    3. Em Região, selecione us-central1.

      Neste tutorial, usamos us-central1, mas a Vertex AI é compatível com outras regiões, como europe-west4.

    4. Clique em Criar para criar o conjunto de dados vazio e importar documentos.

  4. Na página de importação, escolha Selecionar arquivos de importação do Cloud Storage e especifique o local do arquivo CSV do Cloud Storage. Dica: clique em Procurar, selecione o arquivo happiness.csv na caixa de diálogo Selecionar objeto e clique em Selecionar.

    Para este guia de início rápido, o arquivo CSV está emgs://${BUCKET}/text/happiness.csv. O bucket deste tutorial está na mesma região do conjunto de dados, mas é possível especificar arquivos em buckets de qualquer região.

  5. Mantenha a divisão de dados Padrão.

    A Vertex AI atribui documentos automaticamente a conjuntos de treinamento, validação e teste. Para mais informações, consulte Sobre divisões de dados para modelos do AutoML.

  6. Clique em Continuar para iniciar a importação.

    O processo de importação levará alguns minutos. Após a conclusão da importação, procure todos os documentos importados e os rótulos associados na guia Procurar do conjunto de dados.

A seguir

Siga a próxima página deste tutorial para iniciar um job de treinamento de modelo do AutoML.