Use o console da AI Platform para criar um conjunto de dados de classificação de texto. Depois que seu conjunto de dados for criado, use o CSV que você copiou para o bucket do Cloud Storage para importar esses documentos para o conjunto de dados.
Este tutorial tem várias páginas:
Como criar um conjunto de dados de classificação de texto.
Como treinar um modelo do AutoML de classificação de textos.
Cada página pressupõe que você já tenha realizado as instruções das páginas anteriores do tutorial.
Acesse o console da Vertex AI.
Na página Primeiros passos com a Vertex AI, clique em Criar conjunto de dados.
Especifique detalhes sobre o conjunto de dados.
Especifique um nome para esse conjunto de dados, como
text_classification_tutorial
.Na seção Selecionar um tipo de dados e um objetivo, clique em Texto e selecione Classificação de texto (Rótulo único).
Em Região, selecione us-central1.
Neste tutorial, usamos
us-central1
, mas a Vertex AI é compatível com outras regiões, comoeurope-west4
.Clique em Criar para criar o conjunto de dados vazio e importar documentos.
Na página de importação, escolha
Selecionar arquivos de importação do Cloud Storage e especifique o local do arquivo CSV do Cloud Storage. Dica: clique em Procurar, selecione o arquivohappiness.csv
na caixa de diálogo Selecionar objeto e clique em Selecionar.Para este guia de início rápido, o arquivo CSV está em
gs://${BUCKET}/text/happiness.csv
. O bucket deste tutorial está na mesma região do conjunto de dados, mas é possível especificar arquivos em buckets de qualquer região.Mantenha a divisão de dados Padrão.
A Vertex AI atribui documentos automaticamente a conjuntos de treinamento, validação e teste. Para mais informações, consulte Sobre divisões de dados para modelos do AutoML.
Clique em Continuar para iniciar a importação.
O processo de importação levará alguns minutos. Após a conclusão da importação, procure todos os documentos importados e os rótulos associados na guia Procurar do conjunto de dados.
A seguir
Siga a próxima página deste tutorial para iniciar um job de treinamento de modelo do AutoML.