Dados tabulares: criar um conjunto de dados e treinar um modelo de classificação do AutoML

Use o console do Google Cloud para criar um conjunto de dados tabular e treinar um modelo de classificação.

Criar um conjunto de dados tabular

  1. No Console do Google Cloud, na seção da Vertex AI, acesse a página Conjuntos de dados.

    Acessar a página "Conjuntos de dados"

  2. Clique em Criar na barra de botões para criar um novo conjunto de dados.

  3. Insira Structured_AutoML_Tutorial como o nome do conjunto de dados e selecione a guia Tabular.

  4. Selecione o objetivo Regressão/Classificação.

    Deixe a Região definida como us-central1.

  5. Clique em Criar para criar o conjunto de dados.

    Neste tutorial, você usará um conjunto de dados bancários publicamente disponível e hospedado no Cloud Storage.

  6. Em Selecionar uma fonte de dados, clique em Selecionar arquivos CSV do Cloud Storage.

  7. Em Importar caminho do arquivo, insira cloud-ml-tables-data/bank-marketing.csv.

  8. Clique em Continuar.

Analisar o conjunto de dados

A seção de análise permite visualizar mais informações sobre o conjunto de dados, como valores ausentes ou NULL.

Como nosso conjunto de dados está formatado corretamente para este tutorial, você não precisa fazer nada nesta página e pode pular esta seção.

  1. Opcional. Clique em Gerar estatísticas para visualizar o número de valores ausentes ou NULL no conjunto de dados. Isso pode levar 10 minutos ou mais.

  2. Opcional. Clique em uma das colunas de atributos para saber mais sobre os valores de dados.

Treine um modelo de classificação do AutoML

  1. Clique em Treinar novo modelo.

  2. Selecione Outras.

  3. No painel Método de treinamento, confirme se o conjunto de dados criado anteriormente está selecionado para o campo Conjunto de dados.

  4. No campo Objetivo, selecione Classificação.

  5. Confirme se o método de treinamento do AutoML está selecionado.

  6. Clique em Continuar.

  7. No painel Detalhes do modelo, selecione Depósito para a coluna de destino e clique em Continuar.

    A coluna de objetivo é o que estamos treinando para prever. Para o conjunto de dados bank-marketing.csv, a coluna Deposit indica se o cliente comprou um depósito de termo (2 = sim, 1 = não).

    O painel Opções de treinamento oferece uma oportunidade de adicionar atributos e transformar os dados da coluna. Se nenhuma coluna for selecionada, todas as colunas sem segmentação serão usadas como recursos para treinamento por padrão. Esse conjunto de dados está pronto para uso. Portanto, não é necessário aplicar transformações.

  8. Clique em Continuar.

  9. No painel Computação e preços, insira 1 para o orçamento de treinamento.

    O orçamento de treinamento determina o tempo de treinamento real, mas o tempo de conclusão inclui mais atividades, de modo que todo o processo pode levar mais de uma hora. Quando o treinamento do modelo é concluído, ele é exibido na guia de modelo como um link ativo, com um ícone de status de marca de seleção verde.

  10. Clique em Iniciar treinamento.

A seguir

Seu modelo está sendo treinado, o que pode levar uma hora ou mais. Você receberá um e-mail quando o treinamento for concluído. Quando o treinamento do modelo for concluído, siga a próxima página deste tutorial para implantar o modelo e solicitar uma previsão.

Neste tutorial, usamos um conjunto de dados que foi limpo e formatado para treinamento do AutoML, mas a maioria dos dados exigirá algum trabalho antes de estar pronto para ser usado. A qualidade dos dados de treinamento afeta a eficácia dos modelos criados. Saiba mais sobre como preparar os dados.

A fonte e a preparação dos dados são essenciais para garantir um modelo de machine learning preciso. Saiba mais sobre as práticas recomendadas

Saiba mais sobre como criar um conjunto de dados tabular.

A Vertex AI oferece dois métodos de treinamento de modelo, o AutoML e o treinamento personalizado. O AutoML permite treinar com mínimo esforço e experiência em machine learning, enquanto o treinamento personalizado oferece controle total sobre a funcionalidade do treinamento. Saiba mais sobre os métodos de treinamento.

A Vertex AI examina os tipos de dados de origem e os valores de atributos e infere como usará esses recursos no treinamento do modelo. É recomendável revisar o tipo de dados de cada coluna para verificar se eles foram interpretados corretamente. Se necessário, é possível especificar uma transformação compatível diferente para qualquer recurso. Saiba mais sobre transformações.

Saiba mais sobre como treinar um AutoML para classificação ou regressão.