Treinar um modelo usando a Vertex AI e o SDK do Python

Este tutorial é um guia completo que mostra como usar o SDK da Vertex AI para Python para criar um modelo treinado de maneira personalizada. Você executa o código em um arquivo de notebook (IPYNB) que usa um contêiner do Docker para treinar e criar o modelo. Este tutorial é destinado a cientistas de dados iniciantes na Vertex AI e familiarizados com notebooks, Python e o fluxo de trabalho de machine learning (ML).

O processo começa usando o console do Google Cloud para criar o projeto que contém seu trabalho. No projeto, você usa o Vertex AI Workbench para criar um notebook Jupyter. O ambiente do notebook é onde você executa o código que faz o download e prepara um conjunto de dados e usa o conjunto de dados para criar e treinar um modelo. Ao final do tutorial, o modelo treinado gera previsões.

O objetivo deste tutorial é mostrar todas as etapas necessárias para criar previsões em menos de uma hora. O conjunto de dados usado é relativamente pequeno para não demorar muito para treinar o modelo. Quando terminar, você poderá aplicar o que aprender a conjuntos de dados maiores. Quanto maior o conjunto de dados, mais precisas serão suas previsões.

Etapas do tutorial

  1. Pré-requisitos: crie a conta e o projeto do Google Cloud.

  2. Criar um notebook: crie e prepare um notebook do Jupyter e o ambiente dele. Use o notebook para executar o código que cria seu conjunto de dados, cria e treina seu modelo e gera as previsões.

  3. Criar um conjunto de dados: faça o download de um conjunto de dados do BigQuery disponível publicamente e use-o para criar um conjunto de dados tabular da Vertex AI. O conjunto de dados contém os dados que você usa para treinar seu modelo.

  4. Criar um script de treinamento: crie um script Python que você transmite para o job de treinamento. O script é executado quando o job de treinamento treina e cria seu modelo.

  5. Treinar um modelo: use seu conjunto de dados tabular para treinar e implantar um modelo. Use o modelo para criar as previsões.

  6. Fazer previsões: use seu modelo para criar previsões. Esta seção também mostra como excluir recursos criados ao executar este tutorial para que não haja cobranças desnecessárias.

O que você realiza

Confira neste tutorial como usar o SDK da Vertex AI para Python para fazer o seguinte:

  • Criar um bucket do Cloud Storage para armazenar um conjunto de dados
  • Pré-processar dados para treinamento
  • Usar os dados processados para criar um conjunto de dados no BigQuery
  • Usar o conjunto de dados do BigQuery para criar um conjunto de dados tabular da Vertex AI
  • Criar e treinar um modelo treinado de maneira personalizada
  • Implantar o modelo treinado de maneira personalizada em um endpoint
  • Gerar uma previsão
  • Remover a implantação do modelo
  • Excluir todos os recursos criados no tutorial para que não haja cobranças

Recursos faturáveis usados

Neste tutorial, usamos recursos faturáveis associados aos serviços da Vertex AI, do BigQuery e do Google Cloud Storage. Se você não tem experiência com o Google Cloud, talvez possa usar um ou mais desses serviços sem custos. A Vertex AI oferece US$ 300 em créditos para novos clientes, e o Cloud Storage e o BigQuery têm níveis gratuitos. Para ver mais informações, consulte os seguintes tópicos:

Para evitar outras cobranças, a etapa final deste tutorial mostra como remover todos os recursos faturáveis do Google Cloud que você criou.