Este tutorial é um guia completo que mostra como usar o SDK da Vertex AI para Python para criar um modelo treinado de maneira personalizada. Você executa o código em um arquivo de notebook (IPYNB) que usa um contêiner do Docker para treinar e criar o modelo. Este tutorial é destinado a cientistas de dados iniciantes na Vertex AI e familiarizados com notebooks, Python e o fluxo de trabalho de machine learning (ML).
O processo começa usando o console do Google Cloud para criar o projeto que contém seu trabalho. No projeto, você usa o Vertex AI Workbench para criar um notebook Jupyter. O ambiente do notebook é onde você executa o código que faz o download e prepara um conjunto de dados e usa o conjunto de dados para criar e treinar um modelo. Ao final do tutorial, o modelo treinado gera previsões.
O objetivo deste tutorial é mostrar todas as etapas necessárias para criar previsões em menos de uma hora. O conjunto de dados usado é relativamente pequeno para não demorar muito para treinar o modelo. Quando terminar, você poderá aplicar o que aprender a conjuntos de dados maiores. Quanto maior o conjunto de dados, mais precisas serão suas previsões.
Etapas do tutorial
Pré-requisitos: crie a conta e o projeto do Google Cloud.
Criar um notebook: crie e prepare um notebook do Jupyter e o ambiente dele. Use o notebook para executar o código que cria seu conjunto de dados, cria e treina seu modelo e gera as previsões.
Criar um conjunto de dados: faça o download de um conjunto de dados do BigQuery disponível publicamente e use-o para criar um conjunto de dados tabular da Vertex AI. O conjunto de dados contém os dados que você usa para treinar seu modelo.
Criar um script de treinamento: crie um script Python que você transmite para o job de treinamento. O script é executado quando o job de treinamento treina e cria seu modelo.
Treinar um modelo: use seu conjunto de dados tabular para treinar e implantar um modelo. Use o modelo para criar as previsões.
Fazer previsões: use seu modelo para criar previsões. Esta seção também mostra como excluir recursos criados ao executar este tutorial para que não haja cobranças desnecessárias.
O que você realiza
Confira neste tutorial como usar o SDK da Vertex AI para Python para fazer o seguinte:
- Criar um bucket do Cloud Storage para armazenar um conjunto de dados
- Pré-processar dados para treinamento
- Usar os dados processados para criar um conjunto de dados no BigQuery
- Usar o conjunto de dados do BigQuery para criar um conjunto de dados tabular da Vertex AI
- Criar e treinar um modelo treinado de maneira personalizada
- Implantar o modelo treinado de maneira personalizada em um endpoint
- Gerar uma previsão
- Remover a implantação do modelo
- Excluir todos os recursos criados no tutorial para que não haja cobranças
Recursos faturáveis usados
Neste tutorial, usamos recursos faturáveis associados aos serviços da Vertex AI, do BigQuery e do Google Cloud Storage. Se você não tem experiência com o Google Cloud, talvez possa usar um ou mais desses serviços sem custos. A Vertex AI oferece US$ 300 em créditos para novos clientes, e o Cloud Storage e o BigQuery têm níveis gratuitos. Para ver mais informações, consulte os seguintes tópicos:
- Preços da Vertex AI e Oferta de teste e recursos de nuvem gratuitos
- Preços do BigQuery e uso do nível gratuito do BigQuery
- Preços do Cloud Storage e uso do nível gratuito do Cloud Storage
- Calculadora de preços do Google Cloud
Para evitar outras cobranças, a etapa final deste tutorial mostra como remover todos os recursos faturáveis do Google Cloud que você criou.