Escolha um método de treinamento

Neste documento, explicamos as principais diferenças entre treinar um modelo na Vertex AI usando o AutoML ou treinamento personalizado e treinar um modelo usando o BigQuery ML.

Com o AutoML, você cria e treina um modelo com o mínimo de esforço técnico. é possível usar o AutoML para prototipar modelos rapidamente e explorar novos conjuntos de dados, antes de investir em desenvolvimento. Por exemplo, é possível usá-lo para saber quais recursos são melhores para um determinado conjunto de dados.

O treinamento personalizado permite criar um aplicativo de treinamento otimizado para os resultados desejados. Você tem controle total sobre a funcionalidade do aplicativo de treinamento. Ou seja, é possível focar em qualquer objetivo, usar qualquer algoritmo, desenvolver funções ou métricas de perda próprias ou fazer qualquer outra personalização.

Com o BigQuery ML, é possível treinar modelos usando os dados do BigQuery diretamente no BigQuery. Com os comandos SQL, é possível criar rapidamente um modelo e usá-lo para receber previsões em lote.

Para comparar as diferentes funcionalidades e especialidades necessárias para cada serviço, consulte a tabela a seguir.

AutoML Treinamento personalizado BigQuery ML
É preciso ter experiência em ciência de dados. Não Sim, para desenvolver o aplicativo de treinamento e realizar algumas das preparações de dados, como a engenharia de atributos. Não.
Capacidade de programação necessária Não, o AutoML não tem código. Sim, para desenvolver o aplicativo de treinamento. Habilidade de programação SQL necessária para criar, avaliar e usar o modelo no BigQuery ML.
Tempo para o modelo treinado Baixo. Não é necessário preparar os dados, e não é necessário nenhum desenvolvimento. Alto. É necessária mais preparação de dados, e o desenvolvimento do aplicativo de treinamento é necessário. Baixo. A velocidade de desenvolvimento do modelo aumenta porque você não precisa criar a infraestrutura necessária para previsões em lote ou treinamento de modelo, já que o BigQuery ML utiliza o mecanismo computacional do BigQuery. Isso acelera o treinamento, a avaliação e a previsão.
Limites dos objetivos de machine learning Sim, você precisa segmentar um dos objetivos predefinidos do AutoML. Não Sim.
Pode otimizar manualmente o desempenho do modelo com o ajuste de hiperparâmetro Não. O AutoML faz alguns ajustes automáticos de hiperparâmetros, mas não é possível modificar os valores usados. Sim. É possível ajustar o modelo durante cada execução de treinamento para fins de experimentação e comparação. Sim. O BigQuery ML tem suporte para ajuste de hiperparâmetros durante o treinamento de modelos de ML usando as instruções CREATE MODEL.
Pode controlar aspectos do ambiente de treinamento Limitado. Para conjuntos de dados de imagem e tabulares, é possível especificar o número de horas de nó a serem treinados e permitir o fechamento antecipado do treinamento. Sim. Especifique aspectos do ambiente, como tipo de máquina do Compute Engine, tamanho do disco, framework de machine learning e número de nós. Não.
Limites no tamanho dos dados

Sim. O AutoML usa conjuntos de dados gerenciados. As limitações de tamanho de dados variam de acordo com o tipo de conjunto de dados. Consulte um dos seguintes tópicos para mais detalhes:

Para conjuntos de dados não gerenciados, não. Os conjuntos de dados gerenciados têm os mesmos limites dos objetos de conjuntos de dados gerenciados criados e hospedados pela Vertex AI e são usados para treinar modelos do AutoML. Sim. O BigQuery ML aplica cotas adequadas por projeto. Para saber mais, consulte Cotas e limites.

A seguir