Introdução aos algoritmos integrados

Nesta página, você encontrará uma visão geral do treinamento usando algoritmos integrados. Com algoritmos integrados no AI Platform, é possível executar jobs de treinamento nos dados sem gravar códigos para um aplicativo correspondente. Envie dados de treinamento, selecione um algoritmo e deixe que o AI Platform gerencie o pré-processamento e o treinamento. Depois, é fácil implantar o modelo e receber predições no AI Platform.

Como funciona o treinamento com algoritmos integrados

O AI Platform executa o job de treinamento em recursos de computação na nuvem. Este é o processo geral:

  1. Compare os algoritmos integrados disponíveis para determinar se eles são adequados ao seu conjunto de dados e caso de uso específicos.
  2. Formate os dados de entrada para realizar o treinamento com o algoritmo integrado. É necessário enviar os dados como um arquivo CSV com a linha de cabeçalho removida, e a coluna de destino precisa ser definida como a primeira coluna. Se aplicável, siga os requisitos de formatação complementares específicos para o algoritmo integrado que está sendo usado.
  3. Se ainda não tiver um intervalo do Cloud Storage, crie um em que o AI Platform possa armazenar o resultado do treinamento.
  4. Selecione opções para personalizar o job de treinamento. Primeiro, configure o job geral e depois faça outras seleções para definir o algoritmo especificamente. Outra opção é fazer mais seleções para configurar o ajuste de hiperparâmetros do job.
    • No job de treinamento geral, selecione um nome, o algoritmo integrado, as máquinas a serem usadas, a região em que o job será executado, e o local do intervalo do Cloud Storage em que o AI Platform armazenará os resultados do treinamento.
    • Nas seleções específicas de algoritmo, ative o AI Platform para executar o pré-processamento automático no conjunto de dados. Também é possível especificar argumentos como a taxa de aprendizado, os passos de treinamento e o tamanho do lote.
    • No ajuste de hiperparâmetros, é possível selecionar uma métrica de objetivo, como aumentar a acurácia preditiva do modelo ou minimizar a perda de treinamento. Além disso, você pode ajustar hiperparâmetros específicos e definir intervalos para os valores.
  5. Envie o job de treinamento e veja os registros para monitorar o progresso e o status dele.
  6. Ao concluir o job de treinamento, será possível implantar o modelo treinado no AI Platform para configurar um servidor e receber predições sobre novos dados.

Limitações

Considere as seguintes limitações no treinamento com algoritmos integrados:

Você encontra todas as outras limitações de algoritmos integrados específicos nos guias correspondentes.

Ajuste de hiperparâmetros

O ajuste de hiperparâmetros é compatível com o treinamento que utiliza algoritmos integrados. Primeiro, especifique uma métrica de objetivo, além da possibilidade de aumentá-la ou diminuí-la. É possível aumentar a acurácia do modelo na classificação ou reduzir a perda de treinamento. Depois, liste os hiperparâmetros a serem ajustados, além de um valor de destino para cada um deles.

Ao enviar o job de treinamento com ajuste de hiperparâmetro, o AI Platform executa vários testes, acompanhando e ajustando os hiperparâmetros após cada tentativa. Quando o job de ajuste de hiperparâmetros é concluído, o AI Platform informa os valores da configuração mais eficaz, bem como um resumo de cada tentativa.

Saiba mais sobre o ajuste de hiperparâmetro no AI Platform.

Visão geral dos algoritmos

Com os algoritmos integrados, você treina modelos para vários casos de uso que costumam ser resolvidos com classificação e regressão. Os algoritmos integrados a seguir estão disponíveis para treinamento no AI Platform:

  • Aprendizado linear
  • Amplitude e profundidade
  • XGBoost

Aprendizado linear

O algoritmo integrado de aprendizado linear é usado na regressão logística, além das classificações binária e multiclasse. O AI Platform usa uma implementação baseada em um Estimator do TensorFlow.

Um modelo de aprendizado linear atribui um peso para cada atributo de entrada e os soma para prever um valor numérico de destino. Na regressão logística, esse valor é convertido em um entre 0 e 1. Esse tipo simples de modelo é fácil de interpretar porque você compara os pesos dos atributos para determinar quais atributos de entrada têm um grande impacto nas predições.

Saiba mais sobre como modelos lineares em grande escala funcionam.

Amplitude e profundidade

O algoritmo integrado de amplitude e profundidade é usado nos problemas em grande escala de classificação e regressão, como sistemas de recomendação, pesquisa e problemas de ranking. O AI Platform usa uma implementação baseada em um Estimator do TensorFlow.

Esse tipo de modelo combina um modelo linear que aprende e "memoriza" uma ampla variedade de regras com uma rede neural profunda. Ela, por sua vez, "generaliza" as regras e as aplica corretamente a atributos semelhantes em dados novos e não vistos.

Saiba mais sobre o aprendizado amplo e profundo.

XGBoost

O XGBoost (eXtreme Gradient Boosting) é um framework que implementa um algoritmo de aumento de gradiente. O XGBoost possibilita um aprendizado supervisionado eficiente nas tarefas de classificação, regressão e ranking. O treinamento do XGBoost é baseado em ensembles de árvores de decisão, que combinam os resultados de vários modelos de classificação e regressão.

Saiba mais sobre como o XGBoost funciona.

Como comparar algoritmos integrados

Na tabela a seguir, você vê uma comparação rápida dos algoritmos integrados:

Nome do algoritmo Modelo de ML usado Tipo de problema Exemplos de casos de uso Aceleradores compatíveis
Aprendizado linear Estimator do TensorFlow
LinearClassifier e LinearRegressor.
Classificação, regressão Previsão de vendas GPU
Amplitude e profundidade Estimator do TensorFlow
DNNLinearCombinedClassifier, DNNLinearCombinedEstimator e DNNLinearCombinedRegressor.
Classificação, regressão, ranking Sistemas de recomendação, pesquisa GPU
XGBoost XGBoost Classificação, regressão Predição de taxas de cliques (CTR, na sigla em inglês) relacionada à publicidade Nenhum (somente CPU)

Contêineres de algoritmos

Ao enviar o job de treinamento para o AI Platform, selecione o algoritmo especificando o URI para o contêiner do Docker correspondente hospedado no Container Registry. Os algoritmos integrados estão disponíveis por meio dos contêineres a seguir:

Algoritmo URI do Container Registry
Aprendizado linear gcr.io/cloud-ml-algos/linear_learner_cpu:latest
gcr.io/cloud-ml-algos/linear_learner_gpu:latest
Amplitude e profundidade gcr.io/cloud-ml-algos/wide_deep_learner_cpu:latest
gcr.io/cloud-ml-algos/wide_deep_learner_gpu:latest
XGBoost gcr.io/cloud-ml-algos/boosted_trees:latest

A seguir

Esta página foi útil? Conte sua opinião sobre: