Introducción a los algoritmos integrados

En esta página, se proporciona una descripción general del entrenamiento con algoritmos integrados. Con los algoritmos integrados en AI Platform, puedes ejecutar trabajos de entrenamiento en tus datos sin escribir ningún código para una aplicación de entrenamiento. Puedes enviar tus datos de entrenamiento, seleccionar un algoritmo y, luego, permitir que AI Platform maneje el procesamiento previo y el entrenamiento por ti. Después de eso, implementar tu modelo y obtener predicciones en AI Platform es muy fácil.

Cómo funciona el entrenamiento con algoritmos integrados

AI Platform ejecuta tu trabajo de entrenamiento en recursos de procesamiento en la nube. Este es el proceso general:

  1. Compara los algoritmos integrados disponibles para determinar si se ajustan a tu conjunto de datos específico y caso práctico.
  2. Establece el formato de tus datos de entrada para el entrenamiento con el algoritmo integrado. Debes enviar tus datos como un archivo CSV sin la fila de encabezado, y la columna de destino debe establecerse como la primera columna. Si corresponde, sigue los requisitos de formato adicionales específicos del algoritmo integrado que estés utilizando.
  3. Crea un depósito de Cloud Storage en el que AI Platform pueda almacenar el resultado del entrenamiento, si aún no tienes uno.
  4. Selecciona opciones para personalizar tu trabajo de entrenamiento. Primero, configura el trabajo de entrenamiento general y, luego, el algoritmo de forma específica. De manera opcional, puedes configurar el ajuste de hiperparámetro para tu trabajo.
    • Para el trabajo de entrenamiento general, selecciona un nombre de trabajo, el algoritmo integrado y las máquinas que quieres usar, además de la región donde debe ejecutarse el trabajo y la ubicación del depósito de Cloud Storage en la que quieres que AI Platform almacene los resultados de entrenamiento.
    • Para las selecciones específicas del algoritmo, puedes habilitar AI Platform a fin de realizar un procesamiento previo automático en tu conjunto de datos. También puedes especificar argumentos como la tasa de aprendizaje, los pasos de entrenamiento y el tamaño del lote.
    • Para el ajuste de hiperparámetro, puedes seleccionar una métrica de objetivo, como las opciones para maximizar la precisión predictiva de tu modelo o minimizar la pérdida de entrenamiento. Además, puedes ajustar hiperparámetros específicos y establecer rangos para sus valores.
  5. Envía el trabajo de entrenamiento y visualiza los registros para supervisar el progreso y el estado.
  6. Cuando tu trabajo de entrenamiento se haya completado de manera correcta, puedes implementar tu modelo entrenado en AI Platform para configurar un servidor de predicción y obtener predicciones sobre datos nuevos.

Limitaciones

Ten en cuenta las limitaciones siguientes sobre el entrenamiento con algoritmos integrados:

  • No se admite el entrenamiento distribuido. Para ejecutar un trabajo de entrenamiento distribuido en AI Platform, debes crear una aplicación de entrenamiento.
  • Los trabajos de entrenamiento que se envían a través de Google Cloud Platform Console solo usan tipos de máquinas heredadas. Puedes usar los tipos de máquina de Compute Engine con trabajos de entrenamiento enviados a través de gcloud o la biblioteca cliente de las API de Google para Python. Obtén más información sobre los tipos de máquinas para entrenamiento.
  • Las GPU son compatibles con algunos algoritmos. Consulta la comparación detallada de todos los algoritmos integrados para obtener más información.
  • Las máquinas con varias GPU no producen mayor velocidad con el entrenamiento de algoritmos integrados. Si usas GPU, selecciona máquinas con una sola GPU.
  • Las TPU no son compatibles con el entrenamiento de algoritmos integrados. Debes crear una aplicación de entrenamiento. Obtén más información sobre cómo ejecutar un trabajo de entrenamiento con TPU.

Todas las limitaciones adicionales para los algoritmos integrados se mencionan en las guías para cada algoritmo correspondientes.

Ajuste de hiperparámetros

El ajuste de hiperparámetros es compatible para el entrenamiento con algoritmos integrados. Primero, especifica una métrica de objetivo junto con la opción para minimizarla o maximizarla. Puedes maximizar la exactitud de tu modelo para la clasificación, o minimizar tu pérdida de entrenamiento. Luego, enumera los hiperparámetros que deseas ajustar junto con un valor objetivo para cada hiperparámetro.

Cuando envías tu trabajo de entrenamiento con un ajuste de hiperparámetros, AI Platform ejecuta varias pruebas, mediante el rastreo y el ajuste de los hiperparámetros después de cada prueba. Cuando se completa el trabajo de ajuste de hiperparámetros, AI Platform informa los valores de la configuración más efectiva de tus hiperparámetros, así como un resumen para cada prueba.

Obtén más información sobre el ajuste de hiperparámetros en AI Platform.

Descripción general de los algoritmos

Los algoritmos integrados te ayudan a entrenar modelos para una variedad de casos prácticos que generalmente se resuelven con clasificación y regresión. Los algoritmos integrados siguientes están disponibles para entrenamiento en AI Platform:

  • Algoritmo de aprendizaje lineal
  • Algoritmo de amplitud y profundidad
  • XGBoost

Algoritmo de aprendizaje lineal

El algoritmo de aprendizaje lineal integrado se usa para la regresión logística, la clasificación binaria y la clasificación multiclase. AI Platform utiliza una implementación según un Estimador de TensorFlow.

Un modelo de algoritmo de aprendizaje lineal asigna un peso a cada atributo de entrada y suma los pesos para predecir un valor objetivo numérico. Para la regresión logística, este valor se convierte en un valor entre 0 y 1. Este tipo simple de modelo es fácil de interpretar, ya que puedes comparar los pesos de las características para determinar qué atributos de entrada tienen un impacto significativo en tus predicciones.

Obtén más información sobre cómo funcionan los modelos lineales a gran escala.

Algoritmo de amplitud y profundidad

El algoritmo de amplitud y profundidad integrado se utiliza para problemas de clasificación y regresión a gran escala, como los problemas de búsqueda, clasificación y sistemas de recomendación. AI Platform utiliza una implementación según un Estimador de TensorFlow.

Este tipo de modelo combina un modelo lineal que aprende y "memoriza" una amplia gama de reglas con una red neuronal profunda que "generaliza" las reglas y las aplica de forma correcta a características similares en datos invisibles y nuevos.

Obtén más información sobre el aprendizaje del algoritmo de amplitud y profundidad.

XGBoost

XGBoost (eXtreme Gradient Boosting) es un marco de trabajo que implementa un algoritmo de potenciación de gradiente. XGBoost permite un aprendizaje supervisado eficaz para tareas de clasificación, regresión y clasificación. El entrenamiento de XGBoost se basa en ensambles de árbol de decisión, que combinan los resultados de varios modelos de clasificación y regresión.

Obtén más información sobre cómo funciona XGBoost.

Cómo comparar los algoritmos integrados

En la tabla siguiente, se proporciona una comparación rápida de los algoritmos integrados:

Nombre del algoritmo Modelo de AA utilizado Tipo de problema Casos prácticos de ejemplo Aceleradores compatibles
Algoritmo de aprendizaje lineal Estimador de TensorFlow
LinearClassifier y LinearRegressor.
Clasificación, regresión Previsión de ventas GPU
Algoritmo de amplitud y profundidad Estimador de TensorFlow
DNNLinearCombinedClassifier, DNNLinearCombinedEstimator y DNNLinearCombinedRegressor.
Clasificación, regresión, clasificación Sistemas de recomendación, búsqueda GPU
XGBoost XGBoost Clasificación, regresión Predicción de la tasa de clics (CTR) de publicidad Ninguno (solo CPU)

Contenedores de algoritmos

Cuando envías tu trabajo de entrenamiento a AI Platform, para seleccionar el algoritmo debes especificar el URI a su contenedor de Docker correspondiente alojado en Container Registry. Los algoritmos integrados están disponibles a través de los contenedores siguientes:

Algoritmo URI de Container Registry
Algoritmo de aprendizaje lineal gcr.io/cloud-ml-algos/linear_learner_cpu:latest
gcr.io/cloud-ml-algos/linear_learner_gpu:latest
Algoritmo de amplitud y profundidad gcr.io/cloud-ml-algos/wide_deep_learner_cpu:latest
gcr.io/cloud-ml-algos/wide_deep_learner_gpu:latest
XGBoost gcr.io/cloud-ml-algos/boosted_trees:latest

Próximos pasos

¿Te sirvió esta página? Envíanos tu opinión: