Desarrolla una aplicación de entrenamiento de TensorFlow

Cloud Machine Learning Engine puede ejecutar una aplicación de entrenamiento de TensorFlow existente con poca o ninguna alteración. El desarrollo de una aplicación de entrenamiento es un proceso complejo que está fuera del alcance de esta documentación. Puedes comenzar a aprender por medio del trabajo a través de la guía de introducción a TensorFlow.

Cuando entiendes los fundamentos de TensorFlow, la mejor manera de aprender lo que implica una aplicación de entrenamiento es estudiar un buen ejemplo.

Lee las muestras provistas en esta documentación. Estas muestras de TensorFlow se desarrollaron específicamente para funcionar bien con Cloud ML Engine.

Para comenzar, estudia el conjunto de muestras de clasificación que usan un conjunto de datos del censo de los Estados Unidos para predecir el nivel de ingresos. Las aplicaciones de muestra en el conjunto tienen una funcionalidad casi idéntica, pero usan diferentes API de TensorFlow. Puedes aprender mucho si lees las muestras y comparas las formas que usan para lograr lo mismo.

Presta atención especial a los siguientes puntos cuando leas las muestras:

  • Cómo usan los argumentos de la línea de comandos para obtener información importante que puede cambiar de un trabajo de entrenamiento a otro. Cloud ML Engine pasa argumentos a cada réplica de tu aplicación de entrenamiento que se ejecuta en la nube. Especifica los argumentos cuando comienzas un trabajo de entrenamiento. Los argumentos de la línea de comandos son el mecanismo principal para comunicarte con tu aplicación en el momento que se ejecuta.

  • Cómo usan la variable de entorno TF_CONFIG para configurar un clúster de procesamiento distribuido. Este es el método con el que Cloud ML Engine comunica la información del trabajo a las réplicas individuales de tu aplicación de entrenamiento que se ejecutan en las instancias de entrenamiento asignadas. Consulta la guía para obtener detalles de TF_CONFIG.

  • Cómo administran el procesamiento distribuido para tener en cuenta los diferentes tipos de tareas (instancia principal, servidor de parámetros y trabajador) en una aplicación.

  • Cómo acomodan diferentes etapas del proceso de entrenamiento (en particular, entrenamiento, evaluación y exportación) con puntos de control y variaciones del grafo de cómputo.

  • Cómo definen los datos de entrada y salida para entrenar y exportar el modelo.

¿Qué sigue?

¿Te sirvió esta página? Envíanos tu opinión:

Enviar comentarios sobre…

Cloud ML Engine para TensorFlow