Como parte de un conjunto de tecnologías que contribuyen a una solución de aprendizaje automático, AI Platform Training requiere un entorno de desarrollo con dependencias y requisitos configurados con cuidado. En esta página, se describen las piezas que componen el entorno de desarrollo y los problemas que pueden surgir con ellas.
Versiones de Python compatibles
AI Platform Training puede ejecutar Python 2.7 o Python 3. Puedes configurar la versión de Python para los trabajos de entrenamiento en un archivo de configuración o con los comandos de gcloud.
La predicción en línea y por lotes funciona con modelos de entrenamiento independientemente de si se entrenaron con Python 2 o con Python 3.
Si necesitas transferir tu código entre Python 2 y Python 3, puedes usar bibliotecas de compatibilidad, como six, para que te ayuden. Six está incluido en las imágenes del entorno de ejecución de AI Platform Training de forma predeterminada.
Acceso raíz
Si estás configurando tu entorno de desarrollo base, quizás debas usar sudo
para ejecutar la instalación de pip
en macOS o Linux. Sin embargo, si usas un entorno virtual, no necesitarás acceso raíz porque la instalación se realiza fuera de los directorios del sistema protegidos por el SO.
Entorno de ejecución
La configuración de las máquinas virtuales que ejecutan el proyecto de Google Cloud en la nube se define con la versión del entorno de ejecución que usas.
Entornos virtuales de Python
La configuración de Python puede ser compleja, especialmente si desarrollas otras aplicaciones Python con tecnologías diferentes en la misma computadora. Puedes simplificar la administración de versiones y paquetes si usas un entorno virtual para realizar el desarrollo de Python.
Un entorno virtual de Python administra los paquetes y el intérprete de Python que están separados del entorno predeterminado de tu computadora y son exclusivos de tu proyecto. Puedes usar los entornos virtuales para configurar entornos diferentes en cada proyecto Python en el que trabajes, y que cada uno tenga su propia versión de Python y los módulos que necesites.
Existen varias opciones de entornos virtuales de Python. Te recomendamos Anaconda (o su versión más pequeña, Miniconda). Ambos incluyen su propio administrador del entorno virtual, que se llama Conda. Anaconda es un conjunto popular de paquetes y herramientas que suelen usar los científicos de datos.
Frameworks de aprendizaje automático
AI Platform Training y AI Platform Prediction son compatibles con los siguientes marcos de trabajo:
- TensorFlow para el entrenamiento, la predicción en línea y la predicción por lotes. Consulta la guía sobre entrenamiento y predicción con el Estimador de TensorFlow en AI Platform.
- Scikit-learn y XGBoost para el entrenamiento y la predicción en línea. Consulta los instructivos sobre el uso de scikit-learn y XGBoost con AI Platform Training.
Cuenta de Google Cloud Platform
Debes tener una cuenta de Google Cloud con facturación habilitada y un proyecto con la API de entrenamiento y predicción de AI Platform habilitada para usar cualquiera de las funciones en la nube de AI Platform Training. Si eres nuevo en Google Cloud, lee la descripción general de los proyectos para obtener más información.
Regiones de Cloud Compute
Los recursos de procesamiento se asignan por región y zona, que corresponden a los centros de datos en los que los recursos están ubicados físicamente. Por lo general, debes ejecutar los trabajos puntuales, como el entrenamiento de modelos, en la región más cercana a tu ubicación física (o la ubicación física de los usuarios objetivo), pero ten en cuenta los siguientes puntos:
Ten en cuenta las regiones disponibles para los servicios de AI Platform Training, incluido el entrenamiento de modelos en GPU y otros tipos de hardware, y la predicción en línea o por lotes.
Siempre debes ejecutar los trabajos de AI Platform Training en la misma región que el bucket de Cloud Storage que usas a fin de leer y escribir datos para el trabajo.
Deberías usar la clase Standard Storage para cualquier depósito de Cloud Storage que uses a fin de leer y escribir datos destinados al trabajo de AI Platform Training.
¿Qué sigue?
- Consulta la guía de introducción para el Estimador de TensorFlow en AI Platform Training.
- Consulta la guía de inicio rápido para scikit-learn y XGBoost en AI Platform Training.