Entorno de desarrollo

Como parte del conjunto de tecnologías que contribuyen a las soluciones de aprendizaje automático, Cloud Machine Learning Engine necesita un entorno de desarrollo con dependencias y requisitos previos cuidadosamente configurados. En esta página, se describen las piezas que componen el entorno de desarrollo y los problemas que pueden presentar.

Compatibilidad con la versión de Python

En Cloud ML Engine ejecuta Python 2.7 de forma predeterminada.

Python 3.5 está disponible con la versión 1.4 o superior del entorno de ejecución de Cloud ML Engine. Puedes configurar la versión de Python durante los trabajos de entrenamiento en un archivo de configuración o con los comandos de gcloud.

La predicción en línea y por lotes funciona con modelos entrenados, independientemente de si se entrenaron con Python 2 o con Python 3.

Si necesitas transferir tu código entre Python 2 y Python 3, puedes usar bibliotecas de compatibilidad, como six. Six está incluida en las imágenes del entorno de ejecución de Cloud ML Engine de forma predeterminada.

Acceso raíz

Si estás configurando tu entorno de desarrollo base, quizá debas usar sudo para ejecutar tu instalación de pip en macOS o en Linux. Sin embargo, si usas un entorno virtual, no necesitarás un acceso raíz porque la instalación se realiza fuera de los directorios del sistema protegidos por el SO.

Entorno de ejecución

La configuración de máquinas virtuales que ejecutan proyectos de GCP en la nube se define con la versión del entorno de ejecución que usas.

Entornos virtuales de Python

La configuración de Python puede ser compleja, especialmente si desarrollas otras aplicaciones de Python con tecnologías diferentes en la misma computadora. Puedes simplificar tu administración de versiones y paquetes si usas un entorno virtual para realizar el desarrollo de Python.

Un entorno virtual de Python administra los paquetes y el intérprete de Python que están separados del entorno predeterminado de tu computadora y son exclusivos de tu proyecto. Puedes usar los entornos virtuales a fin de configurar entornos separados para cada proyecto de Python en el que trabajes, y que cada uno tenga su propia versión de Python y los módulos que necesites.

Existen varias opciones de entornos virtuales de Python. Te recomendamos Anaconda (o su versión más pequeña, Miniconda). Ambos incluyen su propio administrador de entorno virtual, que se llama Conda. Anaconda es un conjunto popular de paquetes y herramientas que suelen usar los científicos de datos.

Marcos de trabajo de aprendizaje automático

Cloud ML Engine es compatible con los siguientes marcos de trabajo:

Cuenta de Google Cloud Platform

Debes tener una cuenta de GCP con la función de facturación habilitada y un proyecto con la API de Cloud Machine Learning Engine habilitada para usar cualquiera de las funciones de nube de Cloud ML Engine. Si eres nuevo en GCP, lee la descripción general de los proyectos para obtener más información.

Regiones de Cloud Compute

Los recursos de procesamiento se asignan por región y zona, que corresponden a los centros de datos en los que se encuentran los recursos físicamente. Por lo general, debes ejecutar trabajos únicos, como el entrenamiento de modelos, en la región más cercana a tu ubicación física (o la ubicación física de los usuarios objetivo), pero ten en cuenta los siguientes puntos:

  • Ten en cuenta las regiones disponibles de los servicios de Cloud ML Engine, incluido el entrenamiento de modelos en las GPU y en otros tipos de hardware, y las predicciones en línea y por lotes.

  • Siempre debes ejecutar tus trabajos de Cloud ML Engine en la misma región del depósito de Google Cloud Storage que estás usando con el objetivo de leer y escribir datos para el trabajo.

  • Debes usar el tipo de Regional Storage de cualquier depósito de Google Cloud Storage que estés usando para leer y escribir datos en tu trabajo de Cloud ML Engine.

¿Qué sigue?

¿Te sirvió esta página? Envíanos tu opinión:

Enviar comentarios sobre…

Cloud ML Engine para XGBoost y scikit-learn