Como parte de un conjunto de tecnologías que contribuyen a una solución de aprendizaje automático, AI Platform Prediction requiere un entorno de desarrollo con dependencias y requisitos configurados con cuidado. En esta página, se describen las piezas que componen el entorno de desarrollo y los problemas que pueden surgir.
Versiones de Python compatibles
AI Platform Prediction puede ejecutar Python 2.7 o Python 3. Puedes configurar la versión de Python durante los trabajos de entrenamiento en un archivo de configuración o con los comandos de gcloud.
La predicción en línea y por lotes funciona con modelos de entrenamiento independientemente de si se entrenaron con Python 2 o con Python 3.
Si necesitas transferir tu código entre Python 2 y Python 3, puedes usar bibliotecas de compatibilidad, como six, para que te ayuden. Six se incluye de forma predeterminada en las imágenes del entorno de ejecución de AI Platform Prediction.
Acceso raíz
Si estás configurando tu entorno de desarrollo base, quizás debas usar sudo
para ejecutar la instalación de pip
en macOS o Linux. Sin embargo, si usas un entorno virtual, no necesitarás acceso raíz porque la instalación se realiza fuera de los directorios del sistema protegidos por el SO.
Entorno de ejecución
La configuración de las máquinas virtuales que ejecutan el proyecto de Google Cloud en la nube se define con la versión del entorno de ejecución que usas.
Entornos virtuales de Python
La configuración de Python puede ser compleja, especialmente si desarrollas otras aplicaciones Python con tecnologías diferentes en la misma computadora. Puedes simplificar la administración de versiones y paquetes si usas un entorno virtual para realizar el desarrollo de Python.
Un entorno virtual de Python administra los paquetes y el intérprete de Python que están separados del entorno predeterminado de tu computadora y son exclusivos de tu proyecto. Puedes usar los entornos virtuales para configurar entornos diferentes en cada proyecto Python en el que trabajes, y que cada uno tenga su propia versión de Python y los módulos que necesites.
Existen varias opciones de entornos virtuales de Python. Te recomendamos Anaconda (o su versión más pequeña, Miniconda). Ambos incluyen su propio administrador del entorno virtual, que se llama Conda. Anaconda es un conjunto popular de paquetes y herramientas que suelen usar los científicos de datos.
Frameworks de aprendizaje automático
AI Platform Training y AI Platform Prediction son compatibles con los siguientes marcos de trabajo:
- TensorFlow para el entrenamiento, la predicción en línea y la predicción por lotes. Consulta la guía sobre entrenamiento y predicción con el Estimador de TensorFlow en AI Platform.
- Scikit-learn y XGBoost para el entrenamiento y la predicción en línea. Consulta distintos instructivos sobre el uso de scikit-learn y XGBoost con AI Platform Prediction.
Cuenta de Google Cloud Platform
Debes tener una cuenta de Google Cloud en la que estén habilitados la facturación y un proyecto con la API de entrenamiento y predicción de AI Platform para poder usar cualquiera de las funciones de la nube de AI Platform Prediction. Si eres nuevo en Google Cloud, lee la descripción general de los proyectos para obtener más información.
Regiones de Cloud Compute
Los recursos de procesamiento se asignan por región y zona, que corresponden a los centros de datos en los que los recursos están ubicados físicamente. Por lo general, debes ejecutar los trabajos puntuales, como el entrenamiento de modelos, en la región más cercana a tu ubicación física (o la ubicación física de los usuarios objetivo), pero ten en cuenta los siguientes puntos:
Ten en cuenta las regiones disponibles para los servicios de AI Platform Prediction, incluido el entrenamiento de modelos en las GPU y otros tipos de hardware, y la predicción en línea o por lotes.
Siempre debes ejecutar los trabajos de AI Platform Prediction en la misma región en la que se ubica el bucket de Cloud Storage que usas con el fin de leer y escribir datos para el trabajo.
Debes usar la clase Standard Storage en todos los depósitos de Cloud Storage que usas con el fin de leer y escribir datos para el trabajo de AI Platform Prediction.
¿Qué sigue?
- Consulta la guía de introducción del Estimador de TensorFlow en AI Platform Prediction.
- Lee la guía de introducción de scikit-learn y XGBoost en AI Platform Prediction.