作为有助于改进机器学习解决方案的一系列技术之一,AI Platform Training 需要一个已精心配置前提条件和依赖项的开发环境。本页面介绍构成开发环境的组件及相关组件问题。
Python 版本支持
AI Platform Training 可以运行 Python 2.7 或 Python 3。您可以使用配置文件或 gcloud 命令为训练作业设置 Python 版本。
在线预测和批量预测均可使用经过训练的模型,无论模型是使用 Python 2 还是使用 Python 3 进行训练的。
如果您需要在 Python 2 和 Python 3 之间移植代码,则可以使用 six 等兼容性库获取帮助。默认情况下,AI Platform Training 运行时映像中附带了 Six。
根访问权限
如果您要配置基本开发环境,则可能需要使用 sudo
才能在 macOS 或 Linux 上运行您的 pip
安装程序。但是,如果您使用虚拟环境,则无需根访问权限,因为安装是在受操作系统保护的系统目录外部进行。
运行时环境
在云端运行 Google Cloud 项目的虚拟机的配置取决于您使用的运行时版本。
Python 虚拟环境
Python 配置可能十分复杂,尤其是如果您在同一台计算机上使用不同技术开发其他 Python 应用。您可以使用虚拟环境进行 Python 开发,以简化软件包和版本管理。
Python 虚拟环境管理与计算机默认环境隔离、供您项目专用的 Python 解释器和软件包。您可以使用虚拟环境为您处理的每个 Python 项目配置单独的环境,这些环境分别具有各自的 Python 版本和您所需的模块。
有多个虚拟 Python 环境可供选择。我们建议使用 Anaconda(或其较低版本 Miniconda)。 这些套件提供其自己的虚拟环境管理器,名为 Conda。Anaconda 是热门的软件包和工具套件,通常供数据科学家使用。
机器学习框架
AI Platform Training 和 AI Platform Prediction 支持以下框架:
- 用于训练、在线预测和批量预测的 TensorFlow。请参阅在 AI Platform 上使用 TensorFlow Estimator 进行训练和预测指南。
- 用于训练和在线预测的 scikit-learn 和 XGBoost。请参阅有关将 scikit-learn 和 XGBoost 与 AI Platform Training 搭配使用的教程。
Google Cloud Platform 账号
您必须拥有已启用结算功能的 Google Cloud 账号,以及已启用 AI Platform Training and Prediction API 的项目,才能使用 AI Platform Training 的任何云功能。如果您是第一次使用Google Cloud,请参阅项目概览了解详情。
Cloud Compute 区域
处理资源按与资源实际所在的数据中心相对应的区域和地区分配。您通常应该在与您的物理位置(或目标用户的物理位置)最接近的区域运行一次性作业,如模型训练,但请注意以下几点:
请注意 AI Platform Training 服务(包括在 GPU 和其他硬件上进行的模型训练以及在线/批量预测)的可用区域。
您应该始终在用于读取和写入作业数据的 Cloud Storage 存储分区所在区域运行 AI Platform Training 作业。
您应该对用来读取和写入 AI Platform Training 作业数据的任何 Cloud Storage 存储分区使用 Standard 存储空间类别。
后续步骤
- 参阅《入门指南:在 AI Platform Training 上使用 TensorFlow Estimator》。
- 参阅《快速入门:在 AI Platform Training 上使用 scikit-learn 和 XGBoost》。