この古いバージョンの AI Platform Training は非推奨になりました。2025 年 1 月 31 日を過ぎると Google Cloud で使用できなくなります。リソースを Vertex AI カスタムトレーニングに移行することで、AI Platform にはない新しい機械学習機能を利用できます。

ランタイムバージョンの管理

AI Platform Training では、イメージを使用して、クラウド内でトレーニングリクエストと予測リクエストを処理する VM を構成します。これらのイメージには、基本オペレーティングシステム、コアテクノロジーパッケージ、pip パッケージ（Python ライブラリ）、オペレーティングシステムパッケージが含まれます。イメージは、新しい改善点と機能を含めるために定期的にアップグレードされます。AI Platform Training ではバージョニングが採用されているため、モデルに対して最適な構成を選択できます。

バージョニングに関する重要な注意事項

新しいランタイムバージョンに切り替える場合は、メジャー更新かマイナー更新かにかかわらず、必ずトレーニングジョブとモデルを入念にテストする必要があります。
AI Platform Training は、各ランタイムバージョンをリリース後 12 か月間サポートします。12 か月が過ぎると、そのランタイムバージョンを使用してトレーニングジョブ、バッチ予測ジョブ、モデルを作成できなくなります。

ランタイムバージョンのリリースから 24 か月後に、AI Platform Prediction はランタイムバージョンを使用するすべてのモデルバージョンを削除します。

詳しくは、ランタイムバージョンの可用性のタイムラインをご覧ください。

バージョン番号について

AI Platform Training が使用するイメージは、AI Platform Training ランタイムバージョンに対応しています。ランタイムバージョンは、次の形式を使用します。

major_version.minor_version

メジャーバージョンとマイナーバージョン

新しいメジャーバージョンとマイナーバージョンが定期的に作成され、以下の 1 つ以上が組み込まれます。

以下のリリース:
- オペレーティングシステム
- サポートされている機械学習フレームワーク
AI Platform Training の機能に対する変更や更新。

新しいメジャーバージョンには、以前のバージョンに対して書かれたコードの更新を必要とする非互換の変更が含まれる場合があります。新しいマイナーバージョンには非互換の変更は含まれず、同じメジャーバージョンのすべてのバリエーションとの下位互換性があります。

ランタイムバージョンの選択

必ず、使用している機械学習フレームワークや他のパッケージの最新バージョンをサポートしているランタイムバージョンを選択してください。

scikit-learn と XGBoost をサポートする最も古い AI Platform Training ランタイムバージョンは 1.13 です。

各バージョンの詳細については、AI Platform Training のバージョンリストをご覧ください。

ランタイムバージョンの設定

トレーニングジョブリクエストを送信するときには、必ずランタイムバージョンを設定します。

gcloud

gcloud ai-platform jobs submit training コマンドを実行するときは、--runtime-version フラグを使用します。

gcloud ai-platform jobs submit training my_job \
    --module-name trainer.task \
    --job-dir gs://my/training/job/directory \
    --package-path /path/to/my/project/trainer \
    --region us-central1 \
    --runtime-version 2.11 \
    --python-version 3.7

Python

トレーニングジョブのリクエストを定義するときは、runtimeVersion を設定します。

training_inputs = {'scaleTier': 'BASIC',
    'packageUris': ['gs://my/trainer/path/package-0.0.0.tar.gz'],
    'pythonModule': 'trainer.task'
    'args': ['--arg1', 'value1', '--arg2', 'value2'],
    'region': 'us-central1',
    'jobDir': 'gs://my/training/job/directory',
    'runtimeVersion': '2.11',
    'pythonVersion': '3.7'}

job_spec = {'jobId': my_job_name, 'trainingInput': training_inputs}

TrainingInput API でトレーニングジョブを送信する方法の詳細をご覧ください。

Python バージョンの設定

Python 3.7 は、ランタイムバージョン 1.15 以降で使用できます。

古い Python バージョンは、特定のランタイムバージョンで使用できます。

Python 3.5 は、AI Platform Training ランタイムバージョン 1.13～1.14 で使用できます。
Python 2.7 は、ランタイムバージョン 1.15 以前で使用できます。

次の例では、トレーニングに Python 3.7 を指定する方法を示します。Python 3.5 や Python 2.7 も同様の方法で指定できます。

gcloud

Python 3.7 をトレーニングに使用する場合は、--python-version 3.7 ランタイムバージョン 1.15 以降を使用します。

gcloud ai-platform jobs submit training my_job \
    --module-name trainer.task \
    --job-dir gs://my/training/job/directory \
    --package-path /path/to/my/project/trainer \
    --python-version 3.7 \
    --region us-central1 \
    --runtime-version 2.11

Python

Python 3.7 をトレーニングに使用する場合は、runtimeVersion をバージョン '1.15' 以降に設定し、pythonVersion を '3.7' に設定します。

training_inputs = {'scaleTier': 'BASIC',
    'packageUris': ['gs://my/trainer/path/package-0.0.0.tar.gz'],
    'pythonModule': 'trainer.task'
    'args': ['--arg1', 'value1', '--arg2', 'value2'],
    'region': 'us-central1',
    'jobDir': 'gs://my/training/job/directory',
    'runtimeVersion': '2.11',
    'pythonVersion': '3.7'}

job_spec = {'jobId': my_job_name, 'trainingInput': training_inputs}

TrainingInput API でトレーニングジョブを送信する方法の詳細をご覧ください。

カスタムパッケージを使用する

トレーニングインスタンス上のパッケージを変更するには、3 つの方法があります。

依存関係をイメージにプリインストールするカスタムコンテナを構築する
トレーニングパッケージの依存関係として PyPI パッケージを指定する
パッケージファイル（tarball）を手動でアップロードし、そのファイルパスをトレーニングの入力に含める

カスタムコンテナを作成する

ランタイムバージョンを使用する代わりに、Docker コンテナを構築して、そこに依存関係を含めることもできます。詳細については、カスタムコンテナを使用する方法をご覧ください。

# Specifies base image and tag
FROM image:tag
WORKDIR /root

# Installs additional packages
RUN pip install pkg1 pkg2 pkg3

# Downloads training data
RUN curl https://example-url/path-to-data/data-filename --output /root/data-filename

# Copies the trainer code to the docker image.
COPY your-path-to/model.py /root/model.py
COPY your-path-to/task.py /root/task.py

# Sets up the entry point to invoke the trainer.
ENTRYPOINT ["python", "task.py"]

PyPI パッケージの依存関係を含める

通常のセットアップツールのプロセスを使用して、PyPI パッケージとそのバージョンをトレーナーの依存関係として指定できます。

トレーナーアプリケーションの最上位ディレクトリに setup.py ファイルを含めます。

setuptools.setup を setup.py で呼び出すときに、依存関係のリストと、オプションでそれらのバージョンを install_requires パラメータとして渡します。次の setup.py ファイルのサンプルにこの手順を示します。

from setuptools import find_packages
from setuptools import setup

REQUIRED_PACKAGES = ['some_PyPI_package>=1.5',
                     'another_package==2.6']

setup(
    name='trainer',
    version='0.1',
    install_requires=REQUIRED_PACKAGES,
    packages=find_packages(),
    include_package_data=True,
    description='Generic example trainer package with dependencies.')

AI Platform Training はパッケージの再インストールを強制するため、ランタイムバージョンのイメージの一部であるパッケージを新しいバージョンまたは古いバージョンでオーバーライドできます。

独自のパッケージファイルをアップロードする

トレーニングジョブリクエストの一部として、追加のパッケージファイルを含めることができます。Cloud Storage にパッケージをアップロードし、各トレーニングインスタンスにインストールするパッケージのリストを指定します。AI Platform Training は、すべてのパッケージを pip でインストールします。他のパッケージマネージャー用に設計されたパッケージはサポートされません。

gcloud

gcloud ai-platform jobs submit training コマンドを実行するときは、--packages フラグを使用します。値は、すべての追加パッケージへのパスのカンマ区切りリストに設定します。リストでは、エントリ間に空白を含めることはできません。

gcloud ai-platform jobs submit training my_job \
    --staging-bucket gs://my-bucket \
    --package-path /path/to/my/project/trainer \
    --module-name trainer.task \
    --runtime-version 2.11 \
    --python-version 3.7 \
    --packages dep1.tar.gz,dep2.whl

Python

TrainingInput オブジェクトの packageUris の値として使用するリストに、すべての追加パッケージを追加します。

training_inputs = {'scaleTier': 'BASIC',
    'packageUris': ['gs://my/trainer/path/package-0.0.0.tar.gz',
                    'gs://my/dependencies/path/dep1.tar.gz',
                    'gs://my/dependencies/path/dep2.whl'],
    'pythonModule': 'trainer.task'
    'args': ['--arg1', 'value1', '--arg2', 'value2'],
    'region': 'us-central1',
    'jobDir': 'gs://my/training/job/directory',
    'runtimeVersion': '2.11',
    'pythonVersion': '3.7'}

    job_spec = {'jobId': my_job_name, 'trainingInput': training_inputs}

トレーニング用の TensorFlow のカスタムバージョンの指定

サポートされる最新のランタイムバージョンよりも新しいバージョンの TensorFlow を AI Platform Training で使用することは、トレーニング用としては可能ですが、予測には使用できません。

サポートされていない TensorFlow のバージョンを AI Platform Training ランタイムの完全版として使用する場合は、次のいずれかの方法で、トレーナーのカスタム依存関係としてそのバージョンを追加します。

setup.py ファイルに TensorFlow バージョンを PyPI の依存関係として指定します。次のように必要なパッケージのリストに含めます。
```
 REQUIRED_PACKAGES = ['tensorflow>=2.11']
```
ソースから TensorFlow バイナリを作成し、CPU サポート付きの TensorFlow の指示のみに沿って操作します。このプロセスでは、パッケージのリストに追加することでトレーニングジョブリクエストに含めることができる pip パッケージ（.whl ファイル）が生成されます。

カスタムパッケージとして含める TensorFlow バイナリを作成する方がより複雑なアプローチになりますが、モデルをトレーニングするときに最新の TensorFlow アップデートを使用できるという利点があります。

次のステップ

サポートされるランタイムバージョンのリストを確認する。

ランタイムバージョンリスト

ランタイム バージョンの管理

バージョニングに関する重要な注意事項

バージョン番号について

メジャー バージョンとマイナー バージョン

ランタイム バージョンの選択

ランタイム バージョンの設定

gcloud

Python

Python バージョンの設定

gcloud

Python

カスタム パッケージを使用する

カスタム コンテナを作成する

PyPI パッケージの依存関係を含める

独自のパッケージ ファイルをアップロードする

gcloud

Python

トレーニング用の TensorFlow のカスタム バージョンの指定

次のステップ

ランタイムバージョンの管理

メジャーバージョンとマイナーバージョン

ランタイムバージョンの選択

ランタイムバージョンの設定

カスタムパッケージを使用する

カスタムコンテナを作成する

独自のパッケージファイルをアップロードする

トレーニング用の TensorFlow のカスタムバージョンの指定