この古いバージョンの AI Platform Prediction は非推奨になりました。2025 年 1 月 31 日を過ぎると Google Cloud で使用できなくなります。2025 年 1 月 31 日以降、すべてのモデル、関連するメタデータ、デプロイが削除されます。リソースを Vertex AI に移行することで、AI Platform にはない新しい機械学習機能を利用できます。

カスタムコンテナの使用

AI Platform Prediction でトレーニング済み機械学習（ML）モデルからオンライン予測を処理する方法をカスタマイズするには、モデルバージョンの作成時にランタイムバージョンではなく、カスタムコンテナを指定します。カスタムコンテナを使用する場合、AI Platform Prediction では、標準のランタイムバージョンコードを実行するのではなく、各予測ノード上の任意の Docker コンテナを実行して、互換性のあるモデルアーティファクトから予測を行います。

次のような理由からカスタムコンテナの使用をおすすめします。

TensorFlow、scikit-learn、XGBoost 以外のフレームワークを使用してトレーニングされた ML モデルから予測を行う
モデルから生成される予測リクエストの前処理または後処理を行う
任意のプログラミング言語で作成された予測サーバーを実行する
予測のカスタマイズに使用する依存関係をインストールする

このガイドでは、カスタムコンテナを使用するモデルバージョンの作成方法について説明します。Docker コンテナイメージを設計して作成する方法については説明しません。コンテナイメージを作成して AI Platform Prediction で使用する例の詳細については、スタートガイド: カスタムコンテナを使用した PyTorch 予測の提供をご覧ください。

カスタムコンテナを使用するには、モデルバージョンにリージョンエンドポイントと Compute Engine（N1）マシンタイプを使用する必要があります。

コンテナイメージの準備

カスタムコンテナを使用するモデルバージョンを作成するには、そのコンテナのベースとして Docker コンテナイメージを提供する必要があります。このコンテナイメージは、カスタムコンテナの要件にある要件を満たす必要があります。

信頼できる第三者によって作成された既存のコンテナイメージを使用する場合は、次のセクションのいずれか、または両方を省略できる可能性があります。

コンテナイメージを作成する

コンテナイメージの要件を満たす Docker コンテナイメージを設計してビルドします。

Docker コンテナイメージの設計とビルドの基本については、Docker ドキュメントのクイックスタートをご覧ください。

コンテナイメージを Artifact Registry に push する

コンテナイメージの公開要件を満たす Artifact Registry リポジトリにコンテナイメージを push します。

コンテナイメージを Artifact Registry に push する方法を確認します。

モデルとモデルバージョンの作成

モデルの作成時にいくつかの構成オプションを指定して、後でモデルに作成するモデルバージョンがカスタムコンテナとの互換性を持つようにします。

次に、モデルバージョンの作成時にコンテナの構成の大部分を指定します。

モデルの作成

モデルを作成するには、モデルリソースの作成手順を行います。モデルは、コンテナイメージが格納されている Artifact Registry リポジトリのリージョンと一致するリージョンエンドポイントに作成する必要があります。詳細については、コンテナイメージの公開要件をご覧ください。

モデルバージョンの作成

カスタムコンテナを使用するモデルバージョンを作成する場合は、モデルバージョンに指定したその他のフィールドに加えて、コンテナに固有の次の API フィールドを構成します。

Version.container
Version.routes（省略可）

以降のセクションでは、これらのフィールドの構成方法について説明します。

また、他の API フィールドを構成する際のコンテナに固有の相違点は次のとおりです。

Version.machineType: このフィールドには Compute Engine（N1）マシンタイプを設定する必要があります。
Version.deploymentUri: このフィールドは省略可になります。このフィールドで指定されたアーティファクトにコンテナからアクセスする方法を確認します。
Version.runtimeVersion、Version.framework、Version.pythonVersion、Version.predictionClass、Version.packageUris: これらのフィールドは指定しないでください。

`Version.container` の設定

Version.container フィールドには、ContainerSpec メッセージを指定する必要があります。このメッセージには次のサブフィールドを指定できます。gcloud beta ai-platform versions create コマンドを使用してモデルバージョンを作成する場合は、コマンドラインフラグを使用して各サブフィールドを指定できます。

image（必須）

コンテナイメージの Artifact Registry URI。

gcloud CLI フラグ: --image

command（オプション）

コンテナの ENTRYPOINT をオーバーライドする実行可能ファイルの配列と引数。このフィールドの形式を指定する方法と、args フィールドの操作方法の詳細については、ContainerSpec の API リファレンスをご覧ください。

gcloud CLI フラグ: --command

args（オプション）

コンテナの CMD をオーバーライドする実行可能ファイルの配列と引数。このフィールドの形式を指定する方法と、command フィールドの操作方法の詳細については、ContainerSpec の API リファレンスをご覧ください。

gcloud CLI フラグ: --args

ports（オプション）

ポートの配列。AI Platform Prediction では、リストの最初のポート上のコンテナ、またはデフォルトでは 8080 に実行チェック、ヘルスチェック、予測リクエストが送信されます。追加のポートを指定しても影響はありません。

gcloud CLI フラグ: --ports

env（オプション）

コンテナのエントリポイントコマンド、command フォールドと args フィールドで参照できる環境変数の配列。他のフィールドでこれらの環境変数を参照する方法について詳しくは、ContainerSpec の API リファレンスをご覧ください。

gcloud CLI フラグ: --env-vars

Version.container.env フィールドに設定された変数に加えて、AI Platform Prediction では構成に基づいてその他の変数が設定されます。詳細については、これらのフィールドとコンテナのエントリポイントコマンドでの環境変数の使用をご覧ください。

次の例は、Google Cloud CLI を使用してモデルバージョンを作成するときに、これらのフィールドを指定する方法を示しています。

gcloud beta ai-platform versions create VERSION \
  --region=REGION \
  --model=MODEL \
  --machine-type=n1-standard-4 \
  --image=IMAGE_URI \
  --command=executable,param1,param2 \
  --args=param3,param4 \
  --ports=8081 \
  --env-vars \
    VAR1='value 1' \
    VAR2='value 2'

以下を置き換えます。

VERSION: モデルバージョンの名前
REGION: モデルを作成した AI Platform Prediction エンドポイントのリージョン。
MODEL: モデルの名前
IMAGE_URI: Artifact Registry 内のコンテナイメージの URI。先頭は REGION にする必要があります（コンテナイメージの公開要件を参照）。

`Version.routes` の設定

Version.routes フィールドで RouteMap メッセージを指定できます。このメッセージには次のサブフィールドを指定できます。gcloud beta ai-platform versions create コマンドを使用してモデルバージョンを作成する場合は、コマンドラインフラグを使用して各サブフィールドを指定できます。

health（オプション）

AI Platform Prediction でヘルスチェックを送信するコンテナの HTTP サーバーのパス。

このフィールドを指定しない場合のデフォルトは /v1/models/MODEL/versions/VERSION で、MODEL と VERSION は、モデル名とモデルのバージョンにそれぞれ置き換えられます。

gcloud CLI フラグ: --health-route

predict（オプション）

AI Platform Prediction で予測リクエストを転送するコンテナの HTTP サーバーのパス。

このフィールドを指定しない場合のデフォルトは /v1/models/MODEL/versions/VERSION:predict で、MODEL と VERSION は、モデル名とモデルのバージョンにそれぞれ置き換えられます。

gcloud CLI フラグ: --predict-route

次の例は、gcloud CLI を使用してモデルバージョンを作成するときに、これらのフィールドを指定する方法を示しています。

gcloud beta ai-platform versions create VERSION \
  --region=REGION \
  --model=MODEL \
  --machine-type=n1-standard-4 \
  --image=IMAGE_URI \
  --command=executable,param1,param2 \
  --args=param3,param4 \
  --ports=8081 \
  --env-vars \
    VAR1='value 1' \
    VAR2='value 2' \
  --health-route=/health \
  --predict-route=/predict

以下を置き換えます。

VERSION: モデルバージョンの名前
REGION: モデルを作成した AI Platform Prediction エンドポイントのリージョン。
MODEL: モデルの名前
IMAGE_URI: Artifact Registry 内のコンテナイメージの URI。先頭は REGION にする必要があります（コンテナイメージの公開要件を参照）。

予測リクエストの送信

オンライン予測リクエストをモデルバージョンに送信するには、オンライン予測のガイドに従ってください。このプロセスは、カスタムコンテナを使用しているかどうかにかかわらず、同様に機能します。

ただし、カスタムコンテナを使用する場合、各予測リクエストの本文で、ランタイムバージョンを使用するモデルバージョンのリクエスト本文の要件を満たす必要はありません。コンテナを設計する際は、可能な限りリクエストの本文を標準形式にすることをおすすめします。詳細については、カスタムコンテナの予測リクエストとレスポンスの要件をご覧ください。

次のステップ

コンテナイメージを作成して AI Platform Prediction で使用する例の詳細については、スタートガイド: カスタムコンテナを使用した PyTorch 予測の提供をご覧ください。
カスタムコンテナの要件で、AI Platform Prediction で使用するカスタムコンテナを設計する際に考慮すべき事項を確認する。
カスタムサービスアカウントの使用で、他の Google Cloud サービスにアクセスするためにコンテナの権限を変更する方法を確認する。

カスタム コンテナの使用

コンテナ イメージの準備

コンテナ イメージを作成する

コンテナ イメージを Artifact Registry に push する

モデルとモデル バージョンの作成