オンライン予測ロギングを使用する

AutoML 表形式モデル、AutoML 画像モデル、カスタムトレーニングモデルの場合、モデルのデプロイまたはエンドポイントの作成中に予測ログを有効または無効にできます。このページでは、さまざまな種類の予測ログと、それらのログを有効または無効にする方法を説明します。

予測ログの種類

予測ノードから情報を取得するために、いくつかの予測ログを使用できます。

コンテナロギング。予測ノードから Cloud Logging に stdout ストリームと stderr ストリームが記録されます。これらのログはデバッグに必要です。
- v1 サービスエンドポイントでは、コンテナロギングがデフォルトで有効になっています。モデルをデプロイするときに無効にできます。また、デプロイしたモデルを変更するときに、ロギングを無効または有効にすることもできます。
- v1beta1 サービスエンドポイントでは、コンテナロギングがデフォルトで無効になっています。モデルをデプロイするときに有効にできます。また、デプロイしたモデルを変更するときに、ロギングを無効または有効にすることもできます。
注: Python のデフォルトのロギング動作では、出力が stderr に送信されます。この場合、Cloud Logging の ERROR レベルに表示されます。コンテナログを INFO レベルで表示する場合は、出力を stdout に送信するようにコンテナロギングを構成します。
アクセスロギング。Cloud Logging に各リクエストのタイムスタンプやレイテンシなどの情報が記録されます。

v1 と v1beta1 のサービスエンドポイントの両方で、アクセスロギングはデフォルトで無効になっています。エンドポイントにモデルをデプロイするときに、アクセスロギングを有効にできます。

注: プロジェクトで VPC Service Controls を有効にしている場合、アクセスロギングはサポートされません。
リクエスト / レスポンスロギング。オンライン予測リクエストとレスポンスのサンプルが BigQuery テーブルに記録されます。

リクエスト / レスポンスロギングを有効にするには、予測エンドポイントを作成するか、パッチを適用します。

各タイプのログを個別に有効または無効にできます。

予測ログの設定

エンドポイントの作成時、エンドポイントへのモデルのデプロイ時、デプロイしたモデルの変更時、オンライン予測ログを有効または無効にできます。

アクセスログの設定を更新するには、モデルのデプロイを解除してから、新しい設定でモデルを再デプロイする必要があります。モデルを再デプロイすることなく、コンテナログの設定を更新できます。

秒間クエリ数（QPS）が非常に多いオンライン予測の場合、かなりの数のログが生成される可能性があります。これらのログには Cloud Logging の料金が適用されます。オンライン予測ログの料金を見積もるには、ロギングの請求の見積もりをご覧ください。この費用を減らすには、予測ロギングを無効にします。

予測ログを有効または無効にする

次の例では、デフォルトのログ設定を変更する場所がハイライト表示されています。

コンソール

Google Cloud コンソールでモデルをデプロイするか、新しいエンドポイントを作成するときに、[ロギング] ステップで有効にする予測ログの種類を指定できます。チェックボックスを選択してアクセスロギングまたはコンテナロギングを有効にします。これらのログを無効にするにはチェックボックスをオフにします。

REST API を使用して、コンテナログの設定を更新します。

REST API を使用してリクエスト / レスポンスロギングを有効にします。Google Cloud コンソールと gcloud CLI では、リクエスト / レスポンスロギング構成がサポートされていません。

モデルをデプロイする方法については、Google Cloud コンソールを使用したモデルのデプロイをご覧ください。

gcloud

デプロイされたモデルで有効なログのデフォルトの動作を変更するには、gcloud コマンドにフラグを追加します。

`v1` サービスエンドポイント

gcloud ai endpoints deploy-model を実行します。

gcloud ai endpoints deploy-model ENDPOINT_ID\
  --region=LOCATION \
  --model=MODEL_ID \
  --display-name=DEPLOYED_MODEL_NAME \
  --machine-type=MACHINE_TYPE \
  --accelerator=count=2,type=nvidia-tesla-t4 \
  --disable-container-logging \
  --enable-access-logging

`v1beta1` サービスエンドポイント

gcloud beta ai endpoints deploy-model を実行します。

gcloud beta ai endpoints deploy-model ENDPOINT_ID\
  --region=LOCATION \
  --model=MODEL_ID \
  --display-name=DEPLOYED_MODEL_NAME \
  --machine-type=MACHINE_TYPE \
  --accelerator=count=2,type=nvidia-tesla-t4 \
  --enable-access-logging \
  --enable-container-logging

REST API を使用して、コンテナログの設定を更新します。

モデルをデプロイする方法の詳細については、Vertex AI API を使用したモデルのデプロイをご覧ください。

REST

デプロイされたモデルで有効なログのデフォルトの動作を変更するには、関連するフィールドを True に設定します。

`v1` サービスエンドポイント

コンテナロギングを無効にするには、projects.locations.endpoints.deployModel または projects.locations.endpoints.mutateDeployedModel の呼び出し時に disableContainerLogging フィールドを True に設定します。

アクセスロギングを有効にするには、projects.locations.endpoints.deployModel でモデルをデプロイするときに enableAccessLogging を True に設定します。

`v1beta1` サービスエンドポイント

コンテナロギングを有効にするには、projects.locations.endpoints.deployModel または projects.locations.endpoints.mutateDeployedModel の呼び出し時に enableContainerLogging フィールドを True に設定します。

アクセスロギングを有効にするには、projects.locations.endpoints.deployModel でモデルをデプロイするときに enableAccessLogging を True に設定します。

モデルをデプロイする方法の詳細については、Vertex AI API を使用したモデルのデプロイをご覧ください。

リクエスト / レスポンスロギング

リクエスト / レスポンスロギングを有効にできるのは、projects.locations.endpoints.create を使用してエンドポイントを作成する場合か、projects.locations.endpoints.patch を使用して既存のエンドポイントにパッチを適用する場合のみです。

リクエスト / レスポンスロギングはエンドポイントレベルで行われるため、同じエンドポイントのデプロイメントモデルに送信されたリクエストはログに記録されます。

エンドポイントを作成またはパッチ適用するときに、エンドポイントリソースの predictRequestResponseLoggingConfig フィールドに次のエントリを入力します。

enabled: リクエスト / レスポンスロギングを有効にするには、True に設定します。
samplingPercentage: ログに記録するリクエストの割合を定義する 0～1 の数値。たとえば、すべてのリクエストをログに記録するにはこの値を 1 に設定し、リクエストの 10% をログに記録する場合は 0.1 に設定します。

BigQueryDestination: ロギングに使用される BigQuery テーブル。プロジェクト名のみを指定した場合、新しいデータセットが logging_ENDPOINT_DISPLAY_NAME_ENDPOINT_ID という名前で作成されます。ここで、ENDPOINT_DISPLAY_NAME は BigQuery の命名規則に従います。テーブル名を指定しない場合、request_response_logging という名前の新しいテーブルが作成されます。

BigQuery テーブルのスキーマは次のようになります。

フィールド名	型	モード
`endpoint`	STRING	NULLABLE
`deployed_model_id`	STRING	NULLABLE
`logging_time`	TIMESTAMP	NULLABLE
`request_id`	NUMERIC	NULLABLE
`request_payload`	STRING	REPEATED
`response_payload`	STRING	REPEATED

次に、構成の例を示します。

{
   "predict_request_response_logging_config": {
     "enabled": true,
     "sampling_rate": 0.5,
     "bigquery_destination": {
       "output_uri": "bq://PROJECT_ID.DATASET_NAME.TABLE_NAME"
     }
   }
}

リクエスト / レスポンスロギングと Model Monitoring v1

リクエスト / レスポンスロギングと Model Monitoring v1 は、バックエンドで同じ BigQuery テーブルを使用して受信リクエストをログに記録します。この BigQuery テーブルへの予期しない変更を防ぐため、両方の機能を同時に使用すると次の制限が適用されます。

エンドポイントで Model Monitoring が有効になっている場合、同じエンドポイントに対してリクエスト / レスポンスロギングを有効にすることはできません。
リクエスト / レスポンスロギングを有効にしてから同じエンドポイントで Model Monitoring を有効にすると、リクエスト / レスポンスロギングの構成を変更できません。

次のステップ

オンライン予測ロギングの料金を見積もる。
Google Cloud コンソールまたは Vertex AI API を使用して、モデルをデプロイする。
BigQuery テーブルの作成方法を確認する。

オンライン予測ロギングを使用する

予測ログの種類

予測ログの設定

予測ログを有効または無効にする

コンソール

gcloud

v1 サービス エンドポイント

v1beta1 サービス エンドポイント

REST

v1 サービス エンドポイント

v1beta1 サービス エンドポイント

リクエスト / レスポンス ロギングと Model Monitoring v1

次のステップ

`v1` サービスエンドポイント

`v1beta1` サービスエンドポイント

`v1` サービスエンドポイント

`v1beta1` サービスエンドポイント

リクエスト / レスポンスロギングと Model Monitoring v1