このページは Cloud Translation API によって翻訳されました。

バッチ推論と説明を取得する

このページでは、 Google Cloud コンソールまたは Vertex AI API を使用して、トレーニング済みの AutoML 分類モデルや回帰モデルにバッチ推論リクエストを行う方法について説明します。

バッチ推論リクエストは非同期リクエストです（オンライン推論は同期リクエストです）。モデルをエンドポイントにデプロイすることなく、モデルリソースからバッチ推論を直接リクエストします。表形式データで、すぐにレスポンスを必要とせず 1 回のリクエストで累積データを処理したい場合は、バッチ推論を使用します。

バッチ推論リクエストでは、入力ソースと、Vertex AI が推論結果を格納する出力先を指定します。

始める前に

バッチ推論リクエストを行う前に、まずモデルをトレーニングする必要があります。

入力データ

バッチ推論リクエストの入力データは、モデルが推論を行う際に使用するデータです。分類モデルまたは回帰モデルの場合、入力データは次のいずれかの形式で指定できます。

BigQuery テーブル
Cloud Storage の CSV オブジェクト

入力データにも、モデルのトレーニングに使用した形式を使用することをおすすめします。たとえば、BigQuery のデータを使用してモデルをトレーニングした場合は、BigQuery テーブルをバッチ推論の入力として使用することをおすすめします。Vertex AI は、すべての CSV 入力フィールドを文字列として扱うため、トレーニングデータ形式と入力データ形式を混在させると、エラーが発生することがあります。

データソースには、モデルのトレーニングに使用したすべての列が含まれている必要があります。ただし、順序は問いません。トレーニングデータに含まれなかった列や、トレーニングデータに含まれているがトレーニングへの使用からは除外された列を含めることができます。これらの追加の列は出力に含まれますが、推論結果には影響しません。

入力データの要件

BigQuery テーブル

入力として BigQuery テーブルを選択する場合は、次のことを確認する必要があります。

BigQuery のデータソーステーブルは、100 GB 以下でなければなりません。
テーブルが別のプロジェクトにある場合は、そのプロジェクトの Vertex AI サービスアカウントに BigQuery Data Editor ロールを指定する必要があります。

CSV ファイル

Cloud Storage の入力として CSV オブジェクトを選択する場合は、次のことを確認する必要があります。

データソースの先頭は、列名を含むヘッダー行にする必要があります。
各データソースオブジェクトは 10 GB 以下でなければなりません。最大サイズの 100 GB に達するまで、複数のファイルを含められます。
Cloud Storage バケットが別のプロジェクトにある場合は、そのプロジェクトの Vertex AI サービスアカウントに Storage Object Creator ロールを付与する必要があります。
すべての文字列は二重引用符（"）で囲む必要があります。

出力形式

バッチ推論リクエストの出力形式は、入力形式と同じにする必要はありません。たとえば、BigQuery テーブルを入力として使用した場合は、Cloud Storage の CSV オブジェクトに結果を出力できます。

モデルにバッチ推論リクエストを行う

バッチ推論リクエストを行うには、 Google Cloud コンソールまたは Vertex AI API を使用します。入力データソースは、Cloud Storage バケットまたは BigQuery テーブルに格納された CSV オブジェクトです。入力として送信したデータの量によっては、バッチ推論タスクが完了するまでに時間がかかることがあります。

Google Cloud コンソール

Google Cloud コンソールでバッチ推論をリクエストします。

Google Cloud コンソールの Vertex AI セクションで、[バッチ推論] ページに移動します。
[バッチ推論] に移動
[作成] をクリックして、[新しいバッチ推論] ウィンドウを開きます。
[バッチ推論を定義する] で、次の手順を完了します。
1. バッチ推論の名前を入力します。
2. [モデル名] で、このバッチ推論に使用するモデルの名前を選択します。
3. [バージョン] で、このバッチ推論に使用するモデルバージョンを選択します。
4. [ソースを選択] で、ソース入力データが Cloud Storage 上の CSV ファイルか BigQuery のテーブルかを選択します。
  - CSV ファイルの場合は、CSV 入力ファイルのある Cloud Storage のロケーションを指定します。
  - BigQuery テーブルの場合、テーブルが存在するプロジェクト ID、BigQuery データセット ID、BigQuery テーブルまたはビュー ID を指定します。
5. [出力] で CSV または BigQuery を選択します。
  - CSV の場合は、Vertex AI が出力を保存する Cloud Storage バケットを指定します。
  - BigQuery の場合は、プロジェクト ID または既存のデータセットを指定します。
    - プロジェクト ID を指定するには、[Google Cloud プロジェクト ID] フィールドにプロジェクト ID を入力します。Vertex AI により、新しい出力データセットが作成されます。
    - 既存のデータセットを指定するには、[Google Cloud プロジェクト ID] フィールドに BigQuery パス（bq://projectid.datasetid など）を入力します。
  - 省略可。説明（特徴アトリビューション）付きの推論をリクエストして、モデルがどのように推論を達成したかを確認できます。ローカル特徴量の重要度の値は、各特徴量が推論結果に及ぼした影響の度合いを示します。特徴アトリビューションは、Vertex Explainable AI による Vertex AI の推論に含まれています。
    
    特徴アトリビューションを有効にするには、[このモデルの特徴アトリビューションを有効にする] を選択します。このオプションは、出力先が Cloud Storage の BigQuery または JSONL である場合に使用できます。特徴アトリビューションは Cloud Storage の CSV ではサポートされていません。
省略可: バッチ推論の Model Monitoring 分析はプレビュー版として提供されています。スキュー検出構成をバッチ推論ジョブに追加する方法については、前提条件をご覧ください。
1. [このバッチ推論のモデルのモニタリングを有効にする] をクリックしてオンにします。
2. トレーニングデータソースを選択します。選択したトレーニングデータソースのデータパスまたは場所を入力します。
3. （省略可）[アラートのしきい値] で、アラートをトリガーするしきい値を指定します。
4. [通知メール] に、モデルがアラートのしきい値を超えたときにアラートを受け取るメールアドレスを、カンマ区切り形式で 1 つ以上入力します。
5. 省略可: 通知チャネルの場合、モデルがアラートのしきい値を超えたときにアラートを受け取るには、Cloud Monitoring チャネルを追加します。[通知チャンネルを管理] をクリックして、既存の Cloud Monitoring チャネルを選択するか、新しい Cloud Monitoring チャネルを作成できます。コンソールでは、PagerDuty、Slack、Pub/Sub 通知チャネルがサポートされています。
[作成] をクリックします。

API: BigQuery

REST

バッチ予測をリクエストするには、batchPredictionJobs.create メソッドを使用します。

リクエストのデータを使用する前に、次のように置き換えます。

LOCATION_ID: モデルを保存し、バッチ推論ジョブを実行するリージョン。例: us-central1
PROJECT_ID: 実際のプロジェクト ID
BATCH_JOB_NAME: バッチジョブの表示名
MODEL_ID: 予測に使用するモデルの ID
INPUT_URI: BigQuery データソースへの参照。フォームで次の操作を行います。
```
bq://bqprojectId.bqDatasetId.bqTableId
```
OUTPUT_URI: BigQuery の宛先への参照（推論が作成される場所）。プロジェクト ID と、必要に応じて既存のデータセット ID を指定します。プロジェクト ID のみを指定した場合は、Vertex AI によって新しい出力データセットが作成されます。次の形式を使用します。
```
bq://bqprojectId.bqDatasetId
```
MACHINE_TYPE: このバッチ推論ジョブに使用されるマシンリソース。詳細。
STARTING_REPLICA_COUNT: このバッチ推論ジョブの開始ノード数。ノード数は負荷に応じてノードの最大数まで増減できますが、この数を下回ることはできません。
MAX_REPLICA_COUNT: このバッチ推論ジョブの最大ノード数。ノード数は負荷に応じて増減できますが、最大値を超えることはできません。これは省略可能で、デフォルトは 10 です。
GENERATE_EXPLANATION: 説明（特徴アトリビューション）付きの推論をリクエストして、モデルがどのように推論を達成したかを確認できます。ローカル特徴量の重要度の値は、各特徴量が推論結果に及ぼした影響の度合いを示します。特徴アトリビューションは、Vertex Explainable AI による Vertex AI の推論に含まれています。

デフォルト値は false です。特徴アトリビューションを有効にするには、true に設定します。

HTTP メソッドと URL:

POST https://LOCATION_ID-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION_ID/batchPredictionJobs

リクエストの本文（JSON）:

{
  "displayName": "BATCH_JOB_NAME",
  "model": "MODEL_ID",
  "inputConfig": {
    "instancesFormat": "bigquery",
    "bigquerySource": {
      "inputUri": "INPUT_URI"
    }
  },
  "outputConfig": {
    "predictionsFormat": "bigquery",
    "bigqueryDestination": {
      "outputUri": "OUTPUT_URI"
    }
  },
  "dedicatedResources": {
    "machineSpec": {
      "machineType": "MACHINE_TYPE",
      "acceleratorCount": "0"
    },
    "startingReplicaCount": STARTING_REPLICA_COUNT,
    "maxReplicaCount": MAX_REPLICA_COUNT
  },

  "generateExplanation": GENERATE_EXPLANATION

}

リクエストを送信するには、次のいずれかのオプションを選択します。

curl

注: 次のコマンドは、gcloud init または gcloud auth login を実行して、ユーザーアカウントで gcloud CLI にログインしているか、Cloud Shell を使用して自動的に gcloud CLI にログインしていることを前提としています。gcloud auth list を実行すると、現在アクティブなアカウントを確認できます。

リクエスト本文を request.json という名前のファイルに保存して、次のコマンドを実行します。

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION_ID-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION_ID/batchPredictionJobs"

PowerShell

注: 次のコマンドは、gcloud init または gcloud auth login を実行して、ご自分のユーザーアカウントで gcloud CLI にログインしていることを前提としています。gcloud auth list を実行すると、現在アクティブなアカウントを確認できます。

リクエスト本文を request.json という名前のファイルに保存して、次のコマンドを実行します。

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION_ID-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION_ID/batchPredictionJobs" | Select-Object -Expand Content

次のような JSON レスポンスが返されます。

{
  "name": "projects/PROJECT_ID/locations/LOCATION_ID/batchPredictionJobs/67890",
  "displayName": "batch_job_1 202005291958",
  "model": "projects/12345/locations/us-central1/models/5678",
  "state": "JOB_STATE_PENDING",
  "inputConfig": {
    "instancesFormat": "bigquery",
    "bigquerySource": {
      "inputUri": "INPUT_URI"
    }
  },
  "outputConfig": {
    "predictionsFormat": "bigquery",
    "bigqueryDestination": {
        "outputUri": bq://12345
    }
  },
  "dedicatedResources": {
    "machineSpec": {
      "machineType": "n1-standard-32",
      "acceleratorCount": "0"
    },
    "startingReplicaCount": 2,
    "maxReplicaCount": 6
  },
  "manualBatchTuningParameters": {
    "batchSize": 4
  },
  "generateExplanation": false,
  "outputInfo": {
    "bigqueryOutputDataset": "bq://12345.reg_model_2020_10_02_06_04
  }
  "state": "JOB_STATE_PENDING",
  "createTime": "2020-09-30T02:58:44.341643Z",
  "updateTime": "2020-09-30T02:58:44.341643Z",
}

Java

このサンプルを試す前に、Vertex AI クイックスタート: クライアントライブラリの使用にある Java の設定手順を完了してください。詳細については、Vertex AI Java API のリファレンスドキュメントをご覧ください。

Vertex AI に対する認証を行うには、アプリケーションのデフォルト認証情報を設定します。詳細については、ローカル開発環境の認証を設定するをご覧ください。

次のサンプルでは、INSTANCES_FORMAT と PREDICTIONS_FORMAT を「bigquery」に置き換えます。他のプレースホルダを置き換える方法については、このセクションの「REST とコマンドライン」タブをご覧ください。

import com.google.cloud.aiplatform.v1.BatchPredictionJob;
import com.google.cloud.aiplatform.v1.BigQueryDestination;
import com.google.cloud.aiplatform.v1.BigQuerySource;
import com.google.cloud.aiplatform.v1.JobServiceClient;
import com.google.cloud.aiplatform.v1.JobServiceSettings;
import com.google.cloud.aiplatform.v1.LocationName;
import com.google.cloud.aiplatform.v1.ModelName;
import com.google.gson.JsonObject;
import com.google.protobuf.Value;
import com.google.protobuf.util.JsonFormat;
import java.io.IOException;

public class CreateBatchPredictionJobBigquerySample {

  public static void main(String[] args) throws IOException {
    // TODO(developer): Replace these variables before running the sample.
    String project = "PROJECT";
    String displayName = "DISPLAY_NAME";
    String modelName = "MODEL_NAME";
    String instancesFormat = "INSTANCES_FORMAT";
    String bigquerySourceInputUri = "BIGQUERY_SOURCE_INPUT_URI";
    String predictionsFormat = "PREDICTIONS_FORMAT";
    String bigqueryDestinationOutputUri = "BIGQUERY_DESTINATION_OUTPUT_URI";
    createBatchPredictionJobBigquerySample(
        project,
        displayName,
        modelName,
        instancesFormat,
        bigquerySourceInputUri,
        predictionsFormat,
        bigqueryDestinationOutputUri);
  }

  static void createBatchPredictionJobBigquerySample(
      String project,
      String displayName,
      String model,
      String instancesFormat,
      String bigquerySourceInputUri,
      String predictionsFormat,
      String bigqueryDestinationOutputUri)
      throws IOException {
    JobServiceSettings settings =
        JobServiceSettings.newBuilder()
            .setEndpoint("us-central1-aiplatform.googleapis.com:443")
            .build();
    String location = "us-central1";

    // Initialize client that will be used to send requests. This client only needs to be created
    // once, and can be reused for multiple requests. After completing all of your requests, call
    // the "close" method on the client to safely clean up any remaining background resources.
    try (JobServiceClient client = JobServiceClient.create(settings)) {
      JsonObject jsonModelParameters = new JsonObject();
      Value.Builder modelParametersBuilder = Value.newBuilder();
      JsonFormat.parser().merge(jsonModelParameters.toString(), modelParametersBuilder);
      Value modelParameters = modelParametersBuilder.build();
      BigQuerySource bigquerySource =
          BigQuerySource.newBuilder().setInputUri(bigquerySourceInputUri).build();
      BatchPredictionJob.InputConfig inputConfig =
          BatchPredictionJob.InputConfig.newBuilder()
              .setInstancesFormat(instancesFormat)
              .setBigquerySource(bigquerySource)
              .build();
      BigQueryDestination bigqueryDestination =
          BigQueryDestination.newBuilder().setOutputUri(bigqueryDestinationOutputUri).build();
      BatchPredictionJob.OutputConfig outputConfig =
          BatchPredictionJob.OutputConfig.newBuilder()
              .setPredictionsFormat(predictionsFormat)
              .setBigqueryDestination(bigqueryDestination)
              .build();
      String modelName = ModelName.of(project, location, model).toString();
      BatchPredictionJob batchPredictionJob =
          BatchPredictionJob.newBuilder()
              .setDisplayName(displayName)
              .setModel(modelName)
              .setModelParameters(modelParameters)
              .setInputConfig(inputConfig)
              .setOutputConfig(outputConfig)
              .build();
      LocationName parent = LocationName.of(project, location);
      BatchPredictionJob response = client.createBatchPredictionJob(parent, batchPredictionJob);
      System.out.format("response: %s\n", response);
      System.out.format("\tName: %s\n", response.getName());
    }
  }
}

Python

Vertex AI SDK for Python のインストールまたは更新の方法については、Vertex AI SDK for Python をインストールするをご覧ください。詳細については、Python API リファレンスドキュメントをご覧ください。

次のサンプルでは、instances_format パラメータと predictions_format パラメータを bigquery に設定します。他のパラメータの設定方法については、このセクションの「REST とコマンドライン」タブをご覧ください。

from google.cloud import aiplatform_v1beta1
from google.protobuf import json_format
from google.protobuf.struct_pb2 import Value


def create_batch_prediction_job_bigquery_sample(
    project: str,
    display_name: str,
    model_name: str,
    instances_format: str,
    bigquery_source_input_uri: str,
    predictions_format: str,
    bigquery_destination_output_uri: str,
    location: str = "us-central1",
    api_endpoint: str = "us-central1-aiplatform.googleapis.com",
):
    # The AI Platform services require regional API endpoints.
    client_options = {"api_endpoint": api_endpoint}
    # Initialize client that will be used to create and send requests.
    # This client only needs to be created once, and can be reused for multiple requests.
    client = aiplatform_v1beta1.JobServiceClient(client_options=client_options)
    model_parameters_dict = {}
    model_parameters = json_format.ParseDict(model_parameters_dict, Value())

    batch_prediction_job = {
        "display_name": display_name,
        # Format: 'projects/{project}/locations/{location}/models/{model_id}'
        "model": model_name,
        "model_parameters": model_parameters,
        "input_config": {
            "instances_format": instances_format,
            "bigquery_source": {"input_uri": bigquery_source_input_uri},
        },
        "output_config": {
            "predictions_format": predictions_format,
            "bigquery_destination": {"output_uri": bigquery_destination_output_uri},
        },
        # optional
        "generate_explanation": True,
    }
    parent = f"projects/{project}/locations/{location}"
    response = client.create_batch_prediction_job(
        parent=parent, batch_prediction_job=batch_prediction_job
    )
    print("response:", response)

API: Cloud Storage

REST

バッチ推論をリクエストするには、batchPredictionJobs.create メソッドを使用します。

リクエストのデータを使用する前に、次のように置き換えます。

LOCATION_ID: モデルを保存し、バッチ推論ジョブを実行するリージョン。例: us-central1
PROJECT_ID:
BATCH_JOB_NAME: バッチジョブの表示名
MODEL_ID: 予測に使用するモデルの ID
URI: トレーニングデータを含む Cloud Storage バケットへのパス（URI）。複数指定することも可能です。各 URI の形式は次のとおりです。
```
gs://bucketName/pathToFileName
```
OUTPUT_URI_PREFIX: 推論が書き込まれる Cloud Storage の宛先のパス。Vertex AI は、このパスのタイムスタンプ付きのサブディレクトリにバッチ推論を書き込みます。この値は、次の形式の文字列に設定します。
```
gs://bucketName/pathToOutputDirectory
```
MACHINE_TYPE: このバッチ推論ジョブに使用されるマシンリソース。詳細。
STARTING_REPLICA_COUNT: このバッチ推論ジョブの開始ノード数。ノード数は負荷に応じてノードの最大数まで増減できますが、この数を下回ることはできません。
MAX_REPLICA_COUNT: このバッチ推論ジョブの最大ノード数。ノード数は負荷に応じて増減できますが、最大値を超えることはできません。これは省略可能で、デフォルトは 10 です。
GENERATE_EXPLANATION: 説明（特徴アトリビューション）付きの推論をリクエストして、モデルがどのように推論を達成したかを確認できます。ローカル特徴量の重要度の値は、各特徴量が推論結果に及ぼした影響の度合いを示します。特徴アトリビューションは、Vertex Explainable AI による Vertex AI の推論に含まれています。

デフォルト値は false です。特徴アトリビューションを有効にするには、true に設定します。このオプションは、出力先が JSONL の場合にのみ使用できます特徴アトリビューションは Cloud Storage の CSV ではサポートされていません。

HTTP メソッドと URL:

POST https://LOCATION_ID-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION_ID/batchPredictionJobs

リクエストの本文（JSON）:

{
  "displayName": "BATCH_JOB_NAME",
  "model": "MODEL_ID",
  "inputConfig": {
    "instancesFormat": "csv",
    "gcsSource": {
      "uris": [
        URI1,...
      ]
    },
  },
  "outputConfig": {
    "predictionsFormat": "csv",
    "gcsDestination": {
      "outputUriPrefix": "OUTPUT_URI_PREFIX"
    }
  },
  "dedicatedResources": {
    "machineSpec": {
      "machineType": "MACHINE_TYPE",
      "acceleratorCount": "0"
    },
    "startingReplicaCount": STARTING_REPLICA_COUNT,
    "maxReplicaCount": MAX_REPLICA_COUNT
  },

  "generateExplanation": GENERATE_EXPLANATION

}

リクエストを送信するには、次のいずれかのオプションを選択します。

curl

リクエスト本文を request.json という名前のファイルに保存して、次のコマンドを実行します。

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION_ID-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION_ID/batchPredictionJobs"

PowerShell

リクエスト本文を request.json という名前のファイルに保存して、次のコマンドを実行します。

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION_ID-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION_ID/batchPredictionJobs" | Select-Object -Expand Content

次のような JSON レスポンスが返されます。

{
  "name": "projects/PROJECT__ID/locations/LOCATION_ID/batchPredictionJobs/67890",
  "displayName": "batch_job_1 202005291958",
  "model": "projects/12345/locations/us-central1/models/5678",
  "state": "JOB_STATE_PENDING",
  "inputConfig": {
    "instancesFormat": "csv",
    "gcsSource": {
      "uris": [
        "gs://bp_bucket/reg_mode_test"
      ]
    }
  },
  "outputConfig": {
    "predictionsFormat": "csv",
    "gcsDestination": {
      "outputUriPrefix": "OUTPUT_URI_PREFIX"
    }
  },
  "dedicatedResources": {
    "machineSpec": {
      "machineType": "n1-standard-32",
      "acceleratorCount": "0"
    },
    "startingReplicaCount": 2,
    "maxReplicaCount": 6
  },
  "manualBatchTuningParameters": {
    "batchSize": 4
  }
  "outputInfo": {
    "gcsOutputDataset": "OUTPUT_URI_PREFIX/prediction-batch_job_1 202005291958-2020-09-30T02:58:44.341643Z"
  }
  "state": "JOB_STATE_PENDING",
  "createTime": "2020-09-30T02:58:44.341643Z",
  "updateTime": "2020-09-30T02:58:44.341643Z",
}

バッチ推論の結果を取得する

Vertex AI は、バッチ推論の出力を指定の宛先（BigQuery または Cloud Storage）に送信します。

BigQuery

出力データセット

BigQuery を使用している場合、バッチ推論の出力は出力データセットに保存されます。Vertex AI にデータセットを提供した場合、データセットの名前（BQ_DATASET_NAME）は前に指定した名前です。出力データセットを指定しなかった場合は、Vertex AI によって作成されます。名前（BQ_DATASET_NAME）を確認する手順は次のとおりです。

Google Cloud コンソールで、Vertex AI の [バッチ推論] ページに移動します。
[バッチ推論] に移動
作成した推論を選択します。
出力データセットは [エクスポートロケーション] に表示されます。データセット名は prediction_MODEL_NAME_TIMESTAMP のように構成されています。

出力テーブル

出力データセットには、次の 3 つの出力テーブルのうち 1 つ以上が含まれます。

予測テーブル
このテーブルには、推論がリクエストされた入力データのすべての行が含まれています（TARGET_COLUMN_NAME = null）。
エラーテーブル
このテーブルには、バッチ推論中に発生した重大でないエラーの行が含まれています。それぞれの重大でないエラーは、入力データの中で、Vertex AI が予測を返せなかった各行に対応しています。

予測テーブル

テーブルの名前（BQ_PREDICTIONS_TABLE_NAME）は、「predictions_」にバッチ推論ジョブの開始時のタイムスタンプが追加された形式になっています（predictions_TIMESTAMP）。

推論を取得するには、BigQuery ページに移動します。

[BigQuery] に移動

クエリの形式はモデルタイプによって異なります。

分類:

SELECT predicted_TARGET_COLUMN_NAME.classes AS classes,
predicted_TARGET_COLUMN_NAME.scores AS scores
FROM BQ_DATASET_NAME.BQ_PREDICTIONS_TABLE_NAME

classes は潜在的なクラスのリストで、scores は対応する信頼性スコアです。

回帰:

SELECT predicted_TARGET_COLUMN_NAME.value,
predicted_TARGET_COLUMN_NAME.lower_bound,
predicted_TARGET_COLUMN_NAME.upper_bound
FROM BQ_DATASET_NAME.BQ_PREDICTIONS_TABLE_NAME

特徴アトリビューションを有効にした場合、予測テーブルでも確認できます。特徴 BQ_FEATURE_NAME のアトリビューションにアクセスするには、次のクエリを実行します

SELECT explanation.attributions[OFFSET(0)].featureAttributions.BQ_FEATURE_NAME FROM BQ_DATASET_NAME.BQ_PREDICTIONS_TABLE_NAME

エラーテーブル

テーブルの名前（BQ_ERRORS_TABLE_NAME）は、errors_ にバッチ推論ジョブの開始時のタイムスタンプが追加された形式（errors_TIMESTAMP）になっています。エラー検証テーブルを取得するには:

コンソールで、[BigQuery] ページに移動します。

[BigQuery] に移動

次のクエリを実行します。

SELECT * FROM BQ_DATASET_NAME.BQ_ERRORS_TABLE_NAME

エラーは以下の列に格納されます。

errors_TARGET_COLUMN_NAME.code
errors_TARGET_COLUMN_NAME.message

Cloud Storage

Cloud Storage を出力先に指定した場合、バッチ推論リクエストの結果は、指定したバケット内の新しいフォルダに CSV オブジェクトとして返されます。フォルダの名前は、先頭に「prediction-」が追加され、バッチ推論ジョブの開始時のタイムスタンプが付加されたモデルの名前です。Cloud Storage フォルダ名は、モデルの [バッチ予測] タブで確認できます。

Cloud Storage フォルダには、次の 2 種類のオブジェクトが含まれます。

予測オブジェクト
推論オブジェクトには、「predictions_1.csv」、「predictions_2.csv」の順に名前が付けられます。このオブジェクトには、列名が含まれるヘッダー行に加えて、返されたすべての推論の行が含まれています。推論オブジェクトでは、Vertex AI が推論データを返し、モデルタイプに応じて推論結果の新しい列が 1 つ以上作成されます。
- 分類: ターゲット列の各潜在値に対して、TARGET_COLUMN_NAME_VALUE_score という列が結果に追加されます。この列には、その値のスコアまたは信頼度の推定値が含まれます。
- 回帰: 行の予測値が、predicted_TARGET_COLUMN_NAME という列で返されます。CSV 出力の予測間隔は返されません。
エラーオブジェクト
エラーオブジェクトの名前は errors_1.csv、errors_2.csv などです。ヘッダー行と、Vertex AI が推論を返せなかった入力データ内の各行（null 値を許容しない特徴が null であった場合など）が含まれます。

注: 結果が大きい場合は、複数のオブジェクトに分割されます。

特徴アトリビューションは、Cloud Storage で返されるバッチ推論結果では使用できません。

推論の結果を解釈する

分類

分類モデルは信頼スコアを返します。

信頼スコアは、モデルによる各クラスまたはラベルとテスト項目の関連性の強さを表します。数値が大きいほど、その項目にラベルを適用するモデルの信頼度が高くなります。モデルの結果を受け入れるのに必要な信頼スコアの高さを決定します。

回帰

回帰モデルは推論値を返します。宛先が BigQuery の場合、推論の間隔も返されます。推論区間は、モデルが実際の結果を 95% の信頼度で含む値の範囲を示します。

説明の結果を解釈する

バッチ推論の結果が BigQuery に保存されており、特徴アトリビューションを有効にしている場合、推論テーブルで特徴アトリビューションの値を確認します。

ローカル特徴量の重要度を計算するには、まず、ベースライン推論スコアを計算します。ベースライン値は、数値特徴の中央値とカテゴリ型の特徴のモードを使用して、トレーニングデータから計算されます。ベースライン値から生成される推論が、ベースライン推論スコアです。ベースライン値はモデルに対して 1 回計算され、変更されることはありません。

特定の推論について、各特徴のローカル特徴量の重要度は、ベースラインの推論スコアと比較して、結果に特徴量がどのくらい加算または減算が生じたかを示します。特徴量の重要度の値をすべて合計すると、ベースラインの推論スコアと推論結果の差分と等しくなります。

分類モデルの場合、スコアは常に 0.0～1.0 にすべて含まれます。したがって、分類モデルのローカル特徴量の重要度の値は常に -1.0～1.0 になります。

特徴アトリビューションクエリの例と詳細については、分類と回帰のための特徴アトリビューションをご覧ください。

次のステップ

モデルのエクスポート方法を確認する。