このページでは、予測出力の生成に必要なデータセットを準備する方法について説明します。
準備
始める前に、次のものが必要になります。
- モデル
- 予測に使用するデータセットに表示されるすべての当事者を登録するには
予測用のデータセットを作成する
既存のデータセット(バックテストに使用していたデータセットなど)を使用して予測を作成できます。ただし、本番環境では、予測実行ごとに新しいデータセットを作成することをおすすめします。
- データセットからモデルへのリネージの追跡はすべてお客様の責任となります。データが変更されないようにするため、データ検証に合格した後に BigQuery テーブルの BigQuery テーブル スナップショットを作成し、AML AI データセットでスナップショットを参照することをおすすめします。定期的に更新されるテーブルを参照する場合、AML AI オペレーションは、オペレーションで AML AI データセットを使用するたびに BigQuery テーブルを読み取ります。そのため、基盤となる BigQuery テーブルを変更すると、チューニング、トレーニング、バックテスト、予測に影響する可能性があります。
- AML AI 用のデータを準備するのガイダンスに沿って BigQuery テーブルを準備し、ステップ 1 でスナップショットを作成したテーブルを使用して、予測用に別の AML AI データセットを作成します。BigQuery のデータセットとテーブルを作成するには、BigQuery のデータセットとテーブルを準備するのコマンドを使用できます。
出力先を準備する
AML AI は、予測結果リソースを作成するときに、BigQuery で予測出力(リスクスコアと説明可能性)を生成します。
予測結果を作成する前に、これらの出力用に BigQuery データセットを作成する必要があります。正しい権限が付与され、API が有効になっているのと同じプロジェクト内にデータセットがある限り、予測出力に任意の BigQuery データセットを使用できます。 AML AI インスタンスと同じロケーションです。
リスクスコアと説明可能性を生成する
予測用のデータセット、トレーニング済みのモデルリソース、出力用の BigQuery データセットが作成されたので、予測結果を作成できます。 これを行うには、予測結果を作成して管理するをご覧ください。