データのスコープと期間を理解する

AML AI は、ある事業部門のマネー ロンダリングのリスクを評価するように設定されています。LoB は、リテールまたはコマーシャルのお客様のいずれかに関連付けられます。

LoB で使用するデータセットを作成する際に、複数のテーブルを含める必要があります。各テーブルは十分な時間範囲をカバーする必要があります。このページでは、必要なテーブルの概要と、各テーブルでカバーする期間を決定する方法について説明します。

使用するテーブル

AML AI で使用する BigQuery データセットには、次のテーブルが含まれている必要があります。

  • Party: その LoB に関連するすべての当事者
    • Retail LOB: 必要な期間内の任意の時点で口座を所有するすべてのリテール バンキングのお客様
    • Commercial LoB: 必要な期間内の任意の時点で口座を所有しているすべてのコマーシャル バンキングのお客様(法人および個人)
  • AccountPartyLink: どの口座をどの当事者が所有していたかに関する完全な履歴。これは、Party テーブル内の当事者が必要な期間内の任意の時点でメインの口座所有者であった場合の、プロダクトやサービスに対するすべての口座をカバーする必要があります。
  • Transaction: 必要な期間の AccountPartyLink テーブル内の口座のすべての取引。
  • RiskCaseEvent: 必要な期間内に AML_PROCESS_START(調査の開始)を持つ、Party テーブル内のリスクケースと当事者に対するすべてのリスクケース イベント(イベントタイプ値を参照)。この表には、必要な期間より前または後のイベント時間のイベントが含まれる場合があります。
  • PartySupplementaryData(使用する場合): 0 ~ 100 の一意の party_supplementary_data_id 値の場合、必要な期間の Party テーブル内のすべての当事者に対する、これらのフィールドの値の完全な履歴を含めます。

追加データの使用

マネー ロンダリングのリスクの特定に関連する当事者の追加データ(スキーマではカバーされていない)がある場合は、補足データをご覧ください。

データセットの時間範囲

データセット内のテーブルがカバーする期間は、任意のオペレーションに対して次のように計算できます。次の情報が必要です。

  • 終了時間。これは、ラベルが使用され、データがチューニング用の特徴量の生成に使用される最新の時点です。
  • 使用するエンジン バージョン(エンジン バージョンのリストを参照)。
  • 実行するオペレーション(チューニング、トレーニング、予測、バックテスト)。
  • 予測またはバックテスト オペレーションの場合、オペレーションを実行する期間の数。API 呼び出しで指定します。

データ スコープの期間について

まず、オペレーションで使用する期間数を計算する必要があります。これは、指定された終了時間の前の最後の暦月で終了する連続月数です。AML AI は、この期間のモデル特徴を評価します。

  • 予測オペレーションとバックテスト オペレーションの場合、これは API 呼び出しで指定された予測期間またはバックテスト期間の数です。
  • その他のオペレーションの場合は、エンジン バージョンとオペレーションによって異なります。たとえば、v004.004 エンジン バージョンでは、チューニングに 18 個の期間を使用し、トレーニングに 15 個の期間を使用します。

次に、各テーブルのルックバック ウィンドウを計算します。これは、AML AI が特定の期間のモデル特徴量を計算するために、そのテーブルから必要なデータの最大月数です。

  • たとえば、v004.004 エンジン バージョンの場合、Transaction テーブルと AccountPartyLink テーブルは 13 か月、RiskCaseEvent テーブルは 12 か月、Party テーブルと PartySupplementaryData テーブルは 0 か月です。

データセットは、選択したオペレーションで使用されるすべての期間のルックバック ウィンドウをカバーする必要があります。特定のオペレーションに必要な終了時刻前までのデータの暦月数は、以下の式で計算できます。

  • 期間数 + ルックバック ウィンドウ - 1

たとえば、チューニングを実施する v004.00X エンジン バージョンの場合、以下が必要です。

  • 18 + 13 - 1 = Transaction テーブルと AccountPartyLink テーブルの 30 か月間のデータ
  • 18 + 12 - 1 = Risk Case Events テーブルの 29 か月分のデータと、テーブル内のリスクケースのその他の最近のイベント
  • 18 + 0 - 1 = Party テーブルと PartySupplementaryData テーブルの 17 か月間のデータ