データのスコープと期間を理解する

AML AI は、ある事業部門のマネー ロンダリングのリスクを評価するように設定されています。LoB は、リテールまたはコマーシャルのお客様のいずれかに関連付けられます。

LoB で使用するデータセットを作成するときは、まず、データセットがカバーする時間範囲を決定します。

データセットの時間範囲

時間範囲は次の 3 つの部分で構成されます。

過去のデータ要件のグラフ

  • コア時間枠: この時間範囲は、データセット内のすべてのテーブルでカバーされている必要があります。さまざまな API オペレーションでは、特徴とラベルを生成するためのコア時間枠の要件が異なります。

    • エンジン構成の作成(調整用): 最小 18 か月
    • モデルの作成(トレーニング用): 最小 15 か月
    • 予測結果の作成(スコアリング用): 最小 1 か月
    • バックテストの結果の作成(バックテストまたはモデル評価用): 最小 3 か月、より正確な評価のためにより多くの月を含める

  • ルックバック ウィンドウ: 一定期間のアクティビティを追跡するモデル機能をサポートするために、コア時間枠の前には、さらに 24 か月のデータが必要です。最小ルックバック ウィンドウの要件はテーブルによって異なります。

  • 追加のリスクケース イベント: モデルのトレーニングと評価のためにより完全なラベルを使用するために、データセットの終了時間よりも新しいリスクケースに関するデータを含めることができます。

たとえば、AML AI の残りの部分を使用するには、エンジン構成を作成する必要があります。少なくとも 42 か月分のトランザクション データ(18 か月のコア時間枠と 24 か月のルックバック ウィンドウ)をカバーするデータセットを作成する必要があります。

使用するテーブル

特定のコア時間枠と LoB について、AML AI で使用される BigQuery データセットには次のテーブルを含める必要があります。

  • Party: コア時間枠全体に対してその LoB に関連するすべての当事者。ルックバック ウィンドウは必要ありません
    • Retail LOB: コア時間枠内の任意の時点で口座を所有するすべてのリテール バンキングのお客様
    • Commercial LoB: コア タイムのいずれかの時点で口座を所有しているすべてのコマーシャル バンキングのお客様(法人および個人)
  • AccountPartyLink: コア時間枠全体と 24 か月間のルックバック ウィンドウの間にどの口座をどの当事者が所有していたかに関する完全な履歴。これは、Party テーブル内の当事者がメインの口座所有者である場合(またはそうであった場合)の、プロダクトやサービスに対するすべての口座をカバーする必要があります。
  • Transaction: コア時間枠全体と 24 か月のルックバック ウィンドウの間の AccountPartyLink テーブル内の口座のすべてのトランザクション
  • RiskCaseEvent: コア時間枠および最小 12 か月のルックバック ウィンドウ内で、AML_PROCESS_START(調査の開始)を持つ Party テーブル内のリスクケースと当事者に対するすべてのリスクケース イベント(type 値を参照)これらのイベントの一部は、コア時間枠とルックバック ウィンドウより前または後のイベント時間を持つ場合があります。
  • PartySupplementaryData(使用する場合): 0 ~ 100 の一意の party_supplementary_data_id 値の場合、コア時間枠(ルックバック ウィンドウは不要)の間の Party テーブル内のすべての当事者に対する、これらのフィールドの値の完全な履歴を含みます。

追加データの使用

マネー ロンダリングのリスクの特定に関連する当事者の追加データ(スキーマではカバーされていない)がある場合は、補足データをご覧ください。