この用語集では、AML AI に固有の用語を定義しています。一般的な機械学習の用語については、機械学習の用語集をご覧ください。
B
バックテスト
バックテストでは、過去のデータを使用して、生成されたリスクスコアと過去の実際の調査結果を比較することで、モデルのパフォーマンス(観測された再現率)を評価します。
バックテストの結果
AML AI の BacktestResult リソース(「バックテスト結果」とも呼ばれます)は、データセットに対するモデルのパフォーマンスをテストするために作成されます。詳細については、モデルの評価をご覧ください。
C
コア バンキング データ
コア バンキング データには、当事者、トランザクション、口座所有に関するデータが含まれます。AML AI が顧客とその銀行取引を把握し、リスクのある特性と行動を検出するのに役立ちます。
コア時間枠
コア時間枠とは、トレーニング、評価例、モデル出力の生成用に、AML AI オペレーション(エンジン構成、トレーニング、バックテスト、予測)で使用される期間を指します。この時間範囲は、データセット内のすべてのテーブルでカバーされている必要があります。
特徴とラベルを生成するためのコア時間枠に関する要件は、API オペレーションごとに異なります。詳細については、データ スコープと期間を理解するをご覧ください。
D.
データセット
AML AI の Dataset リソース(または単に「データセット」)は、AML 入力データモデルに準拠するデータの指定に使用されます。モデルの生成、モデルのパフォーマンスの評価、当事者ごとのリスクスコアと説明可能性の生成に使用できます。詳細については、AML データモデルと要件を理解するをご覧ください。
データの検証
AML AI は、データセット、エンジン構成、モデル、バックテスト結果、または予測結果の作成時に、データ検証チェックを行います。指定したデータセットがデータ検証に合格しない場合、リソースは作成されず、データ検証エラーが発生します(問題の性質が示されます)。詳細については、データ検証エラーをご覧ください。
E
終了時刻
データセットを使用する AML AI オペレーションでは、終了時間を指定する必要があります。このフィールドは、トレーニングまたは評価の例とモデルの出力の生成に使用するデータセット内の月を制御するために使用されます。
オペレーションで使用される終了時間とすべての月は、関連するデータセットの日付範囲内にある必要があります。たとえば、トレーニング オペレーションでは、15 か月のコア時間枠が必要です。2021 年 10 月 15 日から 2023 年 5 月 21 日の期間と、2023 年 4 月 12 日の終了時間を持つデータセットを使用した場合、トレーニングは 2022 年 1 月から 2023 年 3 月までの例を使用します。これはデータセットの期間にあります。
エンジン構成
AML AI の EngineConfig リソース(「エンジン構成」とも呼ばれます)は、AML AI モデルの生成と評価、リスクスコアと説明可能性の生成に使用されるパラメータを指定します。
これらのパラメータの一部は、エンジン バージョンや予想される調査量など、エンジン構成を作成するために API 呼び出しで指定されます。その他のパラメータは、指定されたデータセット(調整されたハイパーパラメータなど)を使用して AML AI によって自動的に生成されます。詳細については、エンジンを構成するをご覧ください。
エンジン バージョン
AML AI のEngineVersion リソース(「エンジン バージョン」とも呼ばれます)は、AML AI がリスクを検出する方法を定義します。これは、モデルの調整、トレーニング、評価、AML データモデルと特徴ファミリー全体にわたります。
AML AI エンジンを構成するには、使用するエンジンのバージョンを指定する必要があります。そのエンジンのバージョンを使用して、そのエンジン構成でモデルのトレーニングと評価を行い、リスクスコアと説明可能性を生成します。
エンジン バージョンの命名は、サポートされている事業部門を表すエンジン タイプ、および、エンジンのサブタイプ、調整、および新しい動作の実装に合わせて更新されるエンジンのメジャーおよびマイナー バージョンで構成されます。バージョンの例には、aml-retail.default.v004.000.202312-000 と aml-commercial.default.v004.000.202312-000 があります。
エンジンのバージョンの管理の詳細については、エンジンのバージョンの管理をご覧ください。
評価
バックテストをご覧ください。
説明可能性
AML AI モデルは、マネー ロンダリングのリスクが高い行動や特性を示す当事者を特定するために使用されます。説明可能性は、特定の当事者に対する高リスクスコアに最も大きく影響を及ぼした行動や特性を示します。詳細については、予測出力についてをご覧ください。
エクスポート メタデータ
いくつかの AML AI リソースには、エクスポート メタデータ オペレーションを使用してアクセスできる、パフォーマンスとデータ品質に関する追加情報が保存されます。詳細については、AML 出力データモデルをご覧ください。
F
特徴ファミリー
特徴ファミリーは関連する ML 特徴のコレクションであり、調査員と内部監査チームに通知するためのシンプルでわかりやすい分類を提供します。
I
不変のエンティティ
AML AI では、調整、トレーニング、バックテストのために、さまざまな時点でのデータのビューを再作成できる必要があります。これを実現するために、AML AI は、可変エンティティ、つまり時間とともに値を変更できるエンティティと、イベントなど、存在または発生した後で合理的に変更されない不変エンティティを区別します。
AML 入力データモデルでは、不変エンティティを表すテーブルには validity_start_time
フィールドと is_entity_deleted
フィールドはありません。これには、RiskCaseEvent テーブルが含まれます。詳細については、時間の経過に伴うデータの変化についてをご覧ください。
可変エンティティもご覧ください。
インスタンス
AML AI の Instance リソース(「インスタンス」とも呼ばれます)は、他のすべての AML AI リソースのルートにあり、他の AML AI リソースを操作する前に作成する必要があります。1 つのプロジェクト内の同じリージョンに複数のインスタンスを作成できます。詳細については、AML AI インスタンスを作成するをご覧ください。
調査プロセス
調査プロセスは、アラートによってトリガーされた調査全体または一連の調査をカバーします。このプロセスは、調査の最初の部分が開始して始まり、この調査でこれ以上の結果が期待できないときに終了します。詳細については、リスクケースのライフサイクルをご覧ください。
L
事業部門(LOB)
事業部門は、AML AI においてリテール バンキングとコマーシャル バンキングの顧客を区別します。データセット、エンジン バージョン、当事者登録は、特定の事業部門、リテールまたはコマーシャルにリンクされます。
長時間実行オペレーション(LRO)
エンジン構成、トレーニング、バックテスト、予測などのいくつかの AML AI オペレーションは、長時間実行オペレーション(LRO)を開始します。 詳しくは、長時間実行オペレーションの管理をご覧ください。
ルックバック ウィンドウ
コア時間枠に加えて、AML AI オペレーションでは、時間の経過に伴う動作を追跡する特徴を生成できるように、ルックバック ウィンドウをデータセットに含める必要があります。詳細については、データ スコープと期間を理解するをご覧ください。
M
欠損
欠損指標は、AML AI リソース(エンジン構成、モデル、バックテスト結果、予測結果)の作成時に、すべての特徴ファミリーに対して計算されます。
この指標は、特徴ファミリー内のすべての特徴の欠損値の割合を示します。調整、トレーニング、評価、予測の間の特徴ファミリーの欠落の大幅な変化は、使用されるデータセットに不整合があることを示している可能性があります。
model
AML AI の Model リソース(「モデル」とも呼ばれます)は、リスクスコアと説明可能性の生成に使用できるトレーニング済みモデルを表します。
可変エンティティ
AML AI では、調整、トレーニング、バックテストのために、さまざまな時点でのデータのビューを再作成できる必要があります。これを実現するために、AML AI は、時間の経過とともに値を変更できるエンティティと、イベントなど、存在または発生したときに合理的に変更されない不変エンティティを区別します。
AML 入力データモデルでは、可変エンティティを表すテーブルには validity_start_time
と is_entity_deleted
フィールドがあります。これには、Party、AccountPartyLink、Transaction、PartySupplementaryData テーブルが含まれます。
詳細については、時間の経過に伴うデータの変化についてをご覧ください。
不変エンティティもご覧ください。
O
観測された再現率
AML AI は、観測された再現率の指標を使用して、過去のデータに対するモデルのパフォーマンスを測定します。
この指標は、評価中のモデルによって、不審なアクティビティ期間中に高リスクとして識別された可能性のある、選択された期間における肯定的なラベルが付けられた当事者(顧客の離脱など)の割合を示します。
P
当事者
AML 入力データモデルでは、当事者は銀行のお客様を表します。 当事者は、個人または法人です。詳細については、Partyのテーブルをご覧ください。登録当事者もご覧ください。
予測
予測は、モデルを使用してリスクスコアおよび説明可能性を生成します。これは、AML の調査プロセスで使用できます。
予測結果
AML AI の PredictionResult リソース(「予測結果」とも呼ばれます)は、モデルを使用して予測を作成した結果です。リスクスコアと説明可能性の生成方法と、調査プロセスでこれらを使用する方法については、リスクスコアと説明可能性の生成のセクションのページをご覧ください。
R
登録当事者
当事者を使用して予測結果(当事者レベルのリスクスコアと説明可能性など)を作成する前に、当事者を対応する事業部門に登録する必要があります。
リスクケース
リスクケースは、さまざまな当事者の調査プロセスまたは関連する一連の調査プロセスをカバーします。
RiskCaseEvent テーブルをご覧ください。
リスク調査データ
リスク調査データは、リスク調査プロセスと結果を理解するため、また、トレーニング ラベルを生成するために AML AI で使用されます。
リスクスコア
AML AI モデルは、マネー ロンダリングのリスクが高い行動や特性を示す当事者を特定するために使用されます。これにはリスクスコアを使用します。
リスクスコアは 0 から 1 で変化します。スコアが高いほどリスクが高くなります。ただし、リスクスコアはマネー ロンダリング活動の確率として直接解釈されるべきではありません。詳細については、予測出力についてをご覧ください。
リスクの類型
AML AI は、トランザクション モニタリングに関連する5 つの主要な AML リスク類型のマネー ロンダリング リスクを識別できます。
十分な調査と補足的な当事者データ(補足データのテーブルを参照)を使用すると、AML AI はより多くの類型をカバーできます。
S
補足データ
補足データは、AML AI スキーマのコア バンキング データおよびリスク調査データの領域に含まれるもの以外の追加データです。これはマネー ロンダリングのリスクの予測に関係します。たとえば、他の方法ではカバーできないリスク類型をより適切に予測するために、リスク指標を特定して追加できます。
PartySupplementaryData テーブルを使用してデータセットに補足データを追加できます。
不審なアクティビティ期間
不審なアクティビティ期間とは、調査対象の当事者が疑わしい行動を行ったと考えられる期間です。これは、モデル評価(バックテスト結果の再現率指標など)で、不審なアクティビティが発生した月にリスクの高いお客様が特定されたことを確認するために使用されます。詳細については、リスクケースのライフサイクルをご覧ください。
T
トレーニング
AML AI は、指定されたエンジン構成からのハイパーパラメータ(調整を参照)を使用して、モデル作成の一環としてトレーニングを行います。
調整
調整はモデルのハイパーパラメータの最適化です。AML AI は、エンジン構成の作成の一部として調整を行います。
V
有効期間の開始時間
可変エンティティの有効期間の開始時間は、AML AI が特定の時点で銀行が知っているもののビューを作成するために使用されます。これにより、AML AI は、最新のデータ(つまり、現在銀行が認識しているもの)で再利用できるモデルを正確にトレーニングして、忠実度の高いリスクスコアを生成できます。指定された行の有効期間の開始時間は、この行内のデータが銀行に認識され、修正された最も早い時刻を表します。詳細については、時間の経過に伴うデータの変化についてをご覧ください。