この用語集では、AML AI に固有の用語を定義します。機械学習の一般的な用語については、機械学習の用語集をご覧ください。
A
- ADC
各 API クライアント ライブラリには、ローカルのアプリケーションのデフォルト認証情報(ADC)を使用する手段が用意されています。
ローカル ADC 認証情報と gcloud CLI 認証情報の違いについては、gcloud CLI 認証情報と ADC 認証情報をご覧ください。
B
- backtesting
- バックテストでは、過去のデータを使用して、生成されたリスクスコアと過去の実際の調査結果を比較することで、モデルのパフォーマンス(観測された再現率)を評価します。
- バックテストの結果
- AML AI の BacktestResult リソース(「バックテスト結果」とも呼ばれます)は、データセットに対するモデルのパフォーマンスをテストするために作成されます。
- 詳細については、モデルを評価するをご覧ください。
C
- コア バンキング データ
- コア バンキング データには、当事者、トランザクション、口座所有に関するデータが含まれます。AML AI が顧客とその銀行取引を把握し、リスクのある特性と行動を検出するのに役立ちます。
- コアタイム ウィンドウ
コア時間枠とは、トレーニング、評価例、モデル出力の生成用に、AML AI オペレーション(エンジン構成、トレーニング、バックテスト、予測)で使用される期間を指します。この時間範囲は、データセット内のすべてのテーブルでカバーされている必要があります。
さまざまな API オペレーションでは、特徴とラベルを生成するためのコア時間枠の要件が異なります。詳細については、データ スコープと期間を理解するをご覧ください。
ルックバック ウィンドウもご覧ください。
D
- データの検証
- AML AI は、データセット、エンジン構成、モデル、バックテスト結果、予測結果を作成するときにデータ検証チェックを実施します。指定したデータセットがデータ検証に合格しない場合、リソースは作成されず、データ検証エラーが発生します(問題の性質が示されます)。
- 詳細については、データ検証エラーをご覧ください。
- データセット
AML AI の Dataset リソース(または単に「データセット」)は、AML 入力データモデルに準拠するデータの指定に使用されます。モデルの生成、モデルのパフォーマンスの評価、当事者ごとのリスクスコアと説明可能性の生成に使用できます。
詳細については、AML データモデルと要件を理解するをご覧ください。
E
- 終了時間
データセットを使用する AML AI オペレーションでは、終了時間を指定する必要があります。このフィールドは、トレーニング サンプルや評価サンプル、モデル出力の生成に使用するデータセット内の月を制御するために使用されます。
オペレーションで使用される終了時間とすべての月は、関連するデータセットの日付範囲内にある必要があります。
たとえば、トレーニング オペレーションでは、15 か月のコア時間枠が必要です。2021 年 10 月 15 日から 2023 年 5 月 21 日の期間と、2023 年 4 月 12 日の終了時間を持つデータセットを使用した場合、トレーニングは 2022 年 1 月から 2023 年 3 月までの例を使用します。これはデータセットの期間にあります。
- エンジン構成
AML AI の EngineConfig リソース(「エンジン構成」とも呼ばれます)は、AML AI モデルの生成と評価、リスクスコアと説明可能性の生成に使用されるパラメータを指定します。
これらのパラメータの一部は、エンジン バージョンや予想される調査量など、エンジン構成を作成するために API 呼び出しで指定されます。他のパラメータは、チューニング済みのハイパーパラメータなど、指定されたデータセットを使用して AML AI によって自動的に生成されます。
詳細については、エンジンを構成するをご覧ください。
- エンジンのバージョン
AML AI の EngineVersion リソース(「エンジン バージョン」とも呼ばれます)は、AML AI がリスクを検出する方法を定義します。これは、モデルの調整、トレーニング、評価、AML データモデルと特徴ファミリー全体にわたります。
AML AI エンジンを構成するには、使用するエンジン バージョンを指定する必要があります。エンジン バージョンは、そのエンジン構成でモデルをトレーニングして評価し、リスクスコアと説明可能性を生成するために使用されます。
エンジン バージョンの命名は、サポートされている事業部門を表すエンジン タイプ、および、エンジンのサブタイプ、調整、新しい動作の実装に合わせて更新されるエンジンのメジャーおよびマイナー バージョンで構成されます。
バージョンの例:
aml-retail.default.v004.008.202411-001
aml-commercial.default.v004.008.202411-001
エンジン バージョンの管理の詳細については、エンジン バージョンを管理するをご覧ください。
- 評価
backtestingもご覧ください。
- 説明可能性
AML AI モデルは、マネー ロンダリングのリスクが高い行動や特性を示す当事者を特定するために使用されます。説明可能性は、特定の当事者に対する高リスクスコアに最も大きく影響を及ぼした行動や特性を示します。
詳細については、予測出力の理解をご覧ください。
予測もご覧ください。
- メタデータをエクスポートする
いくつかの AML AI リソースには、パフォーマンスとデータ品質に関連する追加情報が保存されています。これらの情報には、エクスポート メタデータ オペレーションを使用してアクセスできます。
詳細については、AML 出力データモデルをご覧ください。
F
- 特徴ファミリー
- 特徴ファミリーは、関連する ML 特徴のコレクションであり、調査員と内部監査チームに通知するために、人間が容易に理解できる分類を提供します。
I
- 不変エンティティ
AML AI では、調整、トレーニング、バックテストのために、さまざまな時点でのデータのビューを再作成できる必要があります。これを実現するために、AML AI は、可変エンティティ(時間とともに値を変更できるエンティティ)と不変エンティティ(変更されないエンティティ)を区別します。
たとえば、変更可能なエンティティは、時間の経過とともに変化する当座預金口座の残高などです。一方、変更不可能なエンティティは、2024 年 7 月 2 日 12 時 00 分 00 秒に当座預金口座から 50 ドルを引き出したイベントなどです。これは、ある時点のスナップショットであるため、変更されません。
AML 入力データモデルでは、不変エンティティを表すテーブルには
validity_start_time
フィールドとis_entity_deleted
フィールドがありません。これには、RiskCaseEvent テーブルが含まれます。詳細については、時間の経過に伴うデータの変化についてをご覧ください。
可変エンティティもご覧ください。
- インスタンス
AML AI の Instance リソース(「インスタンス」とも呼ばれます)は、他のすべての AML AI リソースのルートにあり、他の AML AI リソースを操作する前に作成する必要があります。プロジェクト内の同じリージョンに複数のインスタンスを作成できます。
詳細については、AML AI インスタンスを作成するをご覧ください。
- 調査プロセス
調査プロセスは、アラートによってトリガーされた調査全体または一連の調査を対象としています。このプロセスは、調査の最初の部分が開始されたときに開始され、この調査からそれ以上の結果が期待されなくなったときに終了します。
詳細については、リスクケースのライフサイクルをご覧ください。
L
- LOB
- 事業部門(LOB)は、AML AI においてリテール バンキングとコマーシャル バンキングの顧客を区別します。データセット、エンジン バージョン、当事者登録は、特定の事業部門、リテールまたはコマーシャルにリンクされます。
- ルックバック ウィンドウ
コア時間枠に加えて、AML AI オペレーションでは、時間の経過に伴う動作を追跡する特徴を生成できるように、ルックバック ウィンドウをデータセットに含める必要があります。
詳細については、データ スコープと期間を理解するをご覧ください。
- LRO
エンジン構成、トレーニング、バックテスト、予測などのいくつかの AML AI オペレーションは、長時間実行オペレーション(LRO)を開始します。
詳細については、長時間実行オペレーションの管理をご覧ください。
M
- 欠損
欠損指標は、エンジン構成、モデル、バックテスト結果、予測結果の AML AI リソースを作成するときに、すべての特徴ファミリーに対して計算されます。
この指標は、特徴ファミリーのすべての特徴の欠損値の割合を示します。調整、トレーニング、評価、予測の間の特徴ファミリーの欠落の大幅な変化は、使用されるデータセットに不整合があることを示している可能性があります。
- model
AML AI の Model リソース(「モデル」とも呼ばれます)は、リスクスコアと説明可能性の生成に使用できるトレーニング済みモデルを表します。
- 可変エンティティ
AML AI では、調整、トレーニング、バックテストのために、さまざまな時点でのデータのビューを再作成できる必要があります。これを実現するために、AML AI は、可変エンティティ(時間の経過とともに値を変更できるエンティティ)と不変エンティティ(変更されないエンティティ)を区別します。
たとえば、変更可能なエンティティは、時間の経過とともに変化する当座預金口座の残高などです。一方、変更不可のエンティティは、2024 年 7 月 2 日午前 00 時 00 分に当座預金口座から 50 ドルを引き出したイベントなどです。これは、ある時点のスナップショットであるため、変更されません。
AML 入力データモデルでは、可変エンティティを表すテーブルには
validity_start_time
とis_entity_deleted
フィールドがあります。これには、Party、AccountPartyLink、Transaction、PartySupplementaryData テーブルが含まれます。詳細については、時間の経過に伴うデータの変化についてをご覧ください。
イミュータブル エンティティもご覧ください。
O
- observed-recall
AML AI は、観測された再現率の指標を使用して、過去のデータに対するモデルのパフォーマンスを測定します。
この指標は、評価中のモデルによって、不審なアクティビティ期間中に高リスクとして識別された可能性のある、選択された期間における肯定的なラベルが付けられた当事者(顧客の離脱など)の割合を示します。
P
- party
AML 入力データモデルでは、当事者は銀行のお客様を表します。当事者は、個人または法人です。
詳細については、Party のテーブルをご覧ください。
登録済みのパーティもご覧ください。
- 予測
- 予測結果
AML AI の PredictionResult リソース(「予測結果」とも呼ばれます)は、モデルを使用して予測を作成した結果です。
リスクスコアと説明可能性の生成方法と、調査プロセスでこれらを使用する方法については、リスクスコアと説明可能性の生成のセクションのページをご覧ください。
R
- 登録済みのパーティ
- 当事者を使用して予測結果(当事者レベルのリスクスコアや説明可能性など)を作成する前に、当事者を対応する事業部門に登録する必要があります。
- リスクケース
リスクケースは、調査プロセスまたはさまざまな当事者の関連する調査プロセスのグループを対象としています。
RiskCaseEvent テーブルをご覧ください。
- リスク調査データ
リスク調査データは、リスク調査プロセスと結果を理解するため、また、トレーニング ラベルを生成するために AML AI で使用されます。
- リスクスコア
AML AI モデルは、マネー ロンダリングのリスクが高い行動や特性を示す当事者を特定するために使用されます。これはリスクスコアによって行われます。
リスクスコアは 0 から 1 で変化します。スコアが高いほどリスクが高くなります。ただし、リスクスコアは、マネーロンダリング行為の確率として直接解釈しないでください。
詳細については、予測出力の理解をご覧ください。
- リスクの類型
AML AI は、トランザクション モニタリングに関連する5 つの主要な AML リスク類型のマネー ロンダリング リスクを識別できます。
十分な調査と補足的な当事者データ(補足データのテーブルを参照)を使用すると、AML AI はより多くの類型をカバーできます。
S
- 補足データ
補足データは、AML AI スキーマのコア バンキング データとリスク調査データに含まれるデータを超えて、マネー ロンダリングのリスクの予測に関連する追加データです。
たとえば、モデルで十分にカバーされていないリスクのタイプをより正確に予測するために、リスク指標を特定して追加できます。
補足データをデータセットに追加するには、PartySupplementaryData テーブルを使用します。
- 不審なアクティビティ期間
不審なアクティビティ期間とは、調査対象の当事者が疑わしい行動を行ったと考えられる期間です。これは、モデル評価(バックテスト結果の再現率指標など)で、不審なアクティビティが発生した月にリスクの高いお客様が特定されたことを確認するために使用されます。
詳細については、リスクケースのライフサイクルをご覧ください。
T
- トレーニング
- AML AI は、指定されたエンジン構成からのハイパーパラメータ(チューニングを参照)を使用して、モデル作成の一環としてトレーニングを行います。
- チューニング
- チューニングはモデルのハイパーパラメータの最適化です。AML AI は、エンジン構成の作成の一環としてチューニングを行います。
V
- 有効期間の開始時間
可変エンティティの有効期間の開始時間は、AML AI が特定の時点で銀行が知っているもののビューを作成するために使用されます。これにより、AML AI は最新のデータ(銀行が把握しているデータ)で再利用できるモデルを正確にトレーニングし、高忠実度のリスクスコアを生成できます。
指定された行の有効期間の開始時間は、この行内のデータが銀行に認識され、修正された最も早い時刻を表します。
詳細については、時間の経過に伴うデータの変化についてをご覧ください。