AML AI の用語集

この用語集では、AML AI に固有の用語を定義します。機械学習の一般的な用語については、機械学習の用語集をご覧ください。

A


ADC: 各 API クライアントライブラリは、ローカルのアプリケーションのデフォルト認証情報（ADC）を使用する手段を提供します。; ローカル ADC 認証情報と gcloud CLI 認証情報の違いについては、gcloud CLI 認証情報と ADC 認証情報をご覧ください。

B


backtesting: バックテストでは、過去のデータを使用して、生成されたリスクスコアと過去の実際の調査結果を比較することで、モデルのパフォーマンス（観測された再現率）を評価します。

バックテストの結果: AML AI の BacktestResult リソース（「バックテスト結果」とも呼ばれます）は、データセットに対するモデルのパフォーマンスをテストするために作成されます。; 詳細については、モデルを評価するをご覧ください。

C


コアバンキングデータ: コアバンキングデータには、当事者、トランザクション、口座所有に関するデータが含まれます。AML AI が顧客とその銀行取引を把握し、リスクのある特性と行動を検出するのに役立ちます。

コア時間枠: コア時間枠とは、トレーニング、評価例、モデル出力の生成用に、AML AI オペレーション（エンジン構成、トレーニング、バックテスト、予測）で使用される期間を指します。この時間範囲は、データセット内のすべてのテーブルでカバーされている必要があります。; さまざまな API オペレーションでは、特徴とラベルを生成するためのコア時間枠の要件が異なります。詳細については、データスコープと期間を理解するをご覧ください。; ルックバックウィンドウもご覧ください。

D


データの検証: AML AI は、データセット、エンジン構成、モデル、バックテスト結果、予測結果を作成するときにデータ検証チェックを実施します。指定したデータセットがデータ検証に合格しない場合、リソースは作成されず、データ検証エラーが発生します（問題の性質が示されます）。; 詳細については、データ検証エラーをご覧ください。

データセット: AML AI の Dataset リソース（または単に「データセット」）は、AML 入力データモデルに準拠するデータの指定に使用されます。モデルの生成、モデルのパフォーマンスの評価、当事者ごとのリスクスコアと説明可能性の生成に使用できます。; 詳細については、AML データモデルと要件を理解するをご覧ください。

E

終了時刻

データセットを使用する AML AI オペレーションでは、終了時間を指定する必要があります。このフィールドは、トレーニングサンプルや評価サンプル、モデル出力の生成にデータセット内のどの月を使用するかを制御するために使用されます。

オペレーションで使用される終了時間とすべての月は、関連するデータセットの日付範囲内にある必要があります。

たとえば、トレーニングオペレーションでは、15 か月のコア時間枠が必要です。2021 年 10 月 15 日から 2023 年 5 月 21 日の期間と、2023 年 4 月 12 日の終了時間を持つデータセットを使用した場合、トレーニングは 2022 年 1 月から 2023 年 3 月までの例を使用します。これはデータセットの期間にあります。

エンジン構成

AML AI の EngineConfig リソース（「エンジン構成」とも呼ばれます）は、AML AI モデルの生成と評価、リスクスコアと説明可能性の生成に使用されるパラメータを指定します。

これらのパラメータの一部は、エンジンバージョンや予想される調査量など、エンジン構成を作成するために API 呼び出しで指定されます。その他のパラメータは、チューニング済みのハイパーパラメータなど、指定されたデータセットを使用して AML AI によって自動的に生成されます。

詳細については、エンジンを構成するをご覧ください。

エンジンバージョン

AML AI のEngineVersion リソース（「エンジンバージョン」とも呼ばれます）は、AML AI がリスクを検出する方法を定義します。これは、モデルの調整、トレーニング、評価、AML データモデルと特徴ファミリー全体にわたります。

AML AI エンジンを構成するには、使用するエンジンバージョンを指定する必要があります。エンジンバージョンは、そのエンジン構成でモデルをトレーニングして評価し、リスクスコアと説明可能性を生成するために使用されます。

エンジンバージョンの命名は、サポートされている事業部門を表すエンジンタイプ、および、エンジンのサブタイプ、調整、および新しい動作の実装に合わせて更新されるエンジンのメジャーおよびマイナーバージョンで構成されます。

バージョンの例:

aml-retail.default.v004.008.202411-001
aml-commercial.default.v004.008.202411-001

エンジンバージョンの管理の詳細については、エンジンバージョンを管理するをご覧ください。

評価

backtesting もご覧ください。

説明可能性

AML AI モデルは、マネーロンダリングのリスクが高い行動や特性を示す当事者を特定するために使用されます。説明可能性は、特定の当事者に対する高リスクスコアに最も大きく影響を及ぼした行動や特性を示します。

詳細については、予測出力の理解をご覧ください。

予測もご覧ください。

エクスポートメタデータ

いくつかの AML AI リソースには、パフォーマンスとデータ品質に関連する追加情報が保存されています。これらの情報には、エクスポートメタデータオペレーションを使用してアクセスできます。

詳細については、AML 出力データモデルをご覧ください。

F


特徴ファミリー: 特徴ファミリーは、関連する ML 特徴のコレクションであり、調査員と内部監査チームに情報を伝えるための、人間が容易に理解できる分類を提供します。

I


不変エンティティ: AML AI では、調整、トレーニング、バックテストのために、さまざまな時点でのデータのビューを再作成できる必要があります。これを実現するために、AML AI は、時間の経過とともに値を変更できる可変エンティティと、変更されない不変エンティティを区別します。; たとえば、可変エンティティは、時間の経過とともに変化する可能性がある当座預金口座の残高などです。一方、不変エンティティは、2024 年 7 月 2 日の 12:00:00 に当座預金口座から 50 ドルを引き出したイベントなどです。これは、ある時点のスナップショットであるため、変化しません。; AML 入力データモデルでは、不変エンティティを表すテーブルには validity_start_time フィールドと is_entity_deleted フィールドがありません。これには、RiskCaseEvent テーブルが含まれます。; 詳細については、時間の経過に伴うデータの変化についてをご覧ください。; 可変エンティティもご覧ください。

インスタンス: AML AI の Instance リソース（「インスタンス」とも呼ばれます）は、他のすべての AML AI リソースのルートにあり、他の AML AI リソースを操作する前に作成する必要があります。プロジェクト内の同じリージョンに複数のインスタンスを作成できます。; 詳細については、AML AI インスタンスを作成するをご覧ください。

調査プロセス: 調査プロセスは、アラートによってトリガーされる調査全体または一連の調査をカバーします。このプロセスは、調査の最初の部分が開始されたときに開始され、この調査からそれ以上の結果が期待されなくなったときに終了します。; 詳細については、リスクケースのライフサイクルをご覧ください。

L


LOB: 事業部門（LOB）は、AML AI においてリテールバンキングとコマーシャルバンキングの顧客を区別します。データセット、エンジンバージョン、当事者登録は、特定の事業部門、リテールまたはコマーシャルにリンクされます。


ルックバックウィンドウ: コア時間枠に加えて、AML AI オペレーションでは、時間の経過に伴う動作を追跡する特徴を生成できるように、ルックバックウィンドウをデータセットに含める必要があります。; 詳細については、データスコープと期間を理解するをご覧ください。

LRO: エンジン構成、トレーニング、バックテスト、予測などのいくつかの AML AI オペレーションは、長時間実行オペレーション（LRO）を開始します。; 詳細については、長時間実行オペレーションの管理をご覧ください。

M


欠損: 欠損指標は、エンジン構成、モデル、バックテスト結果、予測結果の AML AI リソースを作成するときに、すべての特徴ファミリーに対して計算されます。; この指標は、特徴ファミリーのすべての特徴にわたる欠損値の割合を示します。調整、トレーニング、評価、予測の間の特徴ファミリーの欠落の大幅な変化は、使用されるデータセットに不整合があることを示している可能性があります。

model: AML AI の Model リソース（「モデル」とも呼ばれます）は、リスクスコアと説明可能性の生成に使用できるトレーニング済みモデルを表します。

可変エンティティ: AML AI では、調整、トレーニング、バックテストのために、さまざまな時点でのデータのビューを再作成できる必要があります。これを実現するために、AML AI は、時間の経過とともに値を変更できる可変エンティティと、変更されない不変エンティティを区別します。; たとえば、可変エンティティは、時間の経過とともに変化する可能性がある当座預金口座の残高などです。一方、不変エンティティは、2024 年 7 月 2 日の 12:00:00 に当座預金口座から 50 ドルを引き出したイベントなどです。これは、ある時点のスナップショットであるため、変化しません。; AML 入力データモデルでは、可変エンティティを表すテーブルには validity_start_time と is_entity_deleted フィールドがあります。これには、Party、AccountPartyLink、Transaction、PartySupplementaryData テーブルが含まれます。; 詳細については、時間の経過に伴うデータの変化についてをご覧ください。; 不変エンティティもご覧ください。

O


observed-recall: AML AI は、観測された再現率の指標を使用して、過去のデータに対するモデルのパフォーマンスを測定します。; この指標は、評価中のモデルによって、不審なアクティビティ期間中に高リスクとして識別された可能性のある、選択された期間における肯定的なラベルが付けられた当事者（顧客の離脱など）の割合を示します。

P


当事者: AML 入力データモデルでは、当事者は銀行のお客様を表します。当事者は、個人または法人です。; 詳細については、当事者のテーブルをご覧ください。; 登録済みの当事者もご覧ください。

予測: 予測は、モデルを使用してリスクスコアおよび説明可能性を生成します。これは、AML の調査プロセスで使用できます。

予測結果: AML AI の PredictionResult リソース（「予測結果」とも呼ばれます）は、モデルを使用して予測を作成した結果です。; リスクスコアと説明可能性の生成方法と、調査プロセスでこれらを使用する方法については、リスクスコアと説明可能性の生成のセクションのページをご覧ください。

R


登録済みの当事者: 当事者を使用して予測結果（当事者レベルのリスクスコアと説明可能性など）を作成する前に、当事者を対応する事業部門に登録する必要があります。

リスクケース: リスクケースは、調査プロセスまたはさまざまな当事者の関連する調査プロセスのグループを対象としています。; RiskCaseEvent テーブルをご覧ください。

リスク調査データ: リスク調査データは、リスク調査プロセスと結果を理解するため、また、トレーニングラベルを生成するために AML AI で使用されます。

リスクスコア: AML AI モデルは、マネーロンダリングのリスクが高い行動や特性を示す当事者を特定するために使用されます。これはリスクスコアによって行われます。; リスクスコアは 0 から 1 で変化します。スコアが高いほどリスクが高くなります。ただし、リスクスコアは、マネーロンダリング行為の確率として直接解釈すべきではありません。; 詳細については、予測出力の理解をご覧ください。

リスクの類型: AML AI は、トランザクションモニタリングに関連する5 つの主要な AML リスク類型のマネーロンダリングリスクを識別できます。; 十分な調査と補足的な当事者データ（補足データのテーブルを参照）を使用すると、AML AI はより多くの類型をカバーできます。

S


補足データ: 補足データは、AML AI スキーマのコアバンキングデータとリスク調査データの領域に含まれるデータを超えた追加データであり、マネーロンダリングのリスクの予測に関連します。; たとえば、十分にカバーされていないリスクの類型をより正確に予測するのに役立つリスク指標を特定して追加できます。; 補足データをデータセットに追加するには、PartySupplementaryData テーブルを使用します。


不審なアクティビティ期間: 不審なアクティビティ期間とは、調査対象の当事者が疑わしい行動を行ったと考えられる期間です。これは、モデル評価（バックテスト結果の再現率指標など）で、不審なアクティビティが発生した月にリスクの高いお客様が特定されたことを確認するために使用されます。; 詳細については、リスクケースのライフサイクルをご覧ください。

T


トレーニング: AML AI は、指定されたエンジン構成からのハイパーパラメータ（調整を参照）を使用して、モデル作成の一環としてトレーニングを行います。

チューニング: チューニングはモデルのハイパーパラメータの最適化です。AML AI は、エンジン構成の作成の一環としてチューニングを行います。

V


有効期間の開始時間: 可変エンティティの有効期間の開始時間は、AML AI が特定の時点で銀行が知っているもののビューを作成するために使用されます。これにより、AML AI は最新のデータ（銀行が把握しているデータ）で再利用できるモデルを正確にトレーニングし、高忠実度のリスクスコアを生成できます。; 指定された行の有効期間の開始時間は、この行内のデータが銀行に認識され、修正された最も早い時刻を表します。; 詳細については、時間の経過に伴うデータの変化についてをご覧ください。

AML AI の用語集 コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

A

B

C

D

E

F

I

L

M

O

P

R

S

T

V

AML AI の用語集