이 용어집에서는 AML AI와 관련된 용어를 정의합니다. 일반적인 머신러닝 용어는 머신러닝 용어를 참조하세요.
A
- ADC
각 API 클라이언트 라이브러리는 로컬 애플리케이션 기본 사용자 인증 정보(ADC)를 사용하는 수단을 제공합니다.
로컬 ADC 사용자 인증 정보와 gcloud CLI 사용자 인증 정보의 차이점에 대한 자세한 내용은 gcloud CLI 사용자 인증 정보 및 ADC 사용자 인증 정보를 참조하세요.
B
- 백테스트
- 백테스트는 이전 데이터를 사용하여 모델의 위험 점수를 계산해 이전 조사의 실제 결과와 비교하여 모델의 성능(관찰된 재현율)을 평가합니다.
- 백테스트 결과
- AML AI BacktestResult 리소스('백테스트 결과'라고도 함)가 생성되어 데이터 세트에서 모델의 성능을 테스트합니다.
- 자세한 내용은 모델 평가를 참조하세요.
C
- 핵심 뱅킹 데이터
- 핵심 뱅킹 데이터에는 당사자, 거래, 계좌 보유에 관한 데이터가 포함됩니다. 이러한 데이터는 AML AI가 고객과 고객의 뱅킹 활동을 파악하여 위험한 특성과 동작을 감지할 수 있습니다.
- 핵심 기간
핵심 기간은 학습, 평가 예시 또는 모델 결과를 생성하기 위해 AML AI 작업(엔진 구성, 학습, 백테스트, 예측)에 사용되는 기간을 나타냅니다. 이 시간 범위는 데이터 세트의 모든 테이블에 포함되어야 합니다.
API 작업마다 특성 및 라벨 생성에 대한 핵심 기간의 요구사항이 다릅니다. 자세한 내용은 데이터 범위 및 기간 이해를 참조하세요.
전환 확인 기간도 참고하세요.
D
- 데이터 검증
- AML AI는 데이터 세트, 엔진 구성, 모델, 백테스트 결과 또는 예측 결과를 만들 때 데이터 검증 검사를 수행합니다. 지정된 데이터 세트가 데이터 검증을 통과하지 못하면 리소스가 생성되지 않고 데이터 검증 오류가 발생합니다(문제 특성 표시).
- 자세한 내용은 데이터 검증 오류를 참고하세요.
- 데이터 세트
AML AI 데이터 세트 리소스(또는 '데이터 세트')는 모델 생성, 모델 성능 평가, 당사자별 위험 점수 및 설명 기능 생성에 사용할 수 있는 AML 입력 데이터 모델에 부합하는 데이터를 지정하는 데 사용됩니다.
자세한 내용은 AML 데이터 모델 및 요구사항 이해를 참고하세요.
E
- 종료 시간
데이터 세트를 사용하는 AML AI 작업을 수행하려면 종료 시간을 지정해야 합니다. 이 필드는 데이터 세트에서 학습 또는 평가 예시와 모델 출력을 생성하는 데 사용되는 월을 관리하는 데 사용됩니다.
작업에 사용되는 종료 시간 및 모든 월은 연결된 데이터 세트의 기간 내에 있어야 합니다.
예를 들어 학습 작업에는 15개월의 핵심 기간이 필요합니다. 사용하는 데이터 세트의 기간이 2021년 10월 15일~2023년 5월 21일이고 종료 시간이 2023년 4월 12일인 경우 학습에 데이터 세트의 기간인 2022년 1월~2023년 3월의 예시가 사용됩니다.
- 엔진 구성
AML AI EngineConfig 리소스('엔진 구성'이라고도 함)는 AML AI 모델을 생성 및 평가하고 위험 점수 및 설명 기능을 생성할 때의 매개변수를 지정합니다.
이러한 매개변수 중 일부는 API 호출에 지정되어 엔진 버전 및 예상 조사 볼륨과 같은 엔진 구성을 만듭니다. 다른 매개변수는 지정된 데이터 세트를 사용하여 AML AI에서 자동으로 생성됩니다(예: 조정된 초매개변수).
자세한 내용은 엔진 구성을 참조하세요.
- 엔진 버전
AML AI EngineVersion 리소스('엔진 버전'이라고도 함)는 모델 조정, 학습, 평가, 그리고 전체 AML 데이터 모델 및 특성 계열을 포괄하는 AML AI의 위험 감지 방법의 특징을 정의합니다.
AML AI 엔진을 구성하려면 사용할 엔진 버전을 지정해야 합니다. 그런 다음 엔진 버전을 사용하여 해당 엔진 구성으로 모델의 학습 및 평가를 진행하고 위험 점수 및 설명 기능을 생성합니다.
엔진 버전 이름 지정은 지원되는 비즈니스 라인을 표시하는 엔진 유형, 엔진 하위유형, 조정, 주 버전, 새로운 동작이 구현될 때 업데이트되는 부 버전으로 구성됩니다.
버전 예시는 다음과 같습니다.
aml-retail.default.v004.000.202312-000
aml-commercial.default.v004.000.202312-000
.
엔진 버전 관리에 대한 자세한 내용은 엔진 버전 관리를 참조하세요.
- 평가
백테스트도 참조하세요.
- 설명 기능
AML AI 모델은 자금세탁이 발생할 위험이 높은 행동 또는 특성을 보이는 당사자를 식별하는 데 사용됩니다. 설명 기능은 특정 당사자의 고위험 점수에 가장 많이 기여한 행동 또는 특성을 나타냅니다.
자세한 내용은 예측 결과 이해를 참조하세요.
예측도 참고하세요.
- 메타데이터 내보내기
여러 AML AI 리소스는 내보내기 메타데이터 작업을 사용하여 액세스할 수 있는 성능 및 데이터 품질과 관련된 추가 정보를 저장합니다.
자세한 내용은 AML 결과 데이터 모델을 참조하세요.
F
- 특성 계열
- 특성 계열은 조사 담당자 및 내부 감사팀에 알리기 위해 사람이 판독 가능한 범주를 제공하는 관련 ML 특성의 컬렉션입니다.
I
- 변경할 수 없는 항목
AML AI는 조정, 학습, 백테스트를 위해 다른 시점에서의 데이터 뷰를 다시 만들 수 있어야 합니다. 이를 위해 AML AI는 변경 가능한 항목(시간 경과에 따라 값이 변경될 수 있음)과 변경 불가능한 항목(변경되지 않는 항목)을 구분합니다.
예를 들어 변경 가능한 항목은 시간이 지남에 따라 변경될 수 있는 당좌예금 계좌 잔액일 수 있습니다. 반면에 변경 불가능한 항목은 2024년 7월 2일 12:00:00에 당좌예금 계좌에서 50달러를 인출하는 것과 같은 이벤트일 수 있습니다. 이는 특정 시점의 스냅샷이므로 변경되지 않습니다.
AML 입력 데이터 모델에서 불변 항목을 나타내는 테이블에는
validity_start_time
및is_entity_deleted
필드가 없습니다. 여기에는 RiskCaseEvent 테이블이 포함됩니다.자세한 내용은 시간 경과에 따른 데이터 변경 방식 이해를 참조하세요.
변경 가능한 항목도 참고하세요.
- 인스턴스
AML AI 인스턴스 리소스('인스턴스'라고도 함)는 다른 모든 AML AI 리소스의 루트에 있으며 다른 AML AI 리소스로 작업하기 전에 만들어야 합니다. 프로젝트 내의 동일한 리전에 여러 인스턴스를 만들 수 있습니다.
자세한 내용은 AML AI 인스턴스 만들기를 참조하세요.
- 조사 프로세스
조사 프로세스는 알림으로 트리거되는 전체 조사 또는 조사 절차를 포함합니다. 이 프로세스는 조사의 첫 번째 부분이 시작될 때 시작되고 이 조사의 추가 결과가 더 이상 예상되지 않을 때 종료됩니다.
자세한 내용은 위험 사례의 수명 주기를 참조하세요.
L
- LOB
- 비즈니스 라인(LOB)은 AML AI에서 소매업 및 상업 은행 고객을 구분합니다. 데이터 세트, 엔진 버전, 당사자 등록은 특정 비즈니스 라인, 소매업 또는 상업용에 연결됩니다.
- 전환 확인 기간
AML AI 작업에는 핵심 기간 외에도 시간 경과에 따른 동작을 추적하는 특성을 생성할 수 있는 전환 확인 기간이 포함되어 있어야 합니다.
자세한 내용은 데이터 범위 및 기간 이해를 참조하세요.
- LRO
엔진 구성, 학습, 백테스트, 예측을 포함한 여러 AML AI 작업은 장기 실행 작업(LRO)을 시작합니다.
자세한 내용은 장기 실행 작업 관리를 참고하세요.
M
- 누락
누락 측정항목은 엔진 구성, 모델, 백테스트 결과, 예측 결과와 같은 AML AI 리소스를 만들 때 모든 특성 계열에 대해 계산됩니다.
이 측정항목은 특성 계열의 모든 특성에서 누락된 값의 비중을 보여줍니다. 조정, 학습, 평가, 예측에서 어느 한 특성 계열 누락의 커다란 변화는 사용된 데이터 세트의 불일치를 나타낼 수 있습니다.
- model
AML AI 모델 리소스('모델'이라고도 함)는 위험 점수 및 설명 기능을 생성하는 데 사용할 수 있는 학습된 모델을 나타냅니다.
- 변경 가능한 항목
AML AI는 조정, 학습, 백테스트를 위해 다른 시점에서의 데이터 뷰를 다시 만들 수 있어야 합니다. 이를 위해 AML AI는 변경 가능한 항목(시간 경과에 따라 값이 변경될 수 있음)과 변경 불가능한 항목(변경되지 않는 항목)을 구분합니다.
예를 들어 변경 가능한 항목은 시간이 지남에 따라 변경될 수 있는 당좌예금 계좌 잔액일 수 있습니다. 반면에 변경 불가능한 항목은 2024년 7월 2일 12:00:00에 당좌예금 계좌에서 50달러를 인출하는 것과 같은 이벤트일 수 있습니다. 이는 특정 시점의 스냅샷이므로 변경되지 않습니다.
AML 입력 데이터 모델에서 변경 가능한 항목을 나타내는 테이블에는
validity_start_time
및is_entity_deleted
필드가 있습니다. 여기에는 당사자, AccountPartyLink, 트랜잭션, PartySupplementaryData 테이블이 포함됩니다.자세한 내용은 시간 경과에 따른 데이터 변경 방식 이해를 참조하세요.
변경 불가능한 항목도 참고하세요.
O
- 관찰된 재현율
AML AI는 관찰된 재현율 측정항목을 사용해서 이전 데이터에 대해 모델 성능을 측정합니다.
이 측정항목은 평가 중인 모델에서 의심스러운 활동 기간 동안 고위험으로 식별되었을 선택 기간에서 양성 라벨이 지정된 당사자(예: 고객 퇴출)의 비율을 보여줍니다.
P
- 당사자
AML 입력 데이터 모델에서 당사자는 은행의 고객을 나타냅니다. 당사자는 자연인 또는 법인일 수 있습니다.
자세한 내용은 당사자 표를 참조하세요.
등록된 당사자도 참조하세요.
- 예측
- 예측 결과
AML AI PredictionResult 리소스('예측 결과'라고도 함)는 모델을 사용하여 만든 예측 결과입니다.
위험 점수 및 설명 기능을 생성하는 방법과 조사 프로세스에서 이를 사용하는 방법에 대한 자세한 내용은 위험 점수 및 설명 기능 생성 섹션의 페이지를 참조하세요.
R
- 등록된 당사자
- 당사자를 사용하여 예측 결과(예: 당사자 수준의 위험 점수 및 설명 기능)를 만들려면 먼저 당사자가 해당 비즈니스 라인에 등록되어야 합니다.
- 위험 케이스
위험 케이스에는 여러 당사자에 대한 조사 프로세스 또는 관련 조사 프로세스 그룹이 포함됩니다.
RiskCaseEvent 테이블을 참조하세요.
- 위험 조사 데이터
위험 조사 데이터는 AML AI에서 위험 조사 프로세스 및 결과를 이해하고 학습 라벨을 생성하는 데 사용됩니다.
- 위험 점수
AML AI 모델은 자금세탁이 발생할 위험이 높은 행동 또는 특성을 보이는 당사자를 식별하는 데 사용됩니다. 이는 위험 점수를 통해 수행됩니다.
위험 점수는 0에서 1 사이입니다. 점수가 높을수록 위험이 높습니다. 그러나 위험 점수를 자금세탁 활동 가능성으로 직접 해석해서는 안 됩니다.
자세한 내용은 예측 결과 이해를 참조하세요.
- 위험 유형
AML AI는 트랜잭션 모니터링과 관련된 5가지 핵심 AML 위험 유형을 통해 자금세탁 위험을 식별할 수 있습니다.
AML AI는 충분한 조사와 보조적인 당사자 데이터(추가 데이터 테이블 참조)를 통해 더 많은 유형을 처리할 수 있습니다.
S
- 보조 데이터
보조 데이터는 AML AI 스키마의 핵심 은행 데이터 및 위험 조사 데이터 영역에 포함된 것 이외의 추가적인 데이터로, 자금세탁의 위험 예측과 관련이 있습니다.
예를 들어 다른 방법으로는 다루지 않는 위험 유형을 모델에서 더 잘 예측하는 데 도움이 되는 위험 지표를 식별하고 추가할 수 있습니다.
PartySupplementaryData 테이블을 사용하여 데이터 세트에 보조 데이터를 추가할 수 있습니다.
- 의심스러운 활동 기간
의심스러운 활동 기간은 조사된 당사자가 의심스러운 행동을 보였다고 판단되는 기간입니다. 이는 모델 평가(예: 백테스트 결과의 재현율 측정항목)에서 의심스러운 활동이 발생한 몇 개월 동안 고위험 고객이 식별되었는지 확인하는 데 사용됩니다.
자세한 내용은 위험 사례의 수명 주기를 참조하세요.
T
- training
- AML AI는 지정된 엔진 구성에서 초매개변수(조정 참조)를 사용하여 모델을 만드는 과정에서 학습을 수행합니다.
- 조정
- 조정은 모델 초매개변수의 최적화입니다. AML AI는 엔진 구성을 만드는 과정에서 조정을 수행합니다.
V
- 유효성 시작 시간
변경 가능한 항목의 유효성 시작 시간은 AML AI에서 특정 시점에 은행에서 인식한 사항의 뷰를 구성하는 데 사용됩니다. 이를 통해 AML AI는 최신 데이터(즉, 은행에서 알고 있는)에 재사용할 수 있는 모델을 정확하게 학습시켜 높은 충실도의 위험 점수를 생성할 수 있습니다.
지정된 행의 유효성 시작 시간은 이 행의 데이터를 은행에서 올바르다고 인식한 가장 이른 시간을 나타냅니다.
자세한 내용은 시간 경과에 따른 데이터 변경 방식 이해를 참조하세요.