AML AI 용어집

이 용어집은 AML AI와 관련된 용어를 정의합니다. 일반적인 머신러닝 용어는 머신러닝 용어집을 참조하세요.

B

백테스트

백테스트는 이전 데이터를 사용하여 모델의 위험 점수를 계산해 이전 조사의 실제 결과와 비교하여 모델의 성능(관찰된 재현율)을 평가합니다.

백테스트 결과

AML AI BacktestResult 리소스('백테스트 결과'라고도 함)가 생성되어 데이터 세트에서 모델의 성능을 테스트합니다. 자세한 내용은 모델 평가를 참조하세요.

C

핵심 뱅킹 데이터

핵심 뱅킹 데이터에는 당사자, 거래, 계정 보류에 대한 데이터가 포함됩니다. 이러한 데이터는 AML AI가 고객과 뱅킹 활동을 파악하여 위험한 특성과 동작을 감지할 수 있습니다.

핵심 기간

핵심 기간은 학습, 평가 예시 또는 모델 결과를 생성하기 위해 AML AI 작업(엔진 구성, 학습, 백테스트, 예측)에 사용되는 기간을 나타냅니다. 이 시간 범위는 데이터 세트의 모든 테이블에 포함되어야 합니다.

API 작업마다 특성 및 라벨 생성에 대한 핵심 기간의 요구사항이 다릅니다. 자세한 내용은 데이터 범위 및 기간 이해를 참조하세요.

D

데이터 세트

AML AI 데이터 세트 리소스(또는 "데이터 세트")는 모델 생성, 모델 성능 평가, 당사자별 위험 점수 및 설명 기능 생성에 사용할 수 있는 AML 입력 데이터 모델에 부합하는 데이터를 지정하는 데 사용됩니다. 자세한 내용은 AML 데이터 모델 및 요구사항 이해를 참조하세요.

데이터 검증

AML AI는 데이터 세트, 엔진 구성, 모델, 백테스트 결과, 예측 결과를 만들 때 데이터 검증 검사를 수행합니다. 지정된 데이터 세트가 데이터 유효성 검사를 통과하지 못하면 리소스가 생성되지 않고 데이터 유효성 검사 오류가 발생합니다(문제 특성 표시). 자세한 내용은 데이터 유효성 검사 오류를 참조하세요.

E

종료 시간

데이터 세트를 사용하는 AML AI 작업의 경우 종료 시간을 지정해야 합니다. 이 필드는 데이터 세트에서 학습 또는 평가 예시와 모델 결과를 생성하는 데 사용되는 월을 관리하는 데 사용됩니다.

작업에 사용된 종료 시간과 모든 월은 연결된 데이터 세트의 기간 내에 있어야 합니다. 예를 들어 학습 작업에는 15개월의 핵심 기간이 필요합니다. 사용하는 데이터 세트의 기간이 2021년 10월 15일~2023년 5월 21일이고 종료 시간이 2023년 4월 12일인 경우 학습에 데이터 세트의 기간인 2022년 1월~2023년 3월의 예시가 사용됩니다.

엔진 구성

AML AI EngineConfig 리소스('엔진 구성'이라고도 함)는 AML AI 모델을 생성 및 평가하고 위험 점수 및 설명 기능을 생성할 때의 매개변수를 지정합니다.

이러한 매개변수 중 일부는 엔진 버전과 예상 조사 볼륨과 같은 엔진 구성을 만들기 위해 API 호출에 지정됩니다. 다른 매개변수는 지정된 데이터 세트를 사용하여 AML AI에서 자동으로 생성됩니다(예: 조정된 초매개변수). 자세한 내용은 엔진 구성을 참조하세요.

엔진 버전

AML AI EngineVersion 리소스('엔진 버전'이라고도 함)는 모델 조정, 학습, 평가, 그리고 전체 AML 데이터 모델 및 특성 계열을 포괄하는 AML AI의 위험 감지 방법의 특징을 정의합니다.

AML AI 엔진을 구성하려면 사용할 엔진 버전을 지정해야 합니다. 그런 다음 엔진 버전을 사용하여 해당 엔진 구성으로 모델의 학습 및 평가를 진행하고 위험 점수 및 설명 기능을 생성합니다.

엔진 버전 이름 지정은 지원되는 비즈니스 라인을 표시하는 엔진 유형, 엔진 하위유형, 조정, 새로운 동작이 구현될 때 업데이트되는 주/부 버전으로 구성됩니다. 예시 버전은 aml-retail.default.v004.000.202312-000 및 aml-commercial.default.v004.000.202312-000 등입니다.

엔진 버전 관리

엔진 버전 관리에 대한 자세한 내용은 엔진 버전 관리를 참조하세요.

평가

백테스트를 참조하세요.

설명 기능

AML AI 모델은 자금세탁이 발생할 위험이 높은 행동 또는 특성을 보이는 당사자를 식별하는 데 사용됩니다. 설명 기능은 특정 당사자의 고위험 점수에 가장 많이 기여한 행동 또는 특성을 나타냅니다. 자세한 내용은 예측 결과 이해를 참조하세요.

메타데이터 내보내기

일부 AML AI 리소스는 내보내기 메타데이터 작업을 사용하여 액세스할 수 있는 성능 및 데이터 품질과 관련된 추가 정보를 저장합니다. 자세한 내용은 AML 결과 데이터 모델을 참조하세요.

F

특성 계열

특성 계열은 관련 ML 특성 모음으로, 사람이 이해할 수 있는 간단한 분류를 제공하여 조사관과 내부 감사팀에 알립니다.

I

변경 불가능한 항목

AML AI는 조정, 학습, 백테스트를 위해 다른 시점에서의 데이터 뷰를 다시 만들 수 있어야 합니다. 이를 위해 AML AI는 변경 가능한 항목, 즉 시간이 지남에 따라 값이 변경될 수 있는 항목과 나타나거나 발생한 후 일반적으로 변경되지 않는 이벤트 등의 변경 불가능한 항목을 구분합니다.

AML 입력 데이터 모델에서 변경 불가능한 항목을 나타내는 테이블에는 validity_start_timeis_entity_deleted 필드가 없습니다. 여기에는 RiskCaseEvent 테이블이 포함됩니다. 자세한 내용은 시간 경과에 따른 데이터 변경 방식 이해를 참조하세요.

변경 가능한 항목도 참조하세요.

인스턴스

AML AI 인스턴스 리소스('인스턴스'라고도 함)는 다른 모든 AML AI 리소스의 루트에 있으며 다른 AML AI 리소스로 작업하기 전에 만들어야 합니다. 한 프로젝트 내의 동일한 리전에서 여러 인스턴스를 만들 수 있습니다. 자세한 내용은 AML AI 인스턴스 만들기를 참조하세요.

조사 프로세스

조사 프로세스는 알림으로 트리거되는 전체 조사 또는 조사 절차를 포함합니다. 이 프로세스는 조사의 첫 번째 부분이 시작될 때 시작되고 이 조사의 추가 결과가 더 이상 예상되지 않을 때 종료됩니다. 자세한 내용은 위험 사례의 수명 주기를 참조하세요.

L

비즈니스 라인(LOB)

비즈니스 라인은 AML AI에서 소매 및 상업 뱅킹 고객을 구분합니다. 데이터 세트, 엔진 버전, 당사자 등록은 특정 비즈니스 라인에 해당하는 소매업 또는 상업용에 연결됩니다.

장기 실행 작업(LRO)

엔진 구성, 학습, 백테스트, 예측을 포함한 여러 AML AI 작업은 장기 실행 작업(LRO)을 시작합니다. 자세한 내용은 장기 실행 작업 관리를 참조하세요.

전환 확인 기간

AML AI 작업에는 핵심 기간 외에도 시간 경과에 따른 동작을 추적하는 특성을 생성할 수 있는 전환 확인 기간이 포함되어 있어야 합니다. 자세한 내용은 데이터 범위 및 기간 이해를 참조하세요.

M

누락

누락 측정항목은 엔진 구성, 모델, 백테스트 결과, 예측 결과와 같은 AML AI 리소스를 만들 때 모든 특성 계열에 대해 계산됩니다.

이 측정항목은 특성 계열의 모든 특성에서 누락된 값의 비율을 보여줍니다. 조정, 학습, 평가, 예측에서 어느 한 특성 계열 누락의 커다란 변화는 사용된 데이터 세트의 불일치를 나타낼 수 있습니다.

모델

AML AI 모델 리소스('모델'이라고도 함)는 위험 점수 및 설명 기능을 생성하는 데 사용할 수 있는 학습된 모델을 나타냅니다.

변경 가능한 항목

AML AI는 조정, 학습, 백테스트를 위해 다른 시점에서의 데이터 뷰를 다시 만들 수 있어야 합니다. 이를 위해 AML AI는 변경 가능한 항목, 즉 시간이 지남에 따라 값이 변경될 수 있는 항목과 나타나거나 발생할 때 일반적으로 변경되지 않는 이벤트 등의 변경 불가능한 항목을 구분합니다.

AML 입력 데이터 모델에서 변경 가능한 항목을 나타내는 테이블에는 validity_start_timeis_entity_deleted 필드가 있습니다. 여기에는 당사자 ,AccountPartyLink ,트랜잭션, PartySupplementaryData 테이블이 포함됩니다. 자세한 내용은 시간 경과에 따른 데이터 변경 방식 이해를 참조하세요.

변경할 수 없는 항목도 참조하세요.

O

관찰된 재현율

AML AI는 관찰된 재현율 측정항목을 사용하여 이전 데이터의 모델 성능을 측정합니다.

이 측정항목은 평가 중인 모델에서 의심스러운 활동 기간 동안 고위험으로 식별되었을 선택 기간에서 양성 라벨이 지정된 당사자(예: 고객 퇴출)의 비율을 보여줍니다.

P

당사자

AML 입력 데이터 모델에서 당사자는 은행의 고객을 나타냅니다. 당사자는 자연인이나 법인일 수 있습니다. 자세한 내용은 당사자 표를 참조하세요. 등록된 당사자도 참조하세요.

예측

예측은 모델을 사용하여 AML 조사 프로세스에서 사용할 수 있는 위험 점수설명 기능을 생성합니다.

예측 결과

AML AI PredictionResult 리소스('예측 결과'라고도 함)는 모델을 사용하여 만든 예측 결과입니다. 위험 점수 및 설명 기능을 생성하는 방법과 조사 프로세스에서 이를 사용하는 방법에 대한 자세한 내용은 위험 점수 및 설명 기능 생성 섹션의 페이지를 참조하세요.

R

등록된 당사자

당사자를 사용하여 예측 결과(예: 당사자 수준의 위험 점수 및 설명 기능)를 만들려면 먼저 당사자가 해당 비즈니스 라인에 등록되어야 합니다.

위험 케이스

위험 케이스에는 여러 당사자에 대한 조사 프로세스 또는 관련 조사 프로세스 그룹이 포함됩니다.

RiskCaseEvent 테이블을 참조하세요.

위험 조사 데이터

위험 조사 데이터는 AML AI에서 위험 조사 프로세스 및 결과를 이해하고 학습 라벨을 생성하는 데 사용됩니다.

위험 점수

AML AI 모델은 자금세탁이 발생할 위험이 높은 행동 또는 특성을 보이는 당사자를 식별하는 데 사용됩니다. 이 작업은 위험 점수를 통해 이루어집니다.

위험 점수는 0부터 1까지 다양합니다. 점수가 높을수록 위험이 높습니다. 그러나 위험 점수를 자금세탁 활동 가능성으로 직접 해석되어서는 안 됩니다. 자세한 내용은 예측 결과 이해를 참조하세요.

위험 유형

AML AI는 트랜잭션 모니터링과 관련된 5가지 핵심 AML 위험 유형을 통해 자금세탁 위험을 식별할 수 있습니다.

AML AI는 충분한 조사와 보조적인 당사자 데이터(추가 데이터 테이블 참조)를 통해 더 많은 유형을 처리할 수 있습니다.

S

보조 데이터

보조 데이터는 AML AI 스키마의 핵심 은행 데이터위험 조사 데이터 영역에 포함된 것 이외의 추가적인 데이터로, 자금세탁의 위험 예측과 관련이 있습니다. 예를 들어 다른 방법으로는 다루지 않는 위험 유형을 더 잘 예측할 수 있도록 위험 표시기를 식별하고 추가할 수 있습니다.

PartySupplementaryData 테이블을 사용하여 데이터 세트에 보조 데이터를 추가할 수 있습니다.

의심스러운 활동 기간

의심스러운 활동 기간은 조사된 당사자가 의심스러운 행동을 보인 것으로 보이는 기간입니다. 이는 모델 평가(예: 백테스트 결과의 재현율 측정항목)에서 의심스러운 활동이 발생한 몇 개월 동안 고위험 고객이 식별되었는지 확인하는 데 사용됩니다. 자세한 내용은 위험 사례의 수명 주기를 참조하세요.

T

학습

AML AI는 지정된 엔진 구성에서 초매개변수(조정 참조)를 사용하여 모델을 만드는 과정으로 학습을 수행합니다.

조정

조정은 모델 초매개변수를 최적화하는 것입니다. AML AI는 엔진 구성을 만드는 과정에서 조정을 수행합니다.

V

유효성 시작 시간

변경 가능한 항목의 유효성 시작 시간은 AML AI에서 특정 시점에 은행에서 인식한 사항의 뷰를 구성하는 데 사용됩니다. 이를 통해 AML AI는 최신 데이터(즉, 현재 은행에서 알고 있는)에 재사용할 수 있는 모델을 정확하게 학습시켜 높은 충실도의 위험 점수를 생성할 수 있습니다. 지정된 행의 유효성 시작 시간은 이 행의 데이터를 은행에서 올바르다고 인식한 가장 이른 시간을 나타냅니다. 자세한 내용은 시간 경과에 따른 데이터 변경 방식 이해를 참조하세요.