Sensitive Data Protection은 기본 제공 infoType 감지기를 많이 제공하고 있지만, 개발자가 직접 감지기를 만들 수도 있습니다. Sensitive Data Protection이 지정한 패턴과 일치하는 민감한 정보를 검사하거나 익명화하도록 자체 커스텀 infoType 감지기를 정의하여 감지 동작을 맞춤설정할 수 있습니다. 커스텀 infoType 감지기의 유형은 다음과 같습니다.
- 일반 커스텀 사전 감지기는 Sensitive Data Protection의 검색 기준이 되는 간단한 단어 및 구문 목록입니다. 단어의 수가 최대 수만 개인 경우 일반 커스텀 사전 감지기를 사용합니다.
- 대형 커스텀 사전 감지기는 Cloud Storage 또는 BigQuery에 저장된 대량의 단어 또는 구문 목록을 통해 Sensitive Data Protection에서 생성됩니다. 목록에 포함된 단어 또는 구문의 수가 최대 수천만 개 수준으로 많은 경우 대형 커스텀 사전 감지기를 사용합니다.
- 정규 표현식(정규식) 감지기를 사용 설정하면 Sensitive Data Protection에서 정규 표현식 패턴을 기준으로 일치 항목을 감지할 수 있습니다.
- 서로게이트 infoType 감지기는 Sensitive Data Protection 익명화 변환
CryptoReplaceFfxFpeConfig
의 출력을 감지합니다. 이 커스텀 infoType 감지기는content:reidentify
메서드와 함께 FFX 모드에서 형식 보존 암호화(FPE)를 사용하여 익명화를 역전하기 위해서만 사용됩니다. 이 때문에 이 주제에서는 서로게이트에 대해 자세히 다루지 않습니다. 서로게이트 커스텀 infoType 감지기를 사용하는 방법과 시점에 대한 자세한 내용은 가명처리를 참조하세요.
또한 Sensitive Data Protection에는 다음을 사용하여 스캔 결과를 세부 조정할 수 있게 해주는 검사 규칙 개념이 포함되어 있습니다.
- 제외 규칙은 내장 또는 커스텀 infoType 감지기에 규칙을 추가하여 잘못된 또는 원치 않는 결과를 제외할 수 있게 해줍니다.
- 핫워드 규칙은 기본 제공 또는 커스텀 infoType 감지기에 규칙을 추가하여 반환되는 결과의 수량 또는 정확성을 높일 수 있게 해줍니다.
커스텀 infoType 감지기에 대한 자세한 내용은 InfoType 및 infoType 감지기 개념 페이지를 참조하세요. 필요에 따라 사용하거나 변경할 수 있는 몇 가지 예시는 커스텀 infoType 감지기의 예시를 참조하세요. 이 주제의 나머지 부분에서는 Sensitive Data Protection을 사용하여 개발자 고유의 커스텀 infoType 감지기를 만드는 방법을 설명합니다.
커스텀 infoType 감지기를 사용하는 위치
커스텀 infoType 감지기는 CustomInfoType
객체에 정의됩니다. 다음을 구성할 때 InspectConfig
객체에 CustomInfoType
을 지정합니다.
projects.content.inspect
를 사용하여 검사InspectJobConfig
내의 검사 작업InspectTemplate
내의 검사 템플릿projects.content.deidentify
를 사용한 익명화DeidentifyTemplate
내부의 익명화 템플릿projects.content.reidentify
를 사용하여 FFX 모드에서 FPE로 익명화된 콘텐츠 재식별. 이 시나리오는 서로게이트 커스텀 infoType 감지기에 한합니다.
API 개요
CustomInfoType
객체를 사용하면 새 콘텐츠에 대한 커스텀 infoType 감지기를 만들거나 사전 정의된 infoType 감지기에서 반환된 결과를 세부 조정할 수 있습니다.
CustomInfoType
객체는 설명된 대로 설정되는 다음 필드로 구성됩니다.
"infotype"
:InfoType
객체에 포함된 커스텀 infoType 감지기의 이름"likelihood"
: 이 커스텀 infoType 감지기에 반환할 기본Likelihood
값. 결과가 규칙에 지정된 기준을 충족하는 경우 이 기본Likelihood
를 대체하는 대안Likelihood
값을"detectionRules"
에 지정할 수 있습니다."likelihood"
필드를 포함하지 않으면 커스텀 infoType 감지기의 기본값은VERY_LIKELY
입니다. 가능성에 대한 자세한 내용은 가능성 개념 페이지를 참조하세요."detectionRules"
: 이 커스텀 infoType 감지기의 모든 결과에 추가로 적용할DetectionRule
객체 집합. 여기서 핫워드 규칙을HotwordRule
객체로 지정합니다. 규칙은 지정된 순서에 따라 적용됩니다. 이 필드는SurrogateType
객체에 적용되지 않습니다."sensitivityScore"
: 이 커스텀 infoType 감지기에 반환할SensitivityScore
값."sensitivityScore"
필드를 포함하지 않으면 커스텀 infoType 감지기의 기본값은VERY_LIKELY
입니다.민감도 점수는 데이터 프로필에서 사용됩니다. 데이터를 프로파일링할 때 Sensitive Data Protection은 infoTypes의 민감도 점수를 사용하여 민감도 수준을 계산합니다.
생성 중인 커스텀 infoType 감지기의 종류에 따라 다음 필드:
"dictionary"
: 검색할 단어 또는 구문 목록을 포함하는Dictionary
객체입니다."regex"
: 정규 표현식을 정의하는 단일 패턴을 포함하는Regex
객체입니다."surrogateType"
: 커스텀 infoType 감지기가 서로게이트임을 나타내는SurrogateType
객체(있는 경우)입니다. 서로게이트 커스텀 infoType 감지기를 사용하는 방법에 대한 자세한 내용은 가명처리를 참조하세요."storedType"
: 기존StoredInfoType
객체에 대한 참조입니다. 이 필드는 대형 커스텀 사전 감지기를 만들 때 필요합니다. 이 필드를 정의하여 일반 사전 감지기 또는 정규 표현식 감지기를 만들 수도 있지만, 각각dictionary
필드 또는regex
필드를 정의하면 더 간단하게 만들 수 있습니다.
다음 단계
다음 주제에서 커스텀 infoType 만들기에 대해 자세히 알아보세요.
- 일반 커스텀 사전 감지기 만들기: 단어 및 구문 목록에서 결과를 대조하기 위한 커스텀 infoType 감지기를 만드는 방법을 알아보세요.
- 대형 커스텀 사전 감지기 만들기: 매우 큰 단어 및 구문 목록에서 결과를 대조하는 방법을 알아보세요. 저장된 커스텀 infoType 감지기는 수천만 개의 단어에서 일치 항목을 확인할 수 있습니다.
- 커스텀 정규 표현식 감지기 만들기: 정규 표현식에서 결과를 대조하기 위한 커스텀 infoType 감지기를 만드는 방법을 알아보세요.
- infoType 감지기를 수정하여 스캔 결과 상세검색: 스캔 결과를 상세검색할 수 있는 기본 제공 및 커스텀 infoType 감지기용 수정자를 만드는 방법을 알아보세요.
- 일치 가능성 맞춤설정: 감지 규칙 및 핫워드를 사용하여 커스텀 감지기 일치 항목에 할당되는 가능성 값을 맞춤설정하는 방법을 알아보세요.
- 커스텀 infoType 감지기의 예시: 필요에 따라 사용하거나 변경할 수 있는 몇 가지 JSON 커스텀 infoType 감지기 정의입니다.