커스텀 infoType 감지기

Sensitive Data Protection은 기본 제공 infoType 감지기를 많이 제공하고 있지만, 개발자가 직접 감지기를 만들 수도 있습니다. Sensitive Data Protection이 지정한 패턴과 일치하는 민감한 정보를 검사하거나 익명화하도록 자체 커스텀 infoType 감지기를 정의하여 감지 동작을 맞춤설정할 수 있습니다. 커스텀 infoType 감지기의 유형은 다음과 같습니다.

  • 일반 커스텀 사전 감지기는 Sensitive Data Protection의 검색 기준이 되는 간단한 단어 및 구문 목록입니다. 단어의 수가 최대 수만 개인 경우 일반 커스텀 사전 감지기를 사용합니다.
  • 대형 커스텀 사전 감지기는 Cloud Storage 또는 BigQuery에 저장된 대량의 단어 또는 구문 목록을 통해 Sensitive Data Protection에서 생성됩니다. 목록에 포함된 단어 또는 구문의 수가 최대 수천만 개 수준으로 많은 경우 대형 커스텀 사전 감지기를 사용합니다.
  • 정규 표현식(정규식) 감지기를 사용 설정하면 Sensitive Data Protection에서 정규 표현식 패턴을 기준으로 일치 항목을 감지할 수 있습니다.
  • 서로게이트 infoType 감지기는 Sensitive Data Protection 익명화 변환 CryptoReplaceFfxFpeConfig의 출력을 감지합니다. 이 커스텀 infoType 감지기는 content:reidentify 메서드와 함께 FFX 모드에서 형식 보존 암호화(FPE)를 사용하여 익명화를 역전하기 위해서만 사용됩니다. 이 때문에 이 주제에서는 서로게이트에 대해 자세히 다루지 않습니다. 서로게이트 커스텀 infoType 감지기를 사용하는 방법과 시점에 대한 자세한 내용은 가명처리를 참조하세요.

또한 Sensitive Data Protection에는 다음을 사용하여 스캔 결과를 세부 조정할 수 있게 해주는 검사 규칙 개념이 포함되어 있습니다.

  • 제외 규칙은 내장 또는 커스텀 infoType 감지기에 규칙을 추가하여 잘못된 또는 원치 않는 결과를 제외할 수 있게 해줍니다.
  • 핫워드 규칙은 기본 제공 또는 커스텀 infoType 감지기에 규칙을 추가하여 반환되는 결과의 수량 또는 정확성을 높일 수 있게 해줍니다.

커스텀 infoType 감지기에 대한 자세한 내용은 InfoType 및 infoType 감지기 개념 페이지를 참조하세요. 필요에 따라 사용하거나 변경할 수 있는 몇 가지 예시는 커스텀 infoType 감지기의 예시를 참조하세요. 이 주제의 나머지 부분에서는 Sensitive Data Protection을 사용하여 개발자 고유의 커스텀 infoType 감지기를 만드는 방법을 설명합니다.

커스텀 infoType 감지기를 사용하는 위치

커스텀 infoType 감지기는 CustomInfoType 객체에 정의됩니다. 다음을 구성할 때 InspectConfig 객체에 CustomInfoType을 지정합니다.

API 개요

CustomInfoType 객체를 사용하면 새 콘텐츠에 대한 커스텀 infoType 감지기를 만들거나 사전 정의된 infoType 감지기에서 반환된 결과를 세부 조정할 수 있습니다.

CustomInfoType 객체는 설명된 대로 설정되는 다음 필드로 구성됩니다.

  • "infotype": InfoType 객체에 포함된 커스텀 infoType 감지기의 이름
  • "likelihood": 이 커스텀 infoType 감지기에 반환할 기본 Likelihood 값. 결과가 규칙에 지정된 기준을 충족하는 경우 이 기본 Likelihood를 대체하는 대안 Likelihood 값을 "detectionRules"에 지정할 수 있습니다. "likelihood" 필드를 포함하지 않으면 커스텀 infoType 감지기의 기본값은 VERY_LIKELY입니다. 가능성에 대한 자세한 내용은 가능성 개념 페이지를 참조하세요.
  • "detectionRules": 이 커스텀 infoType 감지기의 모든 결과에 추가로 적용할 DetectionRule 객체 집합. 여기서 핫워드 규칙을 HotwordRule 객체로 지정합니다. 규칙은 지정된 순서에 따라 적용됩니다. 이 필드는 SurrogateType 객체에 적용되지 않습니다.
  • "sensitivityScore": 이 커스텀 infoType 감지기에 반환할 SensitivityScore 값. "sensitivityScore" 필드를 포함하지 않으면 커스텀 infoType 감지기의 기본값은 VERY_LIKELY입니다.

    민감도 점수는 데이터 프로필에서 사용됩니다. 데이터를 프로파일링할 때 Sensitive Data Protection은 infoTypes의 민감도 점수를 사용하여 민감도 수준을 계산합니다.

  • 생성 중인 커스텀 infoType 감지기의 종류에 따라 다음 필드:

    • "dictionary": 검색할 단어 또는 구문 목록을 포함하는 Dictionary 객체입니다.
    • "regex": 정규 표현식을 정의하는 단일 패턴을 포함하는 Regex 객체입니다.
    • "surrogateType": 커스텀 infoType 감지기가 서로게이트임을 나타내는 SurrogateType 객체(있는 경우)입니다. 서로게이트 커스텀 infoType 감지기를 사용하는 방법에 대한 자세한 내용은 가명처리를 참조하세요.
    • "storedType": 기존 StoredInfoType 객체에 대한 참조입니다. 이 필드는 대형 커스텀 사전 감지기를 만들 때 필요합니다. 이 필드를 정의하여 일반 사전 감지기 또는 정규 표현식 감지기를 만들 수도 있지만, 각각 dictionary 필드 또는 regex 필드를 정의하면 더 간단하게 만들 수 있습니다.

다음 단계

다음 주제에서 커스텀 infoType 만들기에 대해 자세히 알아보세요.