정규 표현식(정규식) 커스텀 infoType 감지기를 사용하면 Sensitive Data Protection 기능에서 정규식 패턴을 기준으로 일치 항목을 감지할 수 있게 해주는 자체 감지기를 만들 수 있습니다. 예를 들어 ###-#-#####
형식으로 된 의료 레코드 번호가 있다고 가정해 보겠습니다. 다음과 같은 정규 표현식 패턴을 정의할 수 있습니다.
[0-9]{3}-[0-9]{1}-[0-9]{5}
Sensitive Data Protection은 다음과 같은 일치 항목을 검색합니다.
012-4-56789
정규 표현식 커스텀 infoType 감지기 심층 분석
API 개요에 요약되어 있듯이, 커스텀 정규 표현식 infoType 감지기를 만들려면 다음이 포함된 CustomInfoType
객체를 정의합니다.
InfoType
객체 내의 커스텀 infoType 감지기에 부여할 이름Likelihood
값(선택사항). 이 필드를 생략하면 정규 표현식 일치는 기본 가능성인VERY_LIKELY
를 반환합니다. 정규 표현식 커스텀 infoType 감지기가 너무 많은 거짓양성을 반환한다고 판단되는 경우 기본 가능성을 낮추고 감지 규칙을 사용하여 컨텍스트 정보로 가능성을 높여보세요. 자세한 내용은 결과 가능성 맞춤설정을 참조하세요.DetectionRule
s 또는 핫워드 규칙(선택사항). 이러한 규칙은 지정된 핫워드의 주어진 근접도 내에서 발견 가능성을 조정합니다. 일치 가능성 맞춤설정에서 핫워드 규칙에 대해 자세히 알아보세요.SensitivityScore
값(선택사항). 이 필드를 생략하면 정규 표현식과 일치 항목이HIGH
의 기본 민감도 수준을 반환합니다.민감도 점수는 데이터 프로필에서 사용됩니다. 데이터를 프로파일링할 때 Sensitive Data Protection은 infoTypes의 민감도 점수를 사용하여 민감도 수준을 계산합니다.
정규 표현식을 정의하는 단일 패턴으로 구성되는
Regex
객체
모든 선택적 구성요소를 포함하는 정규 표현식 커스텀 infoType 감지기는 JSON 객체로서 다음과 같은 형태를 갖게 됩니다.
{
"customInfoTypes":[
{
"infoType":{
"name":"CUSTOM_INFOTYPE_NAME"
},
"likelihood":"LIKELIHOOD_LEVEL",
"detectionRules":[
{
"hotwordRule":{
HOTWORD_RULE
}
},
"sensitivityScore":{
"score": "SENSITIVITY_SCORE"
},
],
"regex":{
"pattern":"REGULAR_EXPRESSION_PATTERN"
}
}
],
...
}
정규 표현식 예: 의료 레코드 번호 대조
다음 JSON 스니펫과 여러 언어로 된 코드에서는 Sensitive Data Protection이 입력 텍스트 'Patient's MRN 444-5-22222'에서 의료 레코드 번호(MRN) 일치 항목을 검색하고 각 일치 항목에 POSSIBLE
가능성을 할당하도록 지시하는 정규 표현식 커스텀 infoType 감지기를 보여줍니다.
C#
Sensitive Data Protection의 클라이언트 라이브러리를 설치하고 사용하는 방법은 Sensitive Data Protection 클라이언트 라이브러리를 참조하세요.
Sensitive Data Protection에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 로컬 개발 환경의 인증 설정을 참조하세요.
Go
Sensitive Data Protection의 클라이언트 라이브러리를 설치하고 사용하는 방법은 Sensitive Data Protection 클라이언트 라이브러리를 참조하세요.
Sensitive Data Protection에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 로컬 개발 환경의 인증 설정을 참조하세요.
Java
Sensitive Data Protection의 클라이언트 라이브러리를 설치하고 사용하는 방법은 Sensitive Data Protection 클라이언트 라이브러리를 참조하세요.
Sensitive Data Protection에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 로컬 개발 환경의 인증 설정을 참조하세요.
Node.js
Sensitive Data Protection의 클라이언트 라이브러리를 설치하고 사용하는 방법은 Sensitive Data Protection 클라이언트 라이브러리를 참조하세요.
Sensitive Data Protection에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 로컬 개발 환경의 인증 설정을 참조하세요.
PHP
Sensitive Data Protection의 클라이언트 라이브러리를 설치하고 사용하는 방법은 Sensitive Data Protection 클라이언트 라이브러리를 참조하세요.
Sensitive Data Protection에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 로컬 개발 환경의 인증 설정을 참조하세요.
Python
Sensitive Data Protection의 클라이언트 라이브러리를 설치하고 사용하는 방법은 Sensitive Data Protection 클라이언트 라이브러리를 참조하세요.
Sensitive Data Protection에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 로컬 개발 환경의 인증 설정을 참조하세요.
REST
JSON과 함께 DLP API를 사용하는 데 대한 자세한 내용은 JSON 빠른 시작을 참조하세요.
JSON 입력:
POST https://dlp.googleapis.com/v2/projects/[PROJECT_ID]/content:inspect?key={YOUR_API_KEY}
{
"item":{
"value":"Patients MRN 444-5-22222"
},
"inspectConfig":{
"customInfoTypes":[
{
"infoType":{
"name":"C_MRN"
},
"regex":{
"pattern":"[1-9]{3}-[1-9]{1}-[1-9]{5}"
},
"likelihood":"POSSIBLE"
}
]
}
}
JSON 출력:
{
"result":{
"findings":[
{
"infoType":{
"name":"C_MRN"
},
"likelihood":"POSSIBLE",
"location":{
"byteRange":{
"start":"13",
"end":"24"
},
"codepointRange":{
"start":"13",
"end":"24"
}
},
"createTime":"2018-11-30T01:29:37.799Z"
}
]
}
}
이 출력은 C_MRN
이름을 지정한 커스텀 infoType 감지기와 커스텀 정규식을 사용하여 Sensitive Data Protection이 의료 레코드 번호를 올바르게 식별하고 지정된 POSSIBLE
확신도를 할당한 것으로 나타납니다.
일치 가능성 맞춤설정에서는 이 예를 기반으로 더 확장해서 컨텍스트 단어를 포함합니다.