이 주제에서는 대형 커스텀 사전을 만들고 다시 빌드하는 방법을 설명합니다. 또한 여러 오류 시나리오를 다룹니다.
일반 커스텀 사전보다 대형 커스텀 사전을 선택해야 하는 경우
일반 커스텀 사전 감지기는 콘텐츠에서 스캔할 민감한 단어나 구문이 수만 개 있을 때 충분합니다. 수만 개 이상이거나 용어 목록이 자주 변경될 경우에는 수천만 개의 용어를 지원할 수 있는 대형 커스텀 사전을 만드는 것이 좋습니다.
대형 커스텀 사전과 다른 커스텀 infoType의 차이점
대형 커스텀 사전은 각 대형 커스텀 사전에 다음과 같은 두 가지 구성요소가 있다는 점에서 다른 커스텀 infoType과 다릅니다.
- 사용자가 만들고 정의하는 구문 목록. 이 목록은 Cloud Storage 내에 텍스트 파일로 또는 BigQuery 테이블에 열로 저장됩니다.
- 민감한 정보 보호에서 생성되고 Cloud Storage에 저장되는 사전 파일입니다. 사전 파일은 용어 목록 사본, 그리고 검색 및 일치 확인을 보조하는 블룸 필터로 구성됩니다.
대형 커스텀 사전 만들기
이 섹션에서는 대형 커스텀 사전을 만들고 수정하며 다시 빌드하는 방법을 설명합니다.
용어 목록 만들기
새 infoType 감지기에서 검색하려는 모든 단어와 문구가 포함된 목록을 만듭니다. 다음 중 하나를 수행합니다.
- 각 단어 또는 구문이 독립된 줄로 저장된 텍스트 파일을 Cloud Storage 버킷에 넣습니다.
- BigQuery 테이블의 한 열을 단어 및 구문 컨테이너로 지정합니다. 열에서 각 항목에 자체 행을 부여합니다. 모든 사전 단어 및 구문이 하나의 열에 있다는 조건 하에 기존 BigQuery 테이블을 사용할 수 있습니다.
민감한 정보 보호에서 처리하기에 너무 큰 용어 목록이 조합될 수 있습니다. 오류 메시지가 표시되는 경우 이 주제 뒷부분에 있는 오류 문제 해결하기를 참조하세요.
저장된 infoType 만들기
용어 목록을 만든 후 민감한 정보 보호를 사용하여 사전을 만듭니다.
콘솔
Cloud Storage 버킷에서 민감한 정보 보호가 생성된 사전을 저장할 새 폴더를 만듭니다.
민감한 정보 보호는 개발자가 지정한 위치에 사전 파일이 포함된 폴더를 만듭니다.
Google Cloud 콘솔에서 InfoType 만들기 페이지로 이동합니다.
유형에서 대형 맞춤 사전을 선택합니다.
InfoType ID에 저장된 infoType의 식별자를 입력합니다.
검사 및 익명화 작업을 구성할 때 이 식별자를 사용합니다. 이름에 문자, 숫자, 하이픈, 밑줄을 사용할 수 있습니다.
InfoType 표시 이름에 저장된 infoType의 이름을 입력합니다.
이름에 공백과 구두점을 사용할 수 있습니다.
설명에 저장된 infoType이 감지하는 항목에 대한 설명을 입력합니다.
스토리지 유형에서 용어 목록의 위치를 선택합니다.
- BigQuery: 프로젝트 ID, 데이터 세트 ID, 테이블 ID를 입력합니다. 필드 이름 필드에 열 식별자를 입력합니다. 이 테이블에서 최대 1개의 열을 지정할 수 있습니다.
- Google Cloud Storage: 파일의 경로를 입력합니다.
출력 버킷 또는 폴더에 1단계에서 만든 폴더의 Cloud Storage 위치를 입력합니다.
만들기를 클릭합니다.
저장된 infoType의 요약이 표시됩니다. 사전이 생성되고 새로 저장된 infoType을 사용할 준비가 되면 infoType 상태가 준비로 표시됩니다.
C#
민감한 정보 보호의 클라이언트 라이브러리를 설치하고 사용하는 방법은 민감한 정보 보호 클라이언트 라이브러리를 참조하세요.
Sensitive Data Protection에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 로컬 개발 환경의 인증 설정을 참조하세요.
Go
민감한 정보 보호의 클라이언트 라이브러리를 설치하고 사용하는 방법은 민감한 정보 보호 클라이언트 라이브러리를 참조하세요.
Sensitive Data Protection에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 로컬 개발 환경의 인증 설정을 참조하세요.
Java
민감한 정보 보호의 클라이언트 라이브러리를 설치하고 사용하는 방법은 민감한 정보 보호 클라이언트 라이브러리를 참조하세요.
Sensitive Data Protection에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 로컬 개발 환경의 인증 설정을 참조하세요.
Node.js
민감한 정보 보호의 클라이언트 라이브러리를 설치하고 사용하는 방법은 민감한 정보 보호 클라이언트 라이브러리를 참조하세요.
Sensitive Data Protection에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 로컬 개발 환경의 인증 설정을 참조하세요.
PHP
민감한 정보 보호의 클라이언트 라이브러리를 설치하고 사용하는 방법은 민감한 정보 보호 클라이언트 라이브러리를 참조하세요.
Sensitive Data Protection에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 로컬 개발 환경의 인증 설정을 참조하세요.
Python
민감한 정보 보호의 클라이언트 라이브러리를 설치하고 사용하는 방법은 민감한 정보 보호 클라이언트 라이브러리를 참조하세요.
Sensitive Data Protection에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 로컬 개발 환경의 인증 설정을 참조하세요.
REST
- Cloud Storage 버킷에서 사전의 새 폴더를 만듭니다. 민감한 정보 보호는 개발자가 지정한 위치에 사전 파일이 포함된 폴더를 만듭니다.
storedInfoTypes.create
메서드를 사용하여 사전을 만듭니다.create
메서드에는 다음 매개변수가 사용됩니다.- 저장된 infoType의 구성이 포함된
StoredInfoTypeConfig
객체입니다. 포함되는 요소는 다음과 같습니다.description
: 사전에 대한 설명displayName
: 사전에 지정할 이름LargeCustomDictionaryConfig
: 대규모 맞춤 사전의 구성을 포함합니다. 포함되는 요소는 다음과 같습니다.BigQueryField
: 용어 목록이 BigQuery에 저장되는 경우 지정됩니다. 목록이 저장된 테이블에 대한 참조, 그리고 각 사전 구문이 들어 있는 필드가 포함됩니다.CloudStorageFileSet
: 용어 목록이 Cloud Storage에 저장되는 경우 지정됩니다. Cloud Storage의 소스 위치에 대한 URL이"gs://[PATH_TO_GS]"
형식으로 포함됩니다. 와일드카드가 지원됩니다.outputPath
: 생성된 사전을 저장할 Cloud Storage 버킷의 위치 경로입니다.
storedInfoTypeId
: 저장된 infoType의 식별자입니다. 저장된 infoType을 다시 빌드하거나 삭제하거나 검사 또는 익명화 작업에서 사용할 때 이 식별자를 사용하여 저장된 infoType을 참조합니다. 이 필드를 비워 두면 자동으로 식별자가 생성됩니다.
- 저장된 infoType의 구성이 포함된
다음은 storedInfoTypes.create
메서드로 전송될 때 새 저장된 infoType(특히 대규모 커스텀 사전 감지기)을 만드는 JSON 예시입니다. 이 예시에서는 공개적으로 사용 가능한 BigQuery 데이터베이스(bigquery-public-data.samples.github_nested
)에 저장된 용어 목록에서 저장된 infoType을 만듭니다. 데이터베이스에는 커밋에 사용되는 모든 GitHub 사용자 이름이 포함됩니다. 생성된 사전의 출력 경로는 dlptesting
이라는 Cloud Storage 버킷으로 설정되고 저장된 infoType의 이름은 github-usernames
입니다.
JSON 입력
POST https://dlp.googleapis.com/v2/projects/PROJECT_ID/storedInfoTypes
{
"config":{
"displayName":"GitHub usernames",
"description":"Dictionary of GitHub usernames used in commits",
"largeCustomDictionary":{
"outputPath":{
"path":"gs://[PATH_TO_GS]"
},
"bigQueryField":{
"table":{
"datasetId":"samples",
"projectId":"bigquery-public-data",
"tableId":"github_nested"
}
}
}
},
"storedInfoTypeId":"github-usernames"
}
사전 다시 빌드
사전을 업데이트하려면 먼저 소스 용어 목록을 업데이트한 다음 민감한 정보 보호에 지시하여 저장된 infoType을 다시 빌드하도록 지시합니다.
Cloud Storage 또는 BigQuery의 기존 소스 용어 목록을 업데이트합니다.
필요에 따라 용어 또는 구문을 추가, 삭제, 변경합니다.
Google Cloud 콘솔이나
storedInfoTypes.patch
메서드를 사용하여 저장된 infoType을 '다시 빌드'하여 새 버전을 만듭니다.다시 빌드하면 이전 사전을 대체하는 새 버전의 사전이 생성됩니다.
저장된 infoType을 새 버전으로 다시 빌드하면 이전 버전이 삭제됩니다. 민감한 정보 보호가 저장된 infoType을 업데이트하는 동안 저장된 infoType의 상태는 '대기 중'입니다. 이 기간에는 저장된 infoType의 이전 버전이 여전히 존재하는 것입니다. 저장된 infoType이 대기 중 상태일 때 실행하는 모든 스캔은 이전 버전의 저장된 infoType을 사용하여 실행됩니다.
저장된 infoType을 다시 빌드하는 방법은 다음과 같습니다.
콘솔
- Cloud Storage 또는 BigQuery에서 용어 목록을 업데이트하고 저장합니다.
Google Cloud 콘솔에서 저장된 infoType 목록으로 이동합니다.
업데이트하려는 저장된 infoType의 ID를 클릭합니다.
infoType 세부정보 화면에서 데이터 다시 빌드를 클릭합니다.
민감한 정보 보호는 소스 용어 목록에 적용한 변경사항으로 저장된 infoType을 다시 빌드합니다. 저장된 infoType의 상태가 '준비됨'이면 사용할 수 있습니다. 저장된 infoType을 사용하는 모든 템플릿 또는 작업 트리거에서 자동으로 다시 빌드된 버전을 사용합니다.
C#
민감한 정보 보호의 클라이언트 라이브러리를 설치하고 사용하는 방법은 민감한 정보 보호 클라이언트 라이브러리를 참조하세요.
Sensitive Data Protection에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 로컬 개발 환경의 인증 설정을 참조하세요.
Go
민감한 정보 보호의 클라이언트 라이브러리를 설치하고 사용하는 방법은 민감한 정보 보호 클라이언트 라이브러리를 참조하세요.
Sensitive Data Protection에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 로컬 개발 환경의 인증 설정을 참조하세요.
Java
민감한 정보 보호의 클라이언트 라이브러리를 설치하고 사용하는 방법은 민감한 정보 보호 클라이언트 라이브러리를 참조하세요.
Sensitive Data Protection에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 로컬 개발 환경의 인증 설정을 참조하세요.
Node.js
민감한 정보 보호의 클라이언트 라이브러리를 설치하고 사용하는 방법은 민감한 정보 보호 클라이언트 라이브러리를 참조하세요.
Sensitive Data Protection에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 로컬 개발 환경의 인증 설정을 참조하세요.
PHP
민감한 정보 보호의 클라이언트 라이브러리를 설치하고 사용하는 방법은 민감한 정보 보호 클라이언트 라이브러리를 참조하세요.
Sensitive Data Protection에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 로컬 개발 환경의 인증 설정을 참조하세요.
Python
민감한 정보 보호의 클라이언트 라이브러리를 설치하고 사용하는 방법은 민감한 정보 보호 클라이언트 라이브러리를 참조하세요.
Sensitive Data Protection에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 로컬 개발 환경의 인증 설정을 참조하세요.
REST
용어 목록 업데이트
대규모 맞춤 사전의 용어 목록만 업데이트하는 경우 storedInfoTypes.patch
요청에 name
필드만 필요합니다. 다시 빌드하려는 저장된 infoType의 전체 리소스 이름을 입력합니다.
다음 패턴은 name
필드의 유효한 항목을 나타냅니다.
organizations/ORGANIZATION_ID/storedInfoTypes/STORED_INFOTYPE_ID
projects/PROJECT_ID/storedInfoTypes/STORED_INFOTYPE_ID
STORED_INFOTYPE_ID를 다시 빌드하려는 저장된 infoType의 식별자로 바꿉니다.
저장된 infoType의 식별자를 모르는 경우 storedInfoTypes.list
메서드를 호출하여 현재 저장된 모든 infoType의 목록을 확인합니다.
예
PATCH https://dlp.googleapis.com/v2/projects/PROJECT_ID/storedInfoTypes/STORED_INFOTYPE_ID
이 경우 요청 본문이 필요하지 않습니다.
소스 용어 목록 전환
저장된 infoType의 소스 용어 목록을 BigQuery에 저장된 것에서 Cloud Storage에 저장된 것으로 변경할 수 있습니다. storedInfoTypes.patch
메서드를 사용하되, CloudStorageFileSet
객체를 이전에 BigQueryField
객체에서 사용한 LargeCustomDictionaryConfig
에 포함합니다. 그런 다음 updateMask
매개변수를 FieldMask
형식을 사용해 다시 빌드한 저장된 infoType 매개변수로 설정합니다. 예를 들어 다음 JSON은 updateMask
매개변수에서 Cloud Storage 경로의 URL이 업데이트되었음을 명시합니다(large_custom_dictionary.cloud_storage_file_set.url
).
예
PATCH https://dlp.googleapis.com/v2/projects/PROJECT_ID/storedInfoTypes/github-usernames
{
"config":{
"largeCustomDictionary":{
"cloudStorageFileSet":{
"url":"gs://[BUCKET_NAME]/[PATH_TO_FILE]"
}
}
},
"updateMask":"large_custom_dictionary.cloud_storage_file_set.url"
}
마찬가지로 BigQuery 테이블에 저장된 용어 목록을 Cloud Storage 버킷에 저장된 것으로 전환할 수 있습니다.
대형 커스텀 사전 감지기를 사용한 콘텐츠 스캔
대형 커스텀 사전 감지기를 사용한 콘텐츠 스캔은 다른 커스텀 infoType 감지기를 사용한 콘텐츠 스캔과 비슷합니다.
이 절차에서는 저장된 기존 infoType이 있다고 가정합니다. 자세한 내용은 이 페이지의 저장된 infoType 만들기를 참고하세요.
콘솔
다음 작업을 할 때 대형 커스텀 사전 감지기를 적용할 수 있습니다.
페이지의 감지 구성 섹션에 있는 InfoType 하위 섹션에서 대형 커스텀 사전 infoType을 지정할 수 있습니다.
- infoType 관리를 클릭합니다.
- InfoType 창에서 커스텀 탭을 클릭합니다.
- 커스텀 infoType 추가를 클릭합니다.
커스텀 infoType 추가 창에서 다음을 수행합니다.
- 유형에서 저장된 infoType을 선택합니다.
- InfoType에 커스텀 infoType의 이름을 입력합니다. 문자, 숫자, 밑줄을 사용할 수 있습니다.
가능성의 경우 이 커스텀 infoType과 일치하는 모든 발견 항목에 할당할 기본 가능성 수준을 선택합니다. 핫워드 규칙을 사용하여 개별 발견 항목의 가능성 수준을 더 세밀하게 조정할 수 있습니다.
기본값을 지정하지 않으면 기본 가능성 수준은
VERY_LIKELY
로 설정됩니다. 자세한 내용은 일치 가능성을 참고하세요.민감도에서 이 맞춤 infoType과 일치하는 모든 발견 항목에 할당할 민감도 수준을 선택합니다. 값을 지정하지 않으면 이러한 발견 항목의 민감도 수준이
HIGH
로 설정됩니다.민감도 점수는 데이터 프로필에서 사용됩니다. 데이터를 프로파일링할 때 민감한 정보 보호는 infoTypes의 민감도 점수를 사용하여 민감도 수준을 계산합니다.
저장된 infoType 이름에 새 커스텀 infoType의 기반으로 사용할 저장된 infoType을 선택합니다.
완료를 클릭하여 커스텀 infoType 추가 창을 닫습니다.
선택사항: 기본 제공 탭에서 선택한 기본 제공 infoType을 수정합니다.
완료를 클릭하여 InfoTypes 창을 닫습니다.
커스텀 infoType이 민감한 정보 보호가 스캔하는 infoType 목록에 추가됩니다. 하지만 작업, 작업 트리거, 템플릿 또는 스캔 구성을 저장하기 전에는 이 선택이 최종 선택이 아닙니다.
구성 만들기 또는 수정을 완료했으면 저장을 클릭합니다.
C#
민감한 정보 보호의 클라이언트 라이브러리를 설치하고 사용하는 방법은 민감한 정보 보호 클라이언트 라이브러리를 참조하세요.
Sensitive Data Protection에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 로컬 개발 환경의 인증 설정을 참조하세요.
Go
민감한 정보 보호의 클라이언트 라이브러리를 설치하고 사용하는 방법은 민감한 정보 보호 클라이언트 라이브러리를 참조하세요.
Sensitive Data Protection에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 로컬 개발 환경의 인증 설정을 참조하세요.
Java
민감한 정보 보호의 클라이언트 라이브러리를 설치하고 사용하는 방법은 민감한 정보 보호 클라이언트 라이브러리를 참조하세요.
Sensitive Data Protection에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 로컬 개발 환경의 인증 설정을 참조하세요.
Node.js
민감한 정보 보호의 클라이언트 라이브러리를 설치하고 사용하는 방법은 민감한 정보 보호 클라이언트 라이브러리를 참조하세요.
Sensitive Data Protection에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 로컬 개발 환경의 인증 설정을 참조하세요.
PHP
민감한 정보 보호의 클라이언트 라이브러리를 설치하고 사용하는 방법은 민감한 정보 보호 클라이언트 라이브러리를 참조하세요.
Sensitive Data Protection에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 로컬 개발 환경의 인증 설정을 참조하세요.
Python
민감한 정보 보호의 클라이언트 라이브러리를 설치하고 사용하는 방법은 민감한 정보 보호 클라이언트 라이브러리를 참조하세요.
Sensitive Data Protection에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 로컬 개발 환경의 인증 설정을 참조하세요.
REST
content.inspect
메서드로 전송된 경우 다음 예시가 지정되고 저장된 infoType 감지기를 사용해서 제공된 텍스트를 스캔합니다. 모든 커스텀 infoType의 이름은 내장 infoType 또는 다른 커스텀 infoType과 충돌하지 않아야 하므로 infoType
매개변수가 필요합니다. storedType
매개변수에는 저장된 infoType의 전체 리소스 경로가 포함됩니다.
JSON 입력
POST https://dlp.googleapis.com/v2/projects/PROJECT_ID/content:inspect
{
"inspectConfig":{
"customInfoTypes":[
{
"infoType":{
"name":"GITHUB_LOGINS"
},
"storedType":{
"name":"projects/PROJECT_ID/storedInfoTypes/github-logins"
}
}
]
},
"item":{
"value":"The commit was made by githubuser."
}
}
오류 문제 해결하기
Cloud Storage에 저장된 용어 목록에서 저장된 infoType을 만드는 중에 오류가 발생하면 다음과 같은 원인이 있을 수 있습니다.
- 저장된 infoType의 상한에 도달했습니다. 문제에 따라 몇 가지 해결 방법이 있습니다.
- Cloud Storage에서 단일 입력 파일의 상한(200MB)에 도달한 경우 파일을 여러 파일로 분할합니다. 모든 파일의 합계 크기가 1GB를 초과하지 않는 한 여러 파일을 사용하여 하나의 커스텀 사전을 조합할 수 있습니다.
- BigQuery의 한도는 Cloud Storage와 다릅니다. 용어를 BigQuery 테이블로 이동하는 것을 고려해 보세요. BigQuery에서는 커스텀 사전 열의 최대 크기가 1GB이고 최대 행 수는 5,000,000개입니다.
- 용어 목록 파일이 소스 용어 목록에 적용되는 모든 한도를 초과하는 경우 용어 목록 파일을 여러 파일로 분할하고 각 파일에 대한 사전을 만들어야 합니다. 그런 다음 사전마다 별도의 스캔 작업을 만듭니다.
- 최소 하나의 글자 또는 숫자가 포함되지 않은 용어가 하나 이상 있습니다. 민감한 정보 보호는 공백 또는 기호로만 구성된 용어를 스캔할 수 없습니다. 최소 하나의 글자 또는 숫자가 있어야 합니다. 용어 목록에 문제가 되는 용어가 포함되어 있는지 확인하고, 있는 경우 수정하거나 삭제하세요.
- 용어 목록에 '구성요소'가 너무 많은 구문이 포함되어 있습니다. 이 맥락에서 구성요소란 글자만, 숫자만 또는 글자도 숫자도 아닌 문자(공백 또는 기호)만 포함된 연속된 시퀀스를 의미합니다. 용어 목록에 문제가 되는 용어가 포함되어 있는지 확인하고, 있는 경우 수정하거나 삭제하세요.
- 민감한 정보 보호 서비스 에이전트에 사전 파일 저장을 위한 사전 소스 데이터 또는 Cloud Storage 버킷 액세스 권한이 없습니다. 이 문제를 해결하려면 민감한 정보 보호 서비스 에이전트에 스토리지 관리자(
roles/storage.admin
) 역할 또는 BigQuery 데이터 소유자(roles/bigquery.dataOwner
) 및 BigQuery 작업 사용자(roles/bigquery.jobUser
) 역할을 부여합니다.
API 개요
대규모 커스텀 사전 감지기를 만드는 경우 저장된 infoType을 만들어야 합니다.
저장된 infoType은 민감한 정보 보호에서 StoredInfoType
객체로 표시됩니다. 다음과 같은 관련 객체로 구성됩니다.
StoredInfoTypeVersion
에는 생성 날짜 및 시간, 현재 버전이 생성될 때 마지막으로 발생한 오류 메시지 5개가 포함됩니다.StoredInfoTypeConfig
에는 이름 및 설명을 포함하여 저장된 infoType의 구성이 포함됩니다. 대형 커스텀 사전의 경우type
이LargeCustomDictionaryConfig
여야 합니다.LargeCustomDictionaryConfig
는 다음 두 가지를 모두 지정합니다.- Cloud Storage 또는 BigQuery 내에서 구문 목록이 저장된 위치
- 생성된 사전 파일을 저장할 Cloud Storage 내의 위치
StoredInfoTypeState
에는 저장된 infoType의 가장 최신 버전 및 모든 보류 중인 버전의 상태가 포함됩니다. 상태 정보에는 저장된 infoType이 다시 빌드되는 중인지, 사용할 준비가 되었는지, 잘못되었는지 여부가 포함됩니다.
사전 일치 세부 사항
다음은 Sensitive Data Protection에서 사전 단어 및 구문의 일치를 판단하는 방법에 관한 지침입니다. 이러한 항목은 일반 및 대형 커스텀 사전에 모두 적용됩니다.
- 사전 단어는 대소문자를 구분하지 않습니다. 사전에
Abby
가 포함된 경우abby
,ABBY
,Abby
등과 일치합니다. - 유니코드 기본 다국어 평면에 포함된 글자, 숫자, 기타 알파벳 문자를 제외한 사전 또는 스캔할 콘텐츠의 모든 문자는 일치 항목을 스캔할 때 공백으로 간주됩니다. 사전에서
Abby Abernathy
를 스캔하는 경우abby abernathy
,Abby, Abernathy
,Abby (ABERNATHY)
등과 일치합니다. - 일치 항목의 주변 문자는 단어 내의 인접 문자와 유형(문자 또는 숫자)이 달라야 합니다. 사전에서
Abi
를 스캔하는 경우Abi904
의 처음 3개 문자는 일치하지만Abigail
은 일치하지 않습니다. - 유니코드 표준의 보조 다중 언어 영역에 있는 문자가 포함된 사전 단어는 예상치 않은 발견 항목을 발생시킬 수 있습니다. 이러한 문자의 예시에는 그림 이모티콘, 과학 기호, 고대 문자가 있습니다.
문자, 숫자, 기타 알파벳 문자는 다음과 같이 정의됩니다.
- 문자: 유니코드 사양에서 일반 카테고리가
Lu
,Ll
,Lt
,Lm
또는Lo
인 문자 - 숫자: 유니코드 사양에서 일반 카테고리
Nd
인 문자 - 기타 알파벳 문자: 유니코드 사양에 일반 카테고리
Nl
가 있거나 유니코드 표준에 정의된 대로 참여 속성Other_Alphabetic
가 있는 문자
저장된 infoType을 생성, 편집, 삭제하려면 다음 메서드를 사용합니다.
storedInfoTypes.create
: 지정한StoredInfoTypeConfig
로 새 저장된 infoType을 만듭니다.storedInfoTypes.patch
: 지정한 새StoredInfoTypeConfig
로 저장된 infoType을 다시 빌드합니다. 아무 것도 지정하지 않으면 이 메서드가 기존StoredInfoTypeConfig
를 사용하여 새 버전의 저장된 infoType을 만듭니다.storedInfoTypes.get
: 지정된 저장된 infoType의StoredInfoTypeConfig
및 대기 중인 버전을 검색합니다.storedInfoTypes.list
: 현재 저장된 infoType을 모두 나열합니다.storedInfoTypes.delete
: 지정된 저장된 infoType을 삭제합니다.