분류, 수정, 익명화

Cloud Data Loss Prevention(DLP)은 민감한 정보를 파악하고 관리, 보호하는 데 도움이 됩니다. Cloud DLP를 사용하면 Google Cloud 스토리지 저장소에 저장된 콘텐츠를 포함하여 텍스트 기반 콘텐츠 및 이미지에 포함된 민감한 정보를 쉽게 분류하고 수정할 수 있습니다.

텍스트 분류

다음 텍스트 입력을 보겠습니다.

Please update my records with the following information:
Email address: foo@example.com

National Provider Identifier: 1245319599

Driver's license: AC333991

출력은 발견 결과를 다음 범주로 정리한 것입니다.

출력 예시는 아래 표에 있습니다.

InfoType Likelihood Offset
US_HEALTHCARE_NPI VERY_LIKELY 122
EMAIL_ADDRESS LIKELY 72
US_DRIVERS_LICENSE_NUMBER LIKELY 155
CANADA_BC_PHN VERY_UNLIKELY 122
UK_TAXPAYER_REFERENCE VERY_UNLIKELY 122
CANADA_PASSPORT VERY_UNLIKELY 155

자동 텍스트 수정

자동 수정은 결과 목록을 제공하는 대신 일치하는 민감한 정보가 삭제된 상태의 출력을 생성합니다.

자동 수정 입력 예시:

Please update my records with the following information:
Email address: foo@example.com

National Provider Identifier: 1245319599

Driver's license: AC333991

자리 표시자 '***'를 사용하는 출력 예시:

Please update my records with the following information:
Email address: ***

National Provider Identifier: ***

Driver's license: ***

이미지 분류

Cloud DLP는 분류 전에 광학 문자 인식(OCR) 기술을 사용하여 텍스트를 인식합니다. 텍스트 분류와 유사하게 결과를 반환하지만 텍스트가 발견된 경계 상자도 추가합니다.

스토리지 분류

스토리지 분류는 Cloud Storage, Datastore, BigQuery에 저장된 데이터를 스캔합니다. Cloud DLP로 데이터를 스트리밍하는 대신 Cloud DLP가 스캔할 Cloud Storage 버킷, Datastore 종류 또는 BigQuery 테이블의 스토리지 위치를 요청에 지정합니다.

Cloud Storage 위치에서 파일을 스캔할 때 Cloud DLP는 바이너리, 텍스트, 이미지, Microsoft Word, PDF, Apache Avro 파일의 스캔을 지원합니다. Cloud Storage 내에서 Cloud DLP가 스캔할 수 있는 파일 형식의 파일 확장자 목록은 FileType에 대한 API 참조 페이지에서 확인할 수 있습니다. 인식되지 않는 형식의 파일은 바이너리 파일로 스캔됩니다.

스캔 결과는 새 BigQuery 테이블에 저장되거나 Pub/Sub 주제에 게시될 수 있습니다. 이후 내장된 BigQuery 도구를 사용하여 풍부한 SQL 분석을 실행하거나 Google 데이터 스튜디오와 같은 도구를 사용하여 보고서를 생성할 수 있습니다.

Cloud DLP를 사용하여 스토리지 저장소에서 민감한 정보를 스캔하는 방법은 스토리지 및 데이터베이스에서 민감한 정보 검사를 참조하세요.

다른 Google Cloud 도구를 사용하여 스캔 결과를 시각화하는 방법에 대한 자세한 내용은 Cloud DLP 결과 분석 및 보고를 참조하세요.