Cloud DLP를 사용하여 BigQuery 데이터 검사

민감한 정보의 보호와 관리는 먼저 해당 정보가 어디에 있는지 파악하는 것에서 출발합니다. 이 위치를 파악하고 있으면 신용카드 번호, 의료 정보, 주민등록번호, 운전면허증 번호, 주소, 본명, 회사 보안 비밀과 같은 민감한 세부정보가 유출되는 위험을 줄일 수 있습니다. 또한 주기적으로 데이터를 검사하면 규정 준수 요구사항을 충족할 수 있으며 사용에 따라 데이터가 증가하고 변경될 때 권장사항을 따르도록 할 수 있습니다. 규정 준수 요구사항을 충족하려면 Cloud 데이터 손실 방지(Cloud DLP)를 사용하여 BigQuery 테이블을 검사하고 민감한 정보를 보호합니다.

Cloud DLP는 Google Cloud Platform 고객이 대규모의 민감한 정보를 식별하고 보호할 수 있게 해주는 완전 관리형 서비스이며 100개가 넘는 사전 정의된 감지기를 사용하여 패턴, 형식, 체크섬을 식별합니다. 또한 고객 데이터를 복제하지 않고 마스킹, 토큰화, 가명처리, 날짜 이동 등 데이터를 익명화할 수 있는 도구 모음도 제공합니다.

Cloud DLP에 대한 자세한 내용은 Cloud DLP 문서를 참조하세요.

시작하기 전에

  1. Cloud DLP 가격 책정Cloud DLP 비용을 적절히 제어하는 방법을 익힙니다.
  2. Cloud DLP API를 사용 설정합니다.

    API 사용 설정

  3. Cloud DLP 작업을 실행할 수 있도록 Cloud DLP 작업을 만드는 사용자에게 사전 정의된 Cloud DLP Cloud IAM 역할 또는 충분한 권한이 부여되어 있는지 확인합니다.

GCP Console을 사용하여 BigQuery 데이터 스캔

BigQuery 데이터를 스캔하려면 테이블을 분석하는 Cloud DLP 작업을 만들어야 합니다. BigQuery GCP Console에서 DLP로 스캔 옵션을 사용하여 BigQuery 테이블을 빠르게 스캔할 수 있습니다.

Cloud DLP를 사용하여 BigQuery 테이블을 스캔하는 방법은 다음과 같습니다.

  1. GCP Console에서 BigQuery 웹 UI를 엽니다.
    GCP Console로 이동

  2. 리소스 섹션에서 프로젝트 및 데이터세트를 확장하고 스캔하려는 BigQuery 테이블을 선택합니다.

  3. 내보내기 > DLP로 스캔(베타)을 클릭합니다. Cloud DLP 작업 생성 페이지가 새 탭에서 열립니다.

  4. 1단계: 입력 데이터 선택에서는 이름위치 섹션의 값이 자동으로 생성됩니다. 또한 샘플링 섹션은 데이터에 대해 샘플 스캔을 실행하도록 자동으로 구성됩니다. 행 제한 기준 필드에 행 비율을 선택하여 샘플의 행 수를 조정할 수 있습니다. 최대 행 수 필드의 값을 조정하여 샘플링된 행 수도 변경할 수 있습니다.

  5. 계속을 클릭합니다.

  6. (선택사항) 2단계: 감지 구성에서는 infoTypes라고 하는 찾을 데이터 유형을 구성할 수 있습니다. 사전 정의된 infoTypes 목록에서 선택하거나 템플릿(있는 경우)을 선택할 수 있습니다. infoTypes에 대한 자세한 내용은 Cloud DLP 문서의 InfoTypes 및 infoType 감지기를 참조하세요.

  7. 계속을 클릭합니다.

  8. (선택사항) 3단계: 작업 추가에서는 BigQuery에 저장을 사용 설정하여 Cloud DLP 발견 항목을 BigQuery 테이블에 게시합니다. 발견 항목을 저장하지 않으면 발견 항목 개수 및 infoTypes에 대한 통계만 완료된 작업에 포함됩니다. BigQuery에 발견 항목을 저장하면 각 발견 항목의 정확한 위치와 신뢰도에 대한 세부정보가 저장됩니다.

  9. (선택사항) BigQuery에 저장을 사용 설정한 경우 BigQuery에 저장 섹션에서 다음을 수행합니다.

    • 프로젝트 ID에 결과가 저장된 프로젝트 ID를 입력합니다.
    • 데이터세트 ID에 결과를 저장하는 데이터세트 이름을 입력합니다.
    • (선택사항) 테이블 ID에 결과를 저장하는 테이블 이름을 입력합니다. 지정된 테이블 ID가 없으면 새 테이블에 dlp_googleapis_date_1234567890과 비슷한 기본 이름이 할당됩니다. 기존 테이블을 지정하면 여기에 발견 항목이 추가됩니다.
  10. 계속을 클릭합니다.

  11. (선택사항) 4단계: 일정에서 시간 범위 지정 또는 주기적인 일정으로 작업을 실행하는 트리거 만들기를 선택하여 시간 범위 또는 일정을 구성합니다.

  12. 계속을 클릭합니다.

  13. (선택사항) 검토 페이지에서 작업 세부정보를 검사합니다.

  14. 만들기를 클릭합니다.

  15. Cloud DLP 작업이 완료되면 작업 세부정보 페이지로 리디렉션되고 이메일 알림을 받습니다. 작업 세부정보 페이지에서 스캔 결과를 보거나 작업 완료 이메일에서 Cloud DLP 작업 세부정보 페이지 링크를 클릭할 수 있습니다.

  16. Cloud DLP 발견 항목을 BigQuery에 게시하도록 선택한 경우 작업 세부정보 페이지에서 BigQuery에서 발견 항목 보기를 클릭하여 BigQuery 웹 UI로 테이블을 엽니다. 그런 다음 테이블을 쿼리하고 발견 항목을 분석할 수 있습니다. BigQuery에서 결과를 쿼리하는 방법에 대한 자세한 내용은 Cloud DLP 문서의 BigQuery에서 Cloud DLP 결과 쿼리를 참조하세요.

다음 단계

Cloud DLP를 사용하여 BigQuery 및 다른 스토리지 저장소에서 민감한 정보를 검사하는 방법에 대한 자세한 내용은 Cloud DLP 문서의 다음 주제를 참조하세요.

Cloud DLP 스캔에서 발견한 민감한 정보를 수정하거나 익명화하려면 다음을 참조하세요.

추가 자료

이 페이지가 도움이 되었나요? 평가를 부탁드립니다.

다음에 대한 의견 보내기...

도움이 필요하시나요? 지원 페이지를 방문하세요.