하이브리드 작업 및 작업 트리거

하이브리드 작업 및 작업 트리거는 거의 모든 소스에서 전송된 데이터의 페이로드를 민감한 정보에 대해 스캔한 후 발견 항목을 Google Cloud에 저장하도록 하는 비동기 API 메소드의 집합을 포함합니다. 하이브리드 작업을 사용하면 Cloud Data Loss Prevention(DLP) 스토리지 검사 메서드와 유사한 방식으로 데이터를 작동 및 제공하는 자체 데이터 크롤러를 작성할 수 있습니다.

하이브리드 작업을 사용하여 모든 소스의 데이터를 Cloud DLP로 스트리밍할 수 있습니다. Cloud DLP가 데이터에 민감한 정보 또는 개인 식별 정보가 있는지 검사한 다음 검사 스캔 결과를 Cloud DLP 작업 리소스에 저장합니다. Cloud DLP 콘솔 UI 또는 API에서 스캔 결과를 검사할 수 있습니다. 또는 검사 결과 데이터를 BigQuery 테이블에 저장하거나 Pub/Sub 알림을 내보내는 등 실행할 스캔 후 작업을 지정할 수 있습니다.

하이브리드 작업 워크플로는 다음 다이어그램에 요약되어 있습니다.

애플리케이션이 외부 소스에서 Cloud DLP로 데이터를 전송, Cloud DLP가 데이터를 검사한 다음 결과를 저장하거나 게시하는 경우를 보여주는 하이브리드 작업 Dataflow 다이어그램

이 개념 주제는 하이브리드 작업 및 작업 트리거와 그 작동 방식을 설명합니다. 하이브리드 작업 및 작업 트리거를 구현하는 방법은 하이브리드 작업을 사용하여 외부 데이터 검사를 참조하세요.

하이브리드 환경 정보

'하이브리드' 환경은 조직에서 흔히 사용됩니다. 많은 조직에서 다음의 조합을 사용하여 민감한 정보를 저장하고 처리합니다.

  • 기타 클라우드 제공업체
  • 온프레미스 서버 또는 기타 데이터 저장소
  • 네이티브가 아닌 스토리지 시스템(예: 가상 머신 내에서 실행되는 시스템)
  • 웹 및 모바일 앱
  • Google Cloud 기반 솔루션

Cloud DLP는 하이브리드 작업을 사용하여 이러한 소스에서 보낸 데이터를 검사할 수 있습니다. 다음은 몇 가지 예시 시나리오입니다.

  • Amazon Relational Database Service(RDS), 가상 머신 내에서 실행되는 MySQL, 온프레미스 데이터베이스에 저장된 데이터를 검사합니다.
  • 온프레미스에서 클라우드로 또는 프로덕션, 개발, 분석 간에 마이그레이션할 때 데이터를 검사하고 토큰화합니다.
  • 데이터를 저장하기 전에 웹 또는 모바일 애플리케이션의 트랜잭션을 검사하고 수정합니다.

검사 옵션

메서드 유형에 자세히 설명되어 있듯이 Cloud DLP는 민감한 정보의 콘텐츠를 검사할 때 세 가지 기본 옵션을 제공합니다.

  • 콘텐츠 메서드 검사: 콘텐츠 검사를 사용하여 검사 대상에 대한 안내와 함께 작은 데이터 페이로드를 Cloud DLP로 스트리밍합니다. 그런 다음 Cloud DLP가 데이터에 민감한 콘텐츠 및 PII가 있는지 검사한 후 해당 스캔 결과를 다시 반환합니다.
  • 스토리지 메서드 검사: Cloud DLP는 스토리지 검사를 사용하여 BigQuery 데이터베이스, Cloud Storage 버킷 또는 Datastore 종류와 같은 Google Cloud 기반 스토리지 저장소를 검사합니다. Cloud DLP를 통해 검사할 대상을 지정하면 Cloud DLP가 저장소를 스캔하는 작업을 실행합니다. 스캔이 완료되면 Cloud DLP는 스캔 결과 요약을 작업에 다시 저장합니다. 별도의 BigQuery 테이블과 같은 분석을 위해 결과를 다른 Google Cloud 제품으로 전송하도록 지정할 수도 있습니다.
  • 하이브리드 작업 검사: 하이브리드 작업은 앞의 두 가지 메서드의 장점을 모두 제공합니다. 콘텐츠 메서드와 동일한 방식으로 데이터를 스트리밍하면서 스토리지 검사 작업의 스토리지, 시각화, 작업을 얻을 수 있습니다. 모든 검사 구성은 Cloud DLP 내에서 관리되며 클라이언트 측에서 추가 구성이 필요하지 않습니다. 하이브리드 작업은 가상 머신(VM), 온프레미스 또는 다른 클라우드에서 실행되는 데이터베이스와 같은 기본이 아닌 스토리지 시스템을 스캔하는 데 유용할 수 있습니다. 하이브리드 메서드는 마이그레이션 워크로드와 같은 처리 시스템 검사 또는 서비스 간 통신을 프록시하는 데도 유용할 수 있습니다. 콘텐츠 메서드도 이 작업을 수행할 수도 있지만, 하이브리드 메서드는 여러 API 호출에서 데이터를 집계할 수 있는 발견 항목 스토리지 백엔드를 제공하므로 이러한 작업을 수행할 필요가 없습니다.

하이브리드 작업 및 작업 트리거 정보

하이브리드 작업은 사실상 콘텐츠 메서드 및 스토리지 메서드의 하이브리드입니다. 하이브리드 작업 및 작업 트리거를 사용하기 위한 기본 워크플로는 다음과 같습니다.

  1. 일부 메타데이터와 함께 검사를 위해 데이터를 Cloud DLP에 보내는 스크립트를 작성하거나 워크플로를 만듭니다.
  2. 하이브리드 작업 리소스 또는 트리거를 구성 및 생성하고 데이터를 수신할 때 활성화하도록 사용 설정합니다.
  3. 스크립트 또는 워크플로는 클라이언트 측에서 실행되며 Cloud DLP로 데이터를 전송합니다. 데이터에는 활성화 메시지와 검사를 트리거하는 작업 트리거의 식별자가 포함됩니다.
  4. Cloud DLP는 하이브리드 작업 또는 트리거에서 설정한 기준에 따라 데이터를 검사합니다.
  5. Cloud DLP는 스캔 결과를 제공된 메타데이터와 함께 하이브리드 작업 리소스에 저장합니다. Cloud Console에서 Cloud DLP UI를 사용하여 결과를 검사할 수 있습니다.
  6. 원하는 경우 Cloud DLP는 검사 결과 데이터를 BigQuery 테이블에 저장하거나 이메일 또는 Pub/Sub로 알리는 등 스캔 후 작업을 실행할 수 있습니다.

하이브리드 작업 트리거를 사용하면 필요할 때마다 작업을 트리거할 수 있도록 작업을 생성, 활성화, 중지할 수 있습니다. 스크립트 또는 코드가 하이브리드 작업 트리거의 식별자가 포함된 데이터를 전송하도록 하면 새 작업이 시작될 때마다 스크립트나 코드를 업데이트할 필요가 없습니다.

일반적인 하이브리드 작업 시나리오

하이브리드 작업이 적합한 일반적인 시나리오는 다음과 같습니다.

  • 분기별 데이터베이스 확인의 일부로 Google Cloud 외부의 데이터베이스에 대한 일회성 스캔을 실행하려고 합니다.
  • Cloud DLP에서 기본적으로 지원하지 않는 데이터베이스에 매일 추가되는 모든 새 콘텐츠를 모니터링하려고 합니다.
  • Envoy용 Cloud DLP 필터(Envoy 사이드카 프록시용 WebAssembly HTTP 필터)를 사용하여 네트워크의 트래픽을 모니터링하면서 문제가 있는 민감한 데이터 이동을 식별하려고 합니다.

하이브리드 작업 지원 작업

다른 Cloud DLP 작업과 마찬가지로 하이브리드 작업은 작업을 지원합니다. 일부 작업은 하이브리드 작업에 적용되지 않습니다. 다음은 현재 지원되는 작업 및 작동 방식에 대한 정보입니다. Pub/Sub, 이메일, Cloud Monitoring 작업의 경우 작업이 종료되면 발견 항목을 사용할 수 있습니다.

  • DLP에 발견 항목 저장BigQuery에 발견 항목 저장: 발견 항목은 각각 Cloud DLP 리소스 또는 BigQuery 테이블에 저장됩니다. 이러한 작업은 다른 작업 유형과 작동하는 방식과 비슷하게 하이브리드 작업과 작동하지만 한 가지 중요한 차이점이 있습니다. 하이브리드 작업과 작동하는 경우에는 작업이 실행되는 동안 발견 항목을 사용할 수 있고 다른 작업 유형과 작동하는 경우에는 작업이 종료되면 발견 항목을 사용할 수 있습니다.
  • Pub/Sub 전송: 작업이 완료되면 Pub/Sub 메시지가 표시됩니다.
  • 이메일 전송: 작업이 완료되면 이메일 메시지가 전송됩니다.
  • Cloud Monitoring에 게시: 작업이 완료되면 발견 항목이 Monitoring에 게시됩니다.

요약

다음은 하이브리드 작업 및 작업 트리거 사용의 주요 기능과 이점입니다.

  • 하이브리드 작업을 사용하면 클라우드 안팎의 거의 모든 소스에서 데이터를 Cloud DLP로 스트리밍할 수 있습니다.
  • Cloud DLP가 활성화 메시지 및 작업 트리거의 식별자가 포함된 데이터 스트림을 수신하면 하이브리드 작업 트리거가 활성화됩니다.
  • 검사 스캔이 완료될 때까지 기다리거나 작업을 수동으로 중지할 수 있습니다. 검사 결과는 완료되거나 중간에 중지되어도 Cloud DLP 또는 BigQuery에 저장됩니다.
  • 하이브리드 작업 트리거에서 Cloud DLP 검사 스캔 결과는 Cloud DLP 내의 하이브리드 작업 리소스에 저장됩니다.
  • Cloud DLP에서 작업 트리거 리소스를 확인하여 검사 스캔 결과를 확인할 수 있습니다.
  • 또한 Cloud DLP에 작업을 사용하여 하이브리드 작업 결과를 BigQuery 데이터베이스로 보내고 이메일 또는 Pub/Sub 알림을 보낼 수 있습니다.

다음 단계