이미지 검사 및 수정

Sensitive Data Protection은 개발자가 지정한 기준에 따라 이미지의 민감한 텍스트를 검사하고 수정할 수 있습니다.

Sensitive Data Protection은 infoType 감지기 및 광학 문자 인식(OCR)을 사용하여 텍스트에서 base64로 인코딩된 이미지를 검사하고 텍스트 내에서 민감한 정보를 감지합니다. 그런 다음 이미지 내의 민감한 정보의 위치에 대한 정보를 반환하거나 민감한 정보를 불투명한 직사각형으로 마스킹하여 수정할 수 있습니다.

검사 및 수정은 별개의 작업입니다.

  • 검사: Sensitive Data Protection에서 제출된 base64 인코딩 이미지에서 지정된 intoType을 검사합니다. DLP는 감지된 infoType과 함께 하나 이상의 픽셀 좌표 및 크기 집합을 반환합니다. 각 픽셀 좌표 값과 크기 값 집합은 각각 왼쪽 하단 모서리 및 경계 상자의 크기를 나타냅니다. 각 경계 상자는 Sensitive Data Protection 발견 항목의 전체 또는 일부에 해당합니다.
  • 수정: Sensitive Data Protection에서 제출된 base64 인코딩 이미지에서 지정된 infoType을 검사합니다. Sensitive Data Protection은 민감한 정보 발견 항목을 불투명한 직사각형으로 마스킹하여 수정합니다. 수정된 base64 인코딩 이미지를 원본 이미지와 동일한 이미지 형식으로 반환합니다. 요청에서 수정 상자의 색상을 구성할 수도 있습니다.

검사 정보

Sensitive Data Protection의 이미지 검사는 base64로 인코딩된 이미지를 사용하여 이미지의 모든 텍스트를 인식한 후 텍스트에서 검사 기준과 일치하는 데이터를 검색합니다. 마지막으로 Sensitive Data Protection은 감지된 민감한 정보의 위치를 반환합니다.

다음 이미지를 살펴보세요. 이 이미지는 종이 문서 스캔에서 생성된 일반적인 이미지 파일의 예시입니다.

수정되지 않은 원본 이미지
수정되지 않은 원본 이미지(확대하려면 클릭)

Sensitive Data Protection에 이 이미지에서 미국 사회보장번호를 검사하도록 지시하면 다음 다이어그램에 설명된 프로세스가 수행됩니다.

이미지 검사 프로세스
이미지 검사 프로세스(확대하려면 클릭)
  1. base64로 인코딩된 이미지는 content.inspect 메서드를 통해 Sensitive Data Protection로 스트리밍됩니다.
  2. Sensitive Data Protection은 광학 문자 인식(OCR)을 사용하여 문서의 텍스트를 인식합니다.
  3. Sensitive Data Protection은 이전에 설정한 민감한 정보 감지 구성을 사용하여 인식된 텍스트를 스캔하고 일치하는 항목을 식별합니다.
  4. Sensitive Data Protection은 감지 기준에 따라 민감한 정보를 발견한 이미지 내 리전의 좌표와 크기를 반환합니다.

반환된 좌표는 민감한 정보를 찾을 위치를 나타냅니다. Sensitive Data Protection은 종종 여러 상자를 사용하여 이미지에서 민감한 정보의 단일 인스턴스 위치를 나타냅니다. 이 예시와 같이 텍스트를 직접 작성하는 경우 특히 그렇습니다.

Sensitive Data Protection이 이미지에서 감지 기준에 해당하는 데이터를 찾지 못하면 비어있는 성공적인 HTTP 200 응답을 반환합니다.

수정 정보

이미지 수정은 이미지 검사와 동일하며 한 단계만 더 진행하면 됩니다. Sensitive Data Protection에서 이미지 내 민감한 정보의 위치를 식별하면 데이터가 포함된 영역의 좌표를 반환하는 대신 이미지의 영역을 채우고 base64로 인코딩된 수정 이미지를 반환합니다.

이전 섹션의 원본 이미지를 다시 살펴보겠습니다. Sensitive Data Protection에 이미지에서 모든 미국 사회보장번호를 수정하도록 지시하면 다음 다이어그램에 설명된 프로세스가 수행됩니다.

이미지 수정 프로세스
이미지 수정 프로세스(확대하려면 클릭)
  1. base64로 인코딩된 이미지는 image.redact 메서드를 통해 Sensitive Data Protection로 스트리밍됩니다.
  2. Sensitive Data Protection은 광학 문자 인식(OCR)을 사용하여 문서의 텍스트를 인식합니다.
  3. Sensitive Data Protection은 이전에 설정한 민감한 정보 감지 구성을 사용하여 인식된 텍스트를 스캔하고 일치하는 항목을 식별합니다.
  4. Sensitive Data Protection은 감지된 모든 민감한 정보를 불투명한 직사각형으로 가려서 수정합니다. 그런 다음 base64에서 이미지를 인코딩하고 요청 응답에 반환합니다.

Sensitive Data Protection이 이미지에서 감지 기준에 해당하는 데이터를 찾지 못하면 base64로 인코딩된 이미지를 변경하지 않고 반환합니다.

다음 단계