측정항목 참조

이 페이지에서는 데이터 프로필에서 수집되는 모든 측정항목을 나열하고 설명합니다.

데이터 프로필에는 프로젝트 데이터 프로필, 테이블 데이터 프로필, 열 데이터 프로필의 세 가지 유형이 있습니다.

프로젝트 데이터 프로필

각 프로젝트 데이터 프로필에는 다음 필드가 있습니다. 이러한 필드의 값은 프로젝트 내에서 프로파일링되는 리소스를 기반으로 집계됩니다.

Insights

프로젝트 데이터 프로필은 다음 통계를 제공합니다.

데이터 위험
현재 상태의 데이터와 관련된 위험 수준입니다. 자세한 내용은 민감도 및 데이터 위험 수준을 참조하세요.
민감도
이 프로젝트의 민감도 수준을 나타내는 점수입니다. 자세한 내용은 민감도 및 데이터 위험 수준을 참조하세요.

메타데이터

프로젝트 데이터 프로필은 다음 메타데이터를 제공합니다.

최종 프로필 생성 시간
프로필이 마지막으로 생성된 날짜 및 시간입니다.
프로젝트 ID
프로파일링된 프로젝트의 ID입니다.
리소스 이름
데이터 프로필의 정규화된 이름입니다.
상태
프로파일링 작업의 상태를 나타내는 아이콘입니다.

테이블 데이터 프로필

각 테이블 데이터 프로필에는 다음과 같은 필드가 있습니다.

Insights

테이블 데이터 프로필은 다음 통계를 제공합니다.

데이터 위험
현재 상태의 데이터와 관련된 위험 수준입니다. 자세한 내용은 민감도 및 데이터 위험 수준을 참조하세요.
민감도
이 테이블의 민감도 수준을 나타내는 점수입니다. 자세한 내용은 민감도 및 데이터 위험 수준을 참조하세요.

메타데이터

테이블 데이터 프로필은 다음 메타데이터를 제공합니다.

데이터베이스
프로파일링된 테이블이 포함된 데이터베이스입니다. 이 필드는 Cloud SQL 검색에만 적용됩니다.
데이터 세트 ID
이 테이블이 포함된 데이터 세트의 ID입니다.
암호화
이 테이블의 암호화가 Google에서 관리되는지 아니면 조직에서 관리되는지 여부입니다.
만료 시간
선택사항. 이 테이블이 만료되는 시간입니다.
실패한 열 수
오류로 인해 이 테이블에서 건너뛴 열 수입니다.
검사 구성 스냅샷
프로필이 생성될 때 사용된 검사 템플릿의 스냅샷입니다. 자세한 내용은 데이터 프로필 스냅샷을 참조하세요.
인스턴스
프로파일링된 테이블이 포함된 인스턴스입니다. 이 필드는 Cloud SQL 검색에만 적용됩니다.
최종 프로필 생성 시간
프로필이 마지막으로 생성된 날짜 및 시간입니다.
BigQuery의 최종 업데이트
이 테이블이 마지막으로 수정된 날짜 및 시간입니다.
프로젝트 ID
이 테이블이 포함된 프로젝트의 ID입니다.
공개
이 테이블을 모든 사용자에게 공개할지 또는 특정 사용자로 제한할지 여부입니다.
리소스 라벨
프로필이 생성된 시점에 테이블에 있던 라벨입니다.
리소스 이름
데이터 프로필의 정규화된 이름입니다.
행 수
프로필이 생성되었을 때 이 테이블의 행 수입니다.
스캔한 열 수
이 테이블에 프로파일링된 열 수입니다.
서비스 계정
이 테이블에 액세스할 수 있는 IAM 권한이 있는 서비스 계정 수입니다.
상태
프로필이 생성되었는지 여부를 나타내는 표시입니다.
테이블 ID
이 테이블의 ID입니다.
테이블 생성 시간
테이블이 생성된 날짜 및 시간입니다.
테이블 크기
프로필이 생성되었을 때 이 테이블의 크기입니다.
유형
수행한 검색 유형입니다.

열 데이터 프로필

각 열 데이터 프로필에는 다음과 같은 필드가 있습니다.

Insights

열 데이터 프로필은 다음 통계를 제공합니다.

데이터 위험
현재 상태의 데이터와 관련된 위험 수준입니다. 자세한 내용은 민감도 및 데이터 위험 수준을 참조하세요.
민감도
이 열의 민감도 수준을 나타내는 점수입니다. 자세한 내용은 민감도 및 데이터 위험 수준을 참조하세요.
예측된 infoType

단일 기본 제공 또는 커스텀 infoType이 열의 다른 유형보다 명확하게 지배적이면 민감한 데이터 보호는 이 필드를 해당 infoType으로 설정합니다. 그렇지 않으면 이 필드에는 값이 없습니다.

열에서 감지된 모든 infoType의 목록을 보려면 기타 infoType 필드를 참조하세요.

민감한 정보 보호는 검사 템플릿에 지정한 infoType만 스캔합니다. 따라서 이러한 infoType만 예측된 infoType 필드에 표시될 수 있습니다. 예를 들어 열에 이메일 주소가 있지만 검사 템플릿에 EMAIL_ADDRESS infoType 감지기가 포함되어 있지 않으면 이 필드에 EMAIL_ADDRESS가 포함되지 않습니다.

이 문서에서 기타 infoType을 참조하세요.

기타 infoType

해당 열의 예측된 infoType으로 간주될 만큼 강력한 신호가 없는 열에서 InfoType이 감지되었습니다. 이 문서에서 예측된 infoType을 참조하세요.

2022년 10월 13일 이후에 생성된 데이터 프로필의 경우 이 필드에 나열된 각 infoType에는 예상 발생률이 있습니다. 예상 발생률은 infoType이 감지된 null이 아닌 행의 대략적인 비율입니다.

예를 들어 다음 측정항목이 있는 열이 있다고 가정해 보겠습니다.

  • 예측된 infoType: FDA_CODE
  • 기타 infoType: PERSON_NAME (2%), STREET_ADDRESS (1%)

이 예시에는 열에 FDA 코드가 포함되어 있음을 나타내는 강력한 표시가 있습니다. 또한 민감한 정보 보호에서는 열에서 null이 아닌 행의 약 2%에 사람 이름이 포함되고 1%에 상세 주소가 포함될 수 있다고 확인했습니다.

민감한 정보 보호는 검사 템플릿에 지정한 infoType만 스캔합니다. 따라서 해당 infoType만 기타 infoType 필드에 표시될 수 있습니다. 예를 들어 열에 이메일 주소가 있지만 검사 템플릿에 EMAIL_ADDRESS infoType 감지기가 포함되어 있지 않으면 이 필드에 EMAIL_ADDRESS가 포함되지 않습니다.

예상 null 비율

이 열에 있는 null 값의 대략적인 비율로, 높음, 보통, 낮음 또는 매우 낮음으로 분류됩니다. 이 열에 있는 항목 중 null의 비율이 높으면 이 값이 높습니다.

예상 고유성

이 열에 있는 데이터 중 고유한 데이터 양의 추정치로, 높음, 중간, 낮음으로 분류됩니다. 고유성 수준이 높다는 것은 열에 고유한 값이 포함되어 있음을 나타냅니다. 고유한 값이 많으면 열에 식별자가 포함되어 있음을 나타낼 수 있습니다.

고유성 수준이 낮다는 것은 열에 enum 또는 불리언 값과 같이 많은 일반적인 값이 포함되어 있음을 나타냅니다.

이 측정항목을 계산하기에 테이블 행이 충분하지 않다고 민감한 정보 보호에서 판단하면 이 값이 비어 있습니다.

자유 텍스트 점수

이 열에 자유형 텍스트가 포함될 확률입니다. 값이 1에 가까우면 열에 자유형 또는 자연어 텍스트가 포함될 가능성이 높습니다. 가능한 값의 범위는 0부터 1까지입니다.

자유 텍스트 점수가 높으면 열의 데이터 위험과 민감도 수준이 증가할 수 있습니다.

메타데이터

열 데이터 프로필은 다음 메타데이터를 제공합니다.

데이터베이스
프로파일링된 테이블 열이 포함된 데이터베이스입니다. 이 필드는 Cloud SQL 검색에만 적용됩니다.
데이터 유형
이 열 콘텐츠의 데이터 유형입니다.
데이터 세트 ID
이 테이블 열이 포함된 데이터 세트의 ID입니다.
필드 ID
열 이름입니다.
인스턴스
프로파일링된 테이블 열이 포함된 인스턴스입니다. 이 필드는 Cloud SQL 검색에만 적용됩니다.
인스턴스 위치
프로파일링된 테이블 열이 포함된 인스턴스의 위치입니다. 이 필드는 Cloud SQL 검색에만 적용됩니다.
최종 프로필 생성 시간
프로필이 마지막으로 생성된 날짜 및 시간입니다.
정책 태그
정책 태그가 열에 적용되었는지 여부를 나타냅니다. 정책 태그 사용을 위한 권장사항에 대한 자세한 내용은 BigQuery에서 정책 태그 사용을 참조하세요.
프로젝트 ID
이 테이블 열이 포함된 프로젝트의 ID입니다.
리소스 이름
데이터 프로필의 정규화된 이름입니다.
상태
프로파일링 작업의 상태를 나타내는 아이콘입니다.
테이블 ID
이 열이 포함된 테이블의 ID입니다.