태그 및 태그 템플릿

특히 조직 내 다양한 니즈가 있는 여러 그룹에서 사용될 경우 데이터 애셋을 규모에 맞춰 문서화하기가 어렵습니다. 각 그룹은 동일한 데이터를 설명하기 위해 자체 문서와 메타데이터 모음을 만들어 작업은 중복되고 정보는 불완전하기도 합니다. Data Catalog는 태그를 사용하여 이 문제를 해결하여 조직에서 통합 서비스의 모든 데이터 애셋에 대한 메타데이터를 만들고 검색하고 관리할 수 있게 해줍니다.

이 페이지에서는 Data Catalog의 두 가지 주요 개념을 설명합니다. 태그를 사용하면 커스텀 메타데이터 필드를 연결하여 데이터 애셋에 대한 컨텍스트를 제공할 수 있고, 새로운 태그를 신속하게 만드는 데 사용할 수 있는 재사용 가능하는 구조인 태그 템플릿을 제공할 수 있습니다.

태그

태그는 때때로 "비즈니스 메타데이터"라고 합니다. 데이터 애셋에 태그를 추가하면 애셋을 사용해야 하는 모든 사람에게 의미 있는 컨텍스트를 제공할 수 있습니다. 예를 들어 태그는 특정 데이터 애셋을 담당하는 사람이 누구인지와 개인 식별 정보(PII)를 포함하고 있는지 여부, 애셋의 데이터 보존 정책, 데이터 품질평가점수 등을 확인할 수 있습니다.

태그에는 정보를 저장할 수 있는 하나 이상의 필드가 포함됩니다. 태그의 필드는 태그 템플릿으로 정의되며, 각 필드를 사용하여 하나 이상의 을 저장할 수 있습니다. 모든 태그는 태그 템플릿의 인스턴스이며 전체 데이터 애셋 또는 특정 테이블이나 열에 적용할 수 있습니다. 예를 들어 열에 있는 태그는 열에 PII가 포함되어 있는지, 더 이상 지원되지 않는지 또는 특정 값을 계산하는 데 사용된 수식 등을 알 수 있습니다.

다음 다이어그램은 테이블과 해당 열에 여러 비즈니스 메타데이터 태그가 연결된 샘플 고객 테이블 cust_tbl을 보여줍니다.

샘플 고객 테이블

태그 템플릿

데이터에 태그하려면 먼저 하나 이상의 태그 템플릿을 만들어야 합니다. 태그 템플릿은 필드라는 메타데이터 키-값 쌍의 그룹입니다. 템플릿 세트는 메타데이터의 데이터베이스 스키마와 유사합니다.

이렇게 하면 주제별로 태그를 구성할 수 있습니다. 예를 들면 다음과 같습니다.

  • 데이터 거버넌스, 보관 날짜, 삭제 날짜, PII(예 또는 아니요), 데이터 분류(공개, 기밀, 민감, 규제) 필드가 있는 데이터 거버넌스 태그
  • 품질 문제, 업데이트 빈도, SLO 정보 필드가 있는 데이터 품질 태그
  • 인기 사용자, 인기 검색어, 평균 일일 사용자 필드가 있는 데이터 사용 태그

그런 다음 각 데이터 애셋 및 비즈니스 요구 사항에 맞는 태그만 사용하여 태그를 조합하고 일치시킬 수 있습니다.

태그 템플릿을 만드는 방법은 빠른 시작: 테이블 태그하기를 참조하세요.

필드 유형

각 필드에는 ID, 표시 이름, 유형이 포함됩니다. 유형은 string, double, boolean, enum(열거) 또는 datetime일 수 있습니다. 유형이 enum인 경우 템플릿에 필드에 허용된 값도 저장됩니다.

빠른 시작의 태그 템플릿 예시에는 여러 필드 유형이 포함되어 있습니다.

태그 템플릿 예시

다음은 템플릿에서 생성된 태그로, 각 필드에 이 제공됩니다.

태그 예시

필드는 정렬된 집합으로 템플릿에 저장되며, 순서는 다른 필드와 비교하여 필드의 상대적 중요도를 나타냅니다.

필수로 표시하지 않는 한 필드는 선택사항입니다. 템플릿이 사용될 때 필수 필드에는 값이 지정되어야 하며, 선택 필드는 비워 둘 수 있습니다.

시작하는 데 도움이 되도록 Data Catalog에는 일반적인 태그 사용 사례를 보여주는 샘플 태그 템플릿 갤러리가 포함되어 있습니다. 다음 예시를 통해 태그의 강점에 대해 배우거나 영감을 얻거나 자체 태그 지정 인프라를 만들기 위한 시작점으로 활용할 수 있습니다.

만들기를 클릭하고 태그 템플릿 만들기를 선택하여 태그 템플릿 갤러리를 찾을 수 있습니다. 템플릿 갤러리가 템플릿 만들기 페이지 상단에 표시됩니다.

갤러리에서 템플릿을 선택한 후에는 다른 태그 템플릿처럼 사용할 수 있습니다. 템플릿에서 속성을 추가 및 삭제하고 비즈니스 니즈에 맞게 변경할 수 있습니다. 그런 다음 Data Catalog를 사용하여 템플릿 필드 및 값을 검색할 수 있습니다.

액세스 제어

태그 및 메타데이터에는 민감한 정보가 포함될 수 있으며 데이터 거버넌스팀은 특정 태그가 특정 사용자 그룹에게만 표시되기를 원할 수 있습니다. Data Catalog는 템플릿에 대한 액세스 제어를 제공하며 이러한 설정은 해당 템플릿을 사용하여 만든 모든 태그로 확장됩니다.

다음 예시와 같이 다양한 액세스 제어 구성이 있는 템플릿을 설정할 수 있습니다.

  • 템플릿 생성자만 태그를 만드는 데 사용할 수 있는 템플릿
  • 특정 사용자 그룹에게만 표시되는 태그를 생성하는 템플릿
  • 선택된 사용자 집합이 다른(다른 동일한 사용자) 방문자 집합에게만 표시되는 태그를 만드는 데 사용할 수 있는 템플릿

태그 템플릿 액세스는 IAM 역할로 부여 또는 거부됩니다. 템플릿을 생성, 편집, 사용할 수 있는 권한을 제공합니다. 예를 들어 tagTemplateUser 역할은 태그 템플릿을 사용하여 리소스에 태그를 지정할 수 있는 권한을 부여합니다.

자세한 내용은 Data Catalog Identity and Access Management를 참조하세요.

리전 리소스

모든 태그 템플릿과 태그는 특정 GCP 리전에 저장됩니다. 태그 템플릿을 사용하여 모든 리전에 태그를 만들 수 있으므로 여러 리전에 분산된 데이터 애셋이 있는 경우 템플릿의 사본을 만들 필요가 없습니다.