BigQuery를 사용한 Data Catalog 개요
이 문서에서는 Data Catalog와 BigQuery의 관계에 관한 개요를 제공합니다.
Data Catalog는 Dataplex 내의 확장 가능한 완전 관리형 메타데이터 관리 서비스입니다.
Data Catalog 사용 사례
BigQuery는 Data Catalog를 사용하여 다음과 같은 사용 사례를 실행합니다.
- 데이터 계보 시각화
- 액세스 권한이 있는 리소스 검색
- 메타데이터로 리소스에 태그 지정
Data Catalog에 대한 자세한 설명은 Data Catalog란 무엇인가요?를 참조하세요.
Data Catalog 작동 방식
Data Catalog는 BigQuery 데이터 소스의 메타데이터를 카탈로그화할 수 있습니다. 메타데이터를 카탈로그화한 후 태그를 사용하여 이러한 데이터 소스에 고유 메타데이터를 추가할 수 있습니다. 지정된 BigQuery 프로젝트의 경우 Data Catalog는 데이터 세트, 테이블, 뷰, 모델에 관한 BigQuery 메타데이터를 자동으로 분류합니다. Data Catalog는 기술 메타데이터와 비즈니스 메타데이터라는 두 가지 유형의 메타데이터를 처리합니다. 메타데이터에 대한 자세한 내용은 Data Catalog 메타데이터를 참고하세요.
검색 및 탐색
Data Catalog는 BigQuery 데이터 소스를 나타내는 Data Catalog 항목과 연결된 기술 및 비즈니스 메타데이터에 대해 강력한 조건자 기반 검색 환경을 제공합니다. 메타데이터에 검색 및 탐색을 적용할 수 있도록 리소스의 메타데이터를 읽을 수 있는 권한이 있어야 합니다. Data Catalog는 리소스 내의 데이터에 대한 색인을 생성하지 않습니다. Data Catalog는 BigQuery 데이터 소스를 설명하는 메타데이터의 색인만 생성합니다.
Data Catalog는 사용자가 생성한 태그 같은 일부 메타데이터를 제어합니다. Data Catalog는 BigQuery에서 가져온 모든 메타데이터에 대해 BigQuery가 제공하는 메타데이터 및 권한을 반영하는 읽기 전용 서비스입니다. BigQuery에서 수정하여 데이터 항목의 메타데이터를 추가, 업데이트 또는 삭제할 수 있습니다.
Data Catalog 검색에 대한 자세한 내용은 BigQuery 리소스 검색을 참고하세요.
Data Catalog 액세스
다음 인터페이스를 사용하여 Data Catalog 기능에 액세스할 수 있습니다.
Google Cloud console의 BigQuery 페이지
Google Cloud 콘솔의 Dataplex 페이지
다음 단계
- Data Catalog 및 BigQuery를 시작하려면 Data Catalog 작업하기를 참고하세요.