Analytics Hub 소개

Analytics Hub는 강력한 보안 및 개인 정보 보호 프레임워크로 조직 경계에서 규모에 맞게 데이터와 통계를 공유할 수 있도록 하는 데이터 교환 플랫폼입니다. Analytics Hub를 사용하면 다양한 데이터 제공업체가 선별한 데이터 라이브러리를 찾아 액세스할 수 있습니다. 이 데이터 라이브러리에는 Google 제공 데이터 세트도 포함되어 있습니다.

예를 들어 Analytics Hub를 사용하면 타사 및 Google 데이터 세트로 분석 및 ML 이니셔티브를 보강할 수 있습니다.

Analytics Hub 사용자는 다음 작업을 수행할 수 있습니다.

  • Analytics Hub 게시자는 데이터를 파트너 네트워크와 공유하거나 조직 내부에 실시간으로 공유하여 수익을 창출할 수 있습니다. 목록을 사용하면 공유 데이터를 복제하지 않고도 데이터를 공유할 수 있습니다. 적합한 대상에게 데이터를 전달할 수 있는 세분화된 권한으로 분석용 데이터 소스의 카탈로그를 빌드할 수 있습니다.

  • Analytics Hub 구독자는 원하는 데이터를 탐색하고, 공유 데이터를 기존 데이터와 결합하고, BigQuery의 기본 제공 기능을 활용할 수 있습니다. 목록을 구독하면 프로젝트에 연결된 데이터 세트가 생성됩니다.

  • Analytics Hub 뷰어는 Analytics Hub에서 액세스할 수 있는 데이터 세트를 찾아보고 공유 데이터에 액세스하기 위해 게시자에게 요청할 수 있습니다.

  • Analytics Hub 관리자는 데이터 공유를 사용 설정하는 데이터 교환을 생성한 다음 데이터 게시자와 구독자에게 이러한 데이터 교환에 액세스할 수 있는 권한을 부여할 수 있습니다.

Analytics Hub 사용자 역할에 대한 자세한 내용은 Analytics Hub 역할 구성을 참조하세요.

건축물

Analytics Hub는 BigQuery 데이터 세트의 게시 및 구독 모델을 기반으로 합니다. BigQuery 아키텍처에서 컴퓨팅과 스토리지를 분리하기 때문에 데이터 게시자는 데이터의 여러 복사본을 만들 필요 없이 원하는 만큼 많은 구독자와 데이터를 공유할 수 있습니다. 구독자는 데이터 스토리지에 대해서만 비용을 지불하지만 구독자는 공유 데이터에 대해 실행되는 쿼리에 대해서만 비용을 지불합니다. Analytics Hub의 게시자 및 구독자 워크플로에 대해서는 다음 섹션에서 자세히 설명합니다.

게시자 워크플로

다음 다이어그램은 게시자가 Analytics Hub와 상호작용하는 방법을 설명합니다.

Analytics Hub 게시자와 Analytics Hub 간의 상호작용
그림 1. Analytics Hub 게시자 워크플로

그림 1에는 공유 데이터 세트, 데이터 교환, 목록 기능에 라벨이 지정되어 있습니다.

공유 데이터 세트
공유 데이터 세트는 Analytics Hub의 데이터 공유 단위인 BigQuery 데이터 세트입니다. 게시자는 구독자에게 전달할 객체 컬렉션(예: 테이블 및 뷰)이 있는 프로젝트에서 기존 BigQuery 데이터 세트를 만들거나 사용합니다.
데이터 교환
데이터 교환은 셀프서비스 데이터 공유를 사용 설정하는 컨테이너입니다. 여기에는 공유 데이터 세트를 참조하는 목록이 포함됩니다. Analytics Hub를 사용하면 게시자와 관리자가 교환 및 목록 수준에서 구독자에게 액세스 권한을 부여할 수 있습니다. 이 방법은 기본 공유 데이터 세트에 대한 액세스 권한을 명시적으로 부여하지 않도록 도와줍니다. Analytics Hub 구독자는 데이터 교환을 탐색하고, 액세스할 수 있는 데이터를 검색하고, 공유 데이터 세트를 구독할 수 있습니다. 데이터 교환의 유형은 다음과 같습니다.
  • 비공개 데이터 교환. 기본적으로 데이터 교환은 비공개이며 해당 교환에 대한 액세스 권한이 있는 사용자 또는 그룹만 데이터를 보거나 구독할 수 있습니다.
  • 공개 데이터 교환. 기본적으로 데이터 교환은 비공개이며 해당 교환에 액세스할 수 있는 사용자 또는 그룹만 목록을 보거나 구독할 수 있습니다. 하지만 데이터 교환을 공개로 설정할 수 있습니다. 공개 데이터 교환의 목록은 Google Cloud 사용자(allauthenticated 사용자)탐색하고 구독할 수 있습니다. 공개 데이터 교환에 대한 자세한 내용은 데이터 교환 공개로 설정을 참조하세요.

Analytics Hub 관리자는 Analytics Hub에서 여러 개의 데이터 교환을 만들고 다른 Analytics Hub 사용자를 관리할 수 있습니다.

등록정보
목록은 게시자가 데이터 교환에 나열하는 공유 데이터 세트를 참조합니다. 게시자는 목록을 만들고 데이터 세트 설명, 데이터 세트에서 실행할 샘플 쿼리, 관련 문서 링크, 구독자가 데이터 세트를 사용하는 데 도움이 되는 추가 정보를 지정할 수 있습니다. 자세한 내용은 목록 관리를 참조하세요. 목록은 목록에 설정된 Identity and Access Management(IAM) 정책과 목록을 포함하는 데이터 교환의 유형에 따라 다음 두 가지 유형 중 하나일 수 있습니다.
  • 공개 목록. 모든 Google Cloud 사용자(allauthenticated 사용자)와 공유됩니다. 공개 데이터 교환의 목록은 공개 목록입니다. 이 목록은 무료 공개 데이터 세트 또는 상용 데이터 세트가 참조할 수 있습니다. 목록이 상용 데이터 세트인 경우 구독자가 목록에 대한 액세스를 요청할 수 있고 데이터 제공업체가 해당 구독자에게 직접 연락합니다.
  • 비공개 목록. 개인 또는 그룹과 직접 공유됩니다. 예를 들어 비공개 목록은 조직의 다른 내부 팀과 공유하는 마케팅 측정항목 데이터 세트를 참조할 수 있습니다.

구독자 워크플로

다음 다이어그램은 구독자가 Analytics Hub와 상호작용하는 방식을 설명합니다.

Analytics Hub 구독자와 Analytics Hub 간의 상호작용
그림 2. Analytics Hub 구독자 워크플로.

그림 2에는 공유 데이터 세트, 데이터 교환, 목록, 연결된 데이터 세트 Analytics Hub 기능에 라벨이 지정되었습니다.

연결된 데이터 세트
연결된 데이터 세트는 공유 데이터 세트에 대한 심볼릭 링크 역할을 하는 읽기 전용 BigQuery 데이터 세트입니다. 목록을 구독하면 데이터 세트의 사본이 아닌 프로젝트에 연결된 데이터 세트가 생성되므로 구독자는 데이터를 읽을 수 있지만 그 안에 객체를 추가하거나 업데이트할 수 없습니다. 연결된 데이터 세트를 통해 테이블 및 뷰와 같은 객체를 쿼리하면 공유 데이터 세트의 데이터가 반환됩니다. 연결된 데이터세트에 대한 자세한 내용은 목록 보기 및 구독을 참조하세요. 연결된 데이터 세트는 공유 데이터 세트의 테이블과 뷰에 액세스할 수 있는 권한이 있습니다. 연결된 데이터 세트가 있는 구독자는 추가 Identity and Access Management 승인 없이 공유 데이터 세트의 테이블과 뷰에 액세스합니다.

제한사항

Analytics Hub에는 다음과 같은 제한사항이 있습니다.

  • 공유 데이터 세트 및 데이터 교환의 소유자는 구독 측정항목을 볼 수 없습니다.

  • 프로젝트가 삭제되더라도 프로젝트 내의 데이터 교환은 삭제되지 않습니다. 프로젝트를 삭제하기 전에 수동으로 이러한 데이터 교환을 삭제해야 합니다.

  • 구독자가 있는 공유 데이터 세트를 삭제해도 연결된 데이터 세트는 삭제되지 않습니다. 구독자는 프로젝트에서 연결된 데이터 세트를 삭제해야 합니다.

  • 고객 관리 암호화 키를 사용하는 공유 데이터 세트의 목록을 만들면 구독자가 데이터 세트에 액세스하는 데 필요한 Cloud KMS 키에 액세스할 수 없습니다.

  • 공유 데이터 세트에는 최대 1,000개의 연결된 데이터 세트가 있을 수 있습니다. 모든 구독자는 공유 데이터 세트당 최대 1,000개의 연결된 데이터 세트를 포함할 수 있습니다.

  • Analytics Hub를 사용하여 다음 BigQuery 객체를 공유할 수 있습니다.

    목록을 만들 때 지원되지 않는 리소스가 있는 데이터 세트는 공유 데이터 세트로 선택할 수 없습니다.

  • 게시자인 경우 다음 BigQuery 상호 운용성이 적용됩니다.

    • 스트리밍 삽입 또는 BigQuery Storage Write API를 사용하여 공유 데이터 세트로 데이터를 스트리밍하면 연결된 데이터세트에 문제가 발생할 수 있습니다.

    • 공유 데이터 세트열 수준행 수준 보안을 지원합니다.

    • 공유 데이터 세트의 에 소스 데이터에 대한 정규화된 URI 참조가 없으면 구독자가 해당 데이터 세트를 쿼리할 때 올바른 결과를 얻지 못합니다. 이 문제를 방지하려면 정규화된 참조를 사용하세요(예: PROJECT_NAME.DATASET_NAME.TABLE_NAME).

    • Data Catalog에서 공유 데이터 세트 색인이 생성됩니다. 테이블 또는 뷰 추가와 같은 공유 데이터 세트에 대한 업데이트는 지연 없이 구독자에게 제공됩니다. 하지만 특정 시나리오에서 예를 들어 공유 데이터 세트에 구독자나 테이블이 100개 넘게 있는 경우 업데이트가 Data Catalog에서 색인을 생성하는 데 최대 18시간이 걸릴 수 있습니다. 색인 생성이 지연되므로 구독자는 Console에서 업데이트된 이러한 리소스를 즉시 검색할 수 없습니다.

  • 구독자인 경우 다음 BigQuery 상호 운용성이 적용됩니다.

    • 연결된 데이터 세트 리소스에서 BigQuery Storage Read API의 사용은 지원되지 않습니다.

    • 연결된 데이터 세트 리소스에서의 시간 이동은 지원되지 않습니다.

    • 연결된 데이터 세트의 테이블을 참조하는 구체화된 뷰는 지원되지 않습니다.

    • 연결된 데이터 세트 테이블의 스냅샷 생성은 지원되지 않습니다.

  • 연결된 데이터 세트가 공유 데이터 세트와 같은 위치에 있지 않으면 쿼리 크기가 5GiB를 초과하는 연결된 데이터 세트 테이블에 대한 읽기 작업이 실패할 수 있습니다. 이 오류는 자동으로 해결될 수 있습니다. 또한 지원팀에 문의하여 이 문제를 해결할 수도 있습니다.

  • 연결된 데이터 세트의 테이블 메타데이터를 보기 위해 리전 한정자INFORMATION_SCHEMA 뷰와 함께 사용할 수 없습니다.

지원되는 리전

Analytics Hub는 다음 리전 및 멀티 리전에서 지원됩니다.

리전

다음 표에는 Analytics Hub를 사용할 수 있는 미주 지역의 리전이 나와 있습니다.
리전 설명 리전 이름 세부정보
아이오와 us-central1 리프 아이콘 낮은 CO2
라스베이거스 us-west4
로스앤젤레스 us-west2
몬트리올 northamerica-northeast1 리프 아이콘 낮은 CO2
북 버지니아 us-east4
오리건 us-west1 리프 아이콘 낮은 CO2
솔트레이크시티 us-west3
상파울루 southamerica-east1 리프 아이콘 낮은 CO2
산티아고 southamerica-west1
사우스캐롤라이나 us-east1
토론토 northamerica-northeast2
다음 표에는 Analytics Hub를 사용할 수 있는 아시아 태평양의 리전이 나와 있습니다.
리전 설명 리전 이름 세부정보
델리 asia-south2
Hong Kong asia-east2
자카르타 asia-southeast2
멜버른 australia-southeast2
뭄바이 asia-south1
오사카 asia-northeast2
서울 asia-northeast3
싱가포르 asia-southeast1
시드니 australia-southeast1
타이완 asia-east1
도쿄 asia-northeast1
다음 표에는 Analytics Hub를 사용할 수 있는 유럽 내 리전이 나와 있습니다.
리전 설명 리전 이름 세부정보
벨기에 europe-west1 리프 아이콘 낮은 CO2
핀란드 europe-north1 리프 아이콘 낮은 CO2
프랑크푸르트 europe-west3
런던 europe-west2
네덜란드 europe-west4
바르샤바 europe-central2
취리히 europe-west6 리프 아이콘 낮은 CO2

멀티 리전

다음 표에는 Analytics Hub를 사용할 수 있는 멀티 리전이 나와 있습니다.
멀티 리전 설명 멀티 리전 이름
유럽 연합 회원국의 데이터 센터1 EU
미국의 데이터 센터 US

1 EU 멀티 리전에 있는 데이터는 europe-west2(런던) 또는 europe-west6(취리히) 데이터 센터에 저장되지 않습니다.

사용 사례

이 섹션에서는 Analytics Hub를 사용하는 방법의 예시를 보여줍니다.

소매업체이고 조직에 예측이라는 Google Cloud 프로젝트에 실시간 수요 예측 데이터가 있다고 가정해 보겠습니다. 이 수요 예측 데이터를 공급망 시스템에 있는 수백 개의 공급업체와 공유하려고 합니다. Analytics Hub를 통해 공급업체와 데이터를 공유하는 방법은 다음과 같습니다.

Analytics Hub 관리자

예측 프로젝트 소유자는 먼저 Analytics Hub API를 사용 설정한 다음 Analytics Hub 관리자 역할을 프로젝트 내 데이터 교환을 관리하는 사용자에게 할당해야 합니다. Analytics Hub 관리자 역할이 있는 사용자를 Analytics Hub 관리자라고 합니다.

Analytics Hub 관리자는 다음 작업을 수행할 수 있습니다.

  • 조직의 예측 프로젝트에서 데이터 교환을 생성, 업데이트, 삭제, 공유합니다.

  • 다른 Analytics Hub 관리자를 관리합니다.

  • 조직 직원에게 Analytics Hub 게시자 역할을 부여하여 게시자를 관리합니다. 일부 직원의 경우에는 목록을 업데이트, 삭제, 공유할 수 있지만 만들 수는 없도록 하려면 Analytics Hub 목록 관리자 역할을 부여하면 됩니다.

  • 모든 공급업체로 구성된 Google 그룹에 Analytics Hub 구독자 역할을 부여하여 구독자를 관리합니다. 일부 공급업체에게 사용 가능한 교환 및 목록에 대한 보기 액세스 권한만 부여하려면 Analytics Hub 뷰어 역할을 부여하면 됩니다. 이러한 공급업체는 목록을 구독할 수 없습니다.

자세한 내용은 데이터 교환 관리를 참조하세요.

Analytics Hub 게시자

게시자는 예측 프로젝트 또는 다른 프로젝트에서 데이터 세트에 대해 다음 목록을 만듭니다.

  • 목록 A: 수요 예측 데이터 세트 1
  • 목록 B: 수요 예측 데이터 세트 2
  • 목록 C: 수요 예측 데이터 세트 3

자세한 내용은 목록 관리를 참조하세요.

Analytics Hub 구독자

구독자는 데이터 교환에서 액세스할 수 있는 목록을 탐색할 수 있습니다. 또한 연결된 데이터 세트를 만들어 이러한 목록을 구독하고 프로젝트에 데이터 세트를 추가할 수 있습니다. 공급업체는 연결된 데이터 세트에서 쿼리를 실행하고 실시간으로 결과를 검색할 수 있습니다.

자세한 내용은 목록 보기 및 구독을 참조하세요.

가격 책정

데이터 교환 또는 목록을 관리하는 데 추가 비용이 들지 않습니다. Analytics Hub 게시자는 데이터 스토리지에 대해 비용이 청구되지만 구독자는 주문형 또는 정액제 요금제에 따라 공유 데이터에 대해 실행되는 쿼리 비용을 지불합니다. 가격 책정에 대한 자세한 내용은 BigQuery 가격 책정을 참조하세요.

할당량

Analytics Hub 할당량에 대한 자세한 내용은 할당량 및 한도를 참조하세요.

다음 단계