Data Catalog가 Dataplex의 일부가 되었습니다. 이제 단일 엔드 투 엔드 환경에서 데이터를 쉽게 탐색, 관리, 제어할 수 있습니다. 자세히 알아보기
바로 이동

Dataplex

일관된 제어를 통해 데이터 레이크, 데이터 웨어하우스 및 데이터 마트 전반에서 조직이 데이터를 중앙 집중식으로 관리, 모니터링 및 관리할 수 있도록 지원하는 Dataplex의 지능형 데이터 패브릭을 통해 데이터 사일로에서 벗어나 신뢰할 수 있는 데이터에 액세스하고 대규모의 분석을 지원할 수 있도록 합니다.

  • 여러 데이터 사일로의 데이터 관리를 위한 단일 창

  • 중앙 집중식 보안 및 거버넌스를 통해 전역 제어로 분산된 데이터 소유권 지원

  • 분산 데이터를 대상으로 비즈니스 컨텍스트를 기반으로 한 통합 검색 및 데이터 검색

  • 기본 제공되는 데이터 인텔리전스로 데이터에 대한 신뢰를 형성하고 유용한 정보를 더 빠르게 도출

  • 오픈소스 도구와 강력한 파트너 생태계를 지원하는 개방형 플랫폼

이점

자유로운 선택

전체 분석 수명 주기를 가속화하기 위해 최고의 분석 도구(오픈소스 또는 클라우드 기반)를 선택하는 동시에 최고의 가격과 성능으로 원하는 곳에 데이터를 자유롭게 저장할 수 있습니다.

지능형 자동화

Google의 동급 최고 AI/ML 기능을 사용하는 기본 제공 데이터 인텔리전스는 데이터 검색, 메타데이터 수집, 데이터 수명주기 관리, 데이터 품질 및 계보를 자동화해 관리 비용을 절감합니다.

통합 거버넌스

분산된 데이터 간의 일관성을 위해 메타데이터, 보안 정책, 거버넌스, 데이터 분류의 표준화 및 통합을 지원합니다.

주요 특징

주요 특징

중앙 집중식 보안 및 거버넌스

여러 데이터 사일로에서 데이터 승인 및 분류에 대한 중앙 정책 관리, 모니터링, 감사를 사용 설정합니다. 전역 모니터링 및 거버넌스로 비즈니스 도메인을 기반으로 분산된 데이터 소유권을 지원합니다. 

Data Catalog를 사용한 통합 메타데이터 관리

기본 제공되는 데이터 인텔리전스를 사용하여 Google Cloud에 저장된 구조화된 데이터, 반구조화된 데이터, 구조화되지 않은 데이터의 데이터 검색, 분류, 메타데이터 보강을 자동화합니다. 통합 가능하고 유연하며 강력한 Data Catalog로 모든 데이터의 기술, 운영, 비즈니스 메타데이터를 관리하세요.

간소화된 데이터 검색 및 탐색

Gmail과 동일한 검색 기술을 사용하여 패싯 검색 기능이 내장된 기본 인터페이스로 쉽게 데이터를 검색, 탐색, 파악할 수 있습니다. 다양한 분석과 데이터 과학 도구를 사용해 이 데이터를 탐색 및 분석할 수 있습니다.  

데이터 품질 및 계보

분산된 데이터의 데이터 품질을 자동화하고 신뢰할 수 있는 데이터에 대한 액세스를 지원하세요. 자동으로 캡처된 데이터 계보를 사용하여 데이터를 더 잘 파악하고 종속 항목을 추적하며 데이터 문제를 효과적으로 해결할 수 있습니다. 

데이터 정리 및 수명 주기 관리

Dataplex 레이크와 데이터 영역을 사용하여 여러 스토리지 서비스에 이르는 데이터를 비즈니스별 도메인으로 논리적으로 구성합니다. 클릭 한 번으로 데이터를 간편하게 관리, 선별, 등급 지정, 보관합니다.

Snap

"Google Cloud에 데이터 PB에는 매일 수천 명의 내부 사용자가 액세스합니다. Dataplex를 통해 분산된 데이터 소유권과 중앙 집중식 거버넌스 및 가시성을 갖춰 분산 데이터 전반에 걸쳐 비즈니스 도메인별 셀프서비스 데이터 플랫폼을 제공할 수 있습니다. Dataplex를 분석 데이터 전반에 걸친 통합 데이터 메시를 빌드하는 중앙 구성요소로 도입할 수 있게 되어 매우 기쁩니다."

사랄 자인, Snap Inc. 엔지니어링 부문 책임자

문서

문서

Google Cloud 기본사항
Dataplex 작동 방식

새 데이터 소스를 식별하면서 Dataplex는 무결성을 개선하기 위해 기본 제공 데이터 품질 검사를 사용하여 구조화된 데이터와 구조화되지 않은 데이터 모두에 대해 메타데이터를 가져옵니다.

Google Cloud 기본사항
Data Catalog 개요

Data Catalog를 통해 데이터를 효율적으로 사용하는 방법을 알아보세요.

빠른 시작
Dataplex 시작 방법

레이크 및 영역에 저장된 데이터를 논리적으로 구성하고 데이터 관리 및 거버넌스를 자동화하여 대규모로 분석을 지원할 수 있습니다.

가이드
Data Catalog로 검색하는 방법

Data Catalog를 사용하여 Google Cloud 프로젝트에서 데이터 세트, 테이블, 뷰, Pub/Sub 주제와 같은 데이터 애셋 검색을 수행합니다.

권장사항
Dataplex 권장사항

Dataplex 환경을 최적화하려면 다음 권장사항을 따르세요.

API 및 라이브러리
Dataplex API

Dataplex API를 사용하여 분산 데이터를 중앙에서 관리하고 제어하세요.

API 및 라이브러리
Data Catalog API

Data Catalog API를 사용하여 분산 데이터의 메타데이터를 중앙에서 관리하고 보강하세요.

사용 사례

사용 사례

사용 사례
데이터 메시 아키텍처 빌드

Dataplex를 사용하여 Cloud StorageBigQuery의 데이터에서 비즈니스 도메인별 데이터 메시 아키텍처를 빌드합니다. 중앙에서 데이터 소유권을 유지하면서 기업 전반의 데이터를 중앙에서 관리, 모니터링, 제어할 수 있으며, 다양한 분석 및 데이터 과학 도구에 안전하게 액세스할 수 있습니다.

사용 사례
Data Catalog로 데이터 통계 민주화

Dataplex 내에서 완전 관리형 서버리스 Data Catalog를 사용하여 데이터 사일로 전반의 데이터 애셋을 손쉽게 검색하고 탐색하세요. Data Catalog는 기술 메타데이터를 자동으로 수집하고, 관련 비즈니스 맥락으로 메타데이터를 보강하며, 조직의 모든 사용자가 강력한 패싯 검색 인터페이스를 통해 데이터를 쉽게 찾고 이해할 수 있도록 돕는 기능을 기본 제공합니다.

가격 책정

가격 책정

Dataplex 가격은 다음을 포함한 사용한 만큼만 지불하는 방식을 기준으로 책정됩니다.

- Dataplex 처리: Dataplex의 데이터 검색 기능을 다룹니다.

- Data Catalog 메타데이터 스토리지

- Data Catalog 읽기, 쓰기, 검색 API 호출

파트너

업계 선두업체와 협력

Google은 업계 최고의 데이터 분석 제공업체와 협력하여 Dataplex가 기존 데이터 분석 투자와 빠르게 통합할 수 있도록 합니다.