Dataplex
일관된 제어를 통해 데이터 레이크, 데이터 웨어하우스 및 데이터 마트 전반에서 조직이 데이터를 중앙 집중식으로 관리, 모니터링 및 관리할 수 있도록 지원하는 Dataplex의 지능형 데이터 패브릭을 통해 데이터 사일로에서 벗어나 신뢰할 수 있는 데이터에 액세스하고 대규모의 분석을 지원할 수 있도록 합니다.
-
여러 데이터 사일로의 데이터 관리를 위한 단일 창
-
중앙 집중식 보안 및 거버넌스를 통해 전역 제어로 분산된 데이터 소유권 지원
-
분산 데이터를 대상으로 비즈니스 컨텍스트를 기반으로 한 통합 검색 및 데이터 검색
-
기본 제공되는 데이터 인텔리전스로 데이터에 대한 신뢰를 형성하고 유용한 정보를 더 빠르게 도출
-
오픈소스 도구와 강력한 파트너 생태계를 지원하는 개방형 플랫폼
이점
자유로운 선택
전체 분석 수명 주기를 가속화하기 위해 최고의 분석 도구(오픈소스 또는 클라우드 기반)를 선택하는 동시에 최고의 가격과 성능으로 원하는 곳에 데이터를 자유롭게 저장할 수 있습니다.
지능형 자동화
Google의 동급 최고 AI/ML 기능을 사용하는 기본 제공 데이터 인텔리전스는 데이터 검색, 메타데이터 수집, 데이터 수명주기 관리, 데이터 품질 및 계보를 자동화해 관리 비용을 절감합니다.
통합 거버넌스
분산된 데이터 간의 일관성을 위해 메타데이터, 보안 정책, 거버넌스, 데이터 분류의 표준화 및 통합을 지원합니다.
주요 특징
주요 특징
간소화된 데이터 검색
기본 제공되는 데이터 인텔리전스를 통해 Google Cloud 및 그 외에 저장된 구조화된 데이터, 반구조화된 데이터, 구조화되지 않은 데이터의 검색, 분류, 메타데이터 보강을 자동화합니다. 유연하고 강력한 통합된 Data Catalog에서 모든 데이터에 대한 기술, 운영, 비즈니스 메타데이터를 관리합니다. Gmail과 동일한 검색 기술을 사용하여 패싯 검색 기능이 내장된 기본 인터페이스로 쉽게 데이터를 검색, 탐색, 파악할 수 있습니다.
데이터 정리 및 수명 주기 관리
Dataplex 레이크와 데이터 영역을 사용하여 여러 스토리지 서비스에 이르는 데이터를 비즈니스별 도메인으로 논리적으로 구성합니다. 클릭 한 번으로 데이터를 간편하게 관리, 선별, 등급 지정, 보관합니다.
중앙 집중식 보안 및 거버넌스
여러 데이터 사일로에서 데이터 승인 및 분류에 대한 중앙 정책 관리, 모니터링, 감사를 사용 설정합니다. 전역 모니터링 및 거버넌스로 비즈니스 도메인을 기반으로 분산된 데이터 소유권을 지원합니다.
기본 제공 데이터 품질 및 계보
분산된 데이터의 데이터 품질을 자동화하고 신뢰할 수 있는 데이터에 대한 액세스를 지원합니다. 자동 캡처된 데이터 계보를 사용하여 데이터를 더 효과적으로 이해하고, 종속 항목을 추적하고, 데이터 문제를 효과적으로 해결합니다.
서버리스 데이터 탐색
Spark SQL 스크립트 및 Jupyter 노트북에 클릭 한 번으로 액세스할 수 있는 서버리스 데이터 탐색 워크벤치를 사용하여 완전 관리형 고품질 데이터를 대화형으로 쿼리합니다. 기본 제공 게시, 공유, 검색 기능을 사용하여 팀 간에 간편하게 공동작업합니다. 워크벤치에서 클릭 한 번으로 예약하여 작업을 운영합니다.
"Google Cloud에 데이터 PB에는 매일 수천 명의 내부 사용자가 액세스합니다. Dataplex를 통해 분산된 데이터 소유권과 중앙 집중식 거버넌스 및 가시성을 갖춰 분산 데이터 전반에 걸쳐 비즈니스 도메인별 셀프서비스 데이터 플랫폼을 제공할 수 있습니다. Dataplex를 분석 데이터 전반에 걸친 통합 데이터 메시를 빌드하는 중앙 구성요소로 도입할 수 있게 되어 매우 기쁩니다."
사랄 자인, Snap Inc. 엔지니어링 부문 책임자
새로운 소식
Dataplex에 대해 자세히 알아보고 싶으신가요?
문서
문서
Dataplex 작동 방식
새 데이터 소스를 식별하면서 Dataplex는 무결성을 개선하기 위해 기본 제공 데이터 품질 검사를 사용하여 구조화된 데이터와 구조화되지 않은 데이터 모두에 대해 메타데이터를 가져옵니다.
Data Catalog 개요
Data Catalog를 통해 데이터를 효율적으로 사용하는 방법을 알아보세요.
Dataplex 시작 방법
레이크 및 영역에 저장된 데이터를 논리적으로 구성하고 데이터 관리 및 거버넌스를 자동화하여 대규모로 분석을 지원할 수 있습니다.
Data Catalog로 검색하는 방법
Data Catalog를 사용하여 Google Cloud 프로젝트에서 데이터 세트, 테이블, 뷰, Pub/Sub 주제와 같은 데이터 애셋 검색을 수행합니다.
Dataplex 권장사항
다음 권장사항에 따라 Dataplex 환경을 최적화하세요.
Dataplex API
Dataplex API를 사용하여 분산 데이터를 중앙에서 관리하고 제어하세요.
Data Catalog API
Data Catalog API를 사용하여 분산 데이터의 메타데이터를 중앙에서 관리하고 보강하세요.
사용 사례
사용 사례
Dataplex를 사용하여 Cloud Storage와 BigQuery의 데이터에서 비즈니스 도메인별 데이터 메시 아키텍처를 빌드합니다. 중앙에서 데이터 소유권을 유지하면서 기업 전반의 데이터를 중앙에서 관리, 모니터링, 제어할 수 있으며, 다양한 분석 및 데이터 과학 도구에 안전하게 액세스할 수 있습니다.
Dataplex 내에서 완전 관리형 서버리스 Data Catalog를 사용하여 데이터 사일로 전반의 데이터 애셋을 손쉽게 검색하고 탐색하세요. Data Catalog는 기술 메타데이터를 자동으로 수집하고, 관련 비즈니스 맥락으로 메타데이터를 보강하며, 조직의 모든 사용자가 강력한 패싯 검색 인터페이스를 통해 데이터를 쉽게 찾고 이해할 수 있도록 돕는 기능을 기본 제공합니다.
가격 책정
가격 책정
Dataplex 가격은 다음을 포함한 사용한 만큼만 지불하는 방식을 기준으로 책정됩니다.
- Dataplex 데이터 탐색 기능을 다루는 Dataplex 처리
- Data Catalog 메타데이터 스토리지
- Data Catalog 읽기, 쓰기, 검색 API 호출
Cloud AI 제품은 SLA 정책을 준수하며 지연 시간이나 가용성 보장 측면에서 여타 Google Cloud 서비스와는 차이가 있을 수 있습니다.