Dataplex Universal Catalog는 Google Cloud의 데이터 및 AI 애셋을 위한 통합 지능형 거버넌스 솔루션입니다. Dataplex Universal Catalog를 통해 AI를 사용하여 데이터 쿼리, 품질 보증, 비즈니스 인사이트를 간소화할 수 있습니다.
Dataplex Universal Catalog는 대규모로 거버넌스를 실행합니다. 예를 들어 Cloud Storage, Spanner, Pub/Sub에 저장된 대량의 판매, 인벤토리, 고객 데이터를 생성하는 글로벌 소매업체가 있다고 가정해 보겠습니다. 데이터가 시스템 전반에 분산되어 있으므로 거버넌스를 관리하고, 품질을 보장하고, 규정 준수를 유지하는 것이 복잡하고 시간이 오래 걸립니다. Dataplex Universal Catalog는 조직의 데이터 애셋을 탐색, 프로파일링, 검증하고 계보를 추적하고 액세스를 제어할 수 있는 중앙 뷰를 제공하여 이 프로세스를 간소화합니다.
Dataplex Universal Catalog를 사용해야 하는 이유
Dataplex Universal Catalog는 다음 기능을 통해 데이터를 관리합니다.
메타데이터 분류. 데이터 애셋의 스냅샷을 위해 Google Cloud 리소스(BigQuery, Cloud SQL, Spanner, Vertex AI, Pub/Sub, Dataform, Dataproc Metastore) 및 Dataplex Universal Catalog로 가져온 서드 파티 리소스의 메타데이터를 검색합니다.
데이터 탐색. Cloud Storage 버킷에서 정형 데이터와 비정형 데이터를 스캔하여 메타데이터를 추출하고 분류합니다.
데이터 인사이트. AI를 사용하여 데이터에 관한 자연어 질문을 생성하고, 패턴을 파악하고, 데이터 품질을 평가하고, 통계 분석을 수행합니다.
데이터 프로파일링. BigQuery 테이블의 열 데이터의 일반적인 특성(예: 일반적인 데이터 값, 데이터 분포, null 개수)을 식별하여 데이터 분류 및 품질 보증에 참고할 수 있습니다.
데이터 품질. 조직 정책에 따라 데이터를 검증하고 데이터가 품질 기준을 충족하지 않는 경우 알림을 로깅하여 BigQuery 테이블의 데이터 품질을 정의하고 측정합니다.
비즈니스 용어집. 조직 전반에서 비즈니스 관련 용어 및 정의를 관리하고 용어를 테이블 열에 연결하여 데이터 사용에 대한 일관된 이해를 유도합니다.
데이터 계보. 시스템을 통해 데이터가 이동하는 방식, 즉 데이터의 출처, 데이터가 전달되는 위치, 데이터에 적용되는 변환을 추적할 수 있습니다.
Dataplex Universal Catalog는 분산된 탐색에서 비즈니스 인사이트에 이르기까지 엔드 투 엔드 데이터 수명 주기를 지원합니다. 거버넌스 기능은 BigQuery를 통해서도 사용할 수 있습니다.
[[["이해하기 쉬움","easyToUnderstand","thumb-up"],["문제가 해결됨","solvedMyProblem","thumb-up"],["기타","otherUp","thumb-up"]],[["이해하기 어려움","hardToUnderstand","thumb-down"],["잘못된 정보 또는 샘플 코드","incorrectInformationOrSampleCode","thumb-down"],["필요한 정보/샘플이 없음","missingTheInformationSamplesINeed","thumb-down"],["번역 문제","translationIssue","thumb-down"],["기타","otherDown","thumb-down"]],["최종 업데이트: 2025-08-08(UTC)"],[[["\u003cp\u003eDataplex unifies distributed data across data lakes, warehouses, and marts without data movement, centralizing data management and governance.\u003c/p\u003e\n"],["\u003cp\u003eIt enables building a domain-specific data mesh across multiple Google Cloud projects while providing consistent data governance and monitoring.\u003c/p\u003e\n"],["\u003cp\u003eDataplex automates metadata discovery and curation across various data silos and offers secure querying using BigQuery and open-source tools.\u003c/p\u003e\n"],["\u003cp\u003eThe platform abstracts underlying data storage using constructs like lakes, zones, and assets to organize data based on business needs and data readiness.\u003c/p\u003e\n"],["\u003cp\u003eCommon use cases include creating a domain-centric data mesh with decentralized data ownership and tiering data based on its readiness for different users.\u003c/p\u003e\n"]]],[],null,["# Dataplex Universal Catalog overview\n\nDataplex Universal Catalog is a unified, intelligent governance solution for data and AI\nassets in Google Cloud. Through Dataplex Universal Catalog,\nyou can use AI to simplify data queries, quality assurance, and business\ninsights.\n\nDataplex Universal Catalog performs governance at scale. For example, consider a\nglobal retail company that generates large amounts of sales, inventory, and\ncustomer data that's stored in Cloud Storage, Spanner, and\nPub/Sub. With data distributed across systems, it can be complex and\ntime-consuming to manage governance, ensure quality, and maintain compliance.\nDataplex Universal Catalog simplifies this process by providing a central view to\ndiscover, profile, validate, track the lineage of, and control access to\norganizational data assets.\n\nWhy use Dataplex Universal Catalog?\n-----------------------------------\n\nDataplex Universal Catalog governs data through the following features:\n\n- **[Metadata cataloging](/dataplex/docs/catalog-overview)**. Retrieve metadata for Google Cloud resources (in BigQuery, Cloud SQL, Spanner, Vertex AI, Pub/Sub, Dataform, Dataproc Metastore), and third-party resources you bring into Dataplex Universal Catalog, for a snapshot of your data assets.\n- **[Data discovery](/bigquery/docs/automatic-discovery)**. Scan for structured and unstructured data in Cloud Storage buckets to extract and catalog their metadata.\n- **[Data insights](/dataplex/docs/data-insights)**. Use AI to generate natural language questions about your data, to uncover patterns, assess data quality, and perform statistical analyses.\n- **[Data profiling](/dataplex/docs/data-profiling-overview)**. Identify common characteristics of the column data in your BigQuery tables, for example, typical data values, data distribution, and null counts, which can inform data classification and quality assurance.\n- **[Data quality](/dataplex/docs/auto-data-quality-overview)**. Define and measure the quality of the data in your BigQuery tables, by validating data against organizational policies and logging alerts if data doesn't meet quality criteria.\n- **[Business glossary](/dataplex/docs/create-glossary)**. Manage business-related terminology and definitions across your organization, and attach terms to table columns to promote a consistent understanding of data usage.\n- **[Data lineage](/dataplex/docs/about-data-lineage)**. Track how data moves through your systems: where it comes from, where it is passed to, and what transformations are applied to it.\n\nDataplex Universal Catalog supports an end-to-end data lifecycle, from distributed\ndiscovery to business insights. Governance features are also available through\nBigQuery.\n\nUse cases\n---------\n\nYou can use Dataplex Universal Catalog to do the following:\n\n- **Discover and understand your data**. Dataplex Universal Catalog\n provides visibility over your data resources across the organization. It lets\n you find relevant resources for data consumption needs. It provides context\n for data resources, which helps you understand the suitability of data\n resources for your data consumer's needs.\n\n- **Enable data governance and data management**. Dataplex Universal Catalog\n supplies metadata that can inform and power your data governance and data\n management capabilities.\n\n- **Maintain an extensible and comprehensive repository for your metadata**.\n Dataplex Universal Catalog stores and provides access to metadata that\n is automatically harvested from your Google Cloud resources. You can\n integrate your own metadata from non-Google Cloud systems. You can enrich all\n metadata with additional business and technical metadata annotations.\n\nGet started\n-----------\n\nIf this is your first time working with Dataplex Universal Catalog, consider\nfollowing a quickstart:\n\n- [Track data lineage for a BigQuery table](/dataplex/docs/track-lineage-quickstart)\n\nWhat's next\n-----------\n\n- Learn about [metadata management in Dataplex Universal Catalog](/dataplex/docs/catalog-overview#catalog-model).\n- Learn how to [search for data assets](/dataplex/docs/search-assets).\n- Learn how to [manage entries and ingest custom sources](/dataplex/docs/ingest-custom-sources).\n- Learn how to [import metadata into Dataplex Universal Catalog](/dataplex/docs/managed-connectivity-overview).\n- Learn about [BigQuery governance](/bigquery/docs/data-governance)."]]