Dataplex Universal Catalog – Übersicht

Dataplex Universal Catalog ist eine einheitliche, intelligente Governance-Lösung für Daten und KI-Assets in Google Cloud. Mit Dataplex Universal Catalog können Sie KI nutzen, um Datenabfragen, Qualitätssicherung und geschäftliche Erkenntnisse zu vereinfachen.

Dataplex Universal Catalog bietet Governance im großen Maßstab. Nehmen wir als Beispiel ein globales Einzelhandelsunternehmen, das große Mengen an Verkaufs-, Inventar- und Kundendaten generiert, die in Cloud Storage, Spanner und Pub/Sub gespeichert werden. Wenn Daten auf verschiedene Systeme verteilt sind, kann es komplex und zeitaufwendig sein, die Governance zu verwalten, die Qualität sicherzustellen und die Compliance aufrechtzuerhalten. Dataplex Universal Catalog vereinfacht diesen Prozess, da er eine zentrale Ansicht bietet, mit der Sie Daten-Assets der Organisation ermitteln, profilieren, validieren, die Herkunft nachverfolgen und den Zugriff darauf steuern können.

Gründe für die Verwendung von Dataplex Universal Catalog

Dataplex Universal Catalog verwaltet Daten über die folgenden Funktionen:

  • Metadatenkatalogisierung: Metadaten für Google Cloud -Ressourcen (in BigQuery, Cloud SQL, Spanner, Vertex AI, Pub/Sub, Dataform, Dataproc Metastore) und Drittanbieterressourcen abrufen, die Sie in Dataplex Universal Catalog einbinden, um einen Snapshot Ihrer Datenassets zu erhalten.
  • Datenermittlung: Nach strukturierten und unstrukturierten Daten in Cloud Storage-Buckets suchen, um deren Metadaten zu extrahieren und zu katalogisieren.
  • Data Insights: Mit KI können Sie Fragen in natürlicher Sprache zu Ihren Daten generieren, um Muster zu erkennen, die Datenqualität zu bewerten und statistische Analysen durchzuführen.
  • Datenprofilerstellung: Sie können allgemeine Merkmale der Spaltendaten in Ihren BigQuery-Tabellen identifizieren, z. B. typische Datenwerte, Datenverteilung und Anzahl der Nullwerte. Diese Informationen können für die Datenklassifizierung und Qualitätssicherung verwendet werden.
  • Datenqualität: Sie können die Qualität der Daten in Ihren BigQuery-Tabellen definieren und messen, indem Sie Daten anhand von Organisationsrichtlinien validieren und Warnungen protokollieren, wenn Daten die Qualitätskriterien nicht erfüllen.
  • Geschäftsglossar Sie können unternehmensbezogene Begriffe und Definitionen in Ihrer Organisation verwalten und Begriffe an Tabellenspalten anhängen, um ein einheitliches Verständnis der Datennutzung zu fördern.
  • Data Lineage: Nachverfolgen, wie sich Daten durch Ihre Systeme bewegen: woher sie stammen, wohin sie übertragen werden und welche Transformationen auf sie angewendet werden.

Dataplex Universal Catalog unterstützt einen lückenlosen Datenlebenszyklus, von der verteilten Ermittlung bis hin zu geschäftlichen Erkenntnissen. Governance-Funktionen sind auch über BigQuery verfügbar.

Anwendungsfälle

Mit Dataplex Universal Catalog können Sie Folgendes tun:

  • Daten ermitteln und nachvollziehen Dataplex Universal Catalog bietet einen Überblick über Ihre Datenressourcen in der gesamten Organisation. So können Sie relevante Ressourcen für den Datenverbrauch finden. Sie liefert Kontext für Datenressourcen, damit Sie die Eignung von Datenressourcen für die Anforderungen Ihrer Datenverbraucher besser einschätzen können.

  • Data Governance und Datenverwaltung aktivieren Dataplex Universal Catalog liefert Metadaten, die Ihre Data Governance- und Datenverwaltungsfunktionen unterstützen.

  • Ein erweiterbares und umfassendes Repository für Ihre Metadaten verwalten: Im Dataplex Universal Catalog werden Metadaten gespeichert und der Zugriff darauf ermöglicht, die automatisch aus Ihren Google Cloud Ressourcen erfasst werden. Sie können Ihre eigenen Metadaten aus Nicht-Google Cloud -Systemen einbinden. Sie können alle Metadaten mit zusätzlichen Anmerkungen zu geschäftlichen und technischen Metadaten anreichern.

Jetzt starten

Wenn Sie zum ersten Mal mit Dataplex Universal Catalog arbeiten, sollten Sie eine Kurzanleitung verwenden:

Nächste Schritte