Suchsyntax für den Dataplex Universal Catalog

In diesem Dokument wird die Syntax für Suchanfragen an Dataplex Universal Catalog beschrieben. Bevor Sie dieses Dokument lesen, sollten Sie sich mit den Konzepten für die Metadatenverwaltung in Dataplex Universal Catalog vertraut machen, z. B. Einträge, Aspekte, Aspekttypen, Eintragsgruppen und Eintragstypen. Weitere Informationen finden Sie unter Metadatenverwaltung in Dataplex Universal Catalog.

Dataplex Universal Catalog bietet zwei Suchmodi: die Stichwortsuche und die Suche in natürlicher Sprache (Vorabversion).

Mit der Keyword-Suche können Sie Ressourcen mithilfe bestimmter Keywords, Filter und einer definierten Syntax finden.

Bei der Suche in Alltagssprache wird die Keyword-Suche um die Unterstützung von Anfragen in Alltagssprache erweitert. Sie können Ressourcen in Alltagssprache finden, ohne dass eine komplexe Syntax erforderlich ist.

In diesem Dokument wird die Syntax für die Schlagwortsuche und die Suche in natürlicher Sprache beschrieben.

Rufen Sie zum Starten einer Dataplex Universal Catalog-Suchanfrage in derGoogle Cloud Console die Dataplex Universal Catalog-Seite Suche auf und wählen Sie Dataplex Universal Catalog als Suchplattform aus.

Zur Suche

Weitere Informationen finden Sie unter Nach Ressourcen im Dataplex Universal Catalog suchen.

Sie können Assets finden, indem Sie einen Begriff oder eine Wortgruppe ohne bestimmte Syntax eingeben. Dataplex Universal Catalog führt eine umfassende Suche durch, indem Ihre Anfrage mit mehreren Metadatenfeldern abgeglichen wird, darunter:

  • Name, Anzeigename oder Beschreibung einer Ressource
  • Typ einer Ressource
  • Projekt-ID
  • Übersichtsbeschreibung
  • Spaltenname (oder verschachtelter Spaltenname) im Schema einer Ressource
  • Spaltenbeschreibung
  • Vollständig qualifizierter Name
  • Kontakte
  • Aspekte

Mit Abfragesyntax suchen

Für genauere Suchanfragen können Sie eine Abfrage mit einer bestimmten Syntax erstellen, einschließlich Qualifizierern, logischen Operatoren und Aspektsuchen.

Qualifizierte Prädikate

Sie können ein Prädikat qualifizieren, indem Sie ihm einen Schlüssel voranstellen, der die Übereinstimmung auf ein bestimmtes Metadatenelement einschränkt:

  • Ein Gleichheitszeichen (=) beschränkt die Suche auf eine genaue Übereinstimmung.
  • Ein Doppelpunkt (:) nach dem Schlüssel vergleicht das Prädikat mit einem Teilstring oder einem Token innerhalb des Werts in den Suchergebnissen.

Bei der Tokenisierung wird der Textfluss in eine Reihe von Tokens unterteilt, wobei jedes Token in der Regel einem einzelnen Wort entspricht.

Beispiel:

  • Mit name:foo werden Ressourcen mit Namen ausgewählt, die den Teilstring foo enthalten, z. B. foo1 und barfoo.
  • Mit description:foo werden Ressourcen mit dem Token foo in der Beschreibung ausgewählt, z. B. bar und foo.
  • location=foo gleicht Ressourcen an einem angegebenen Standort mit foo als Standortname ab.

Das Verhalten dieser Qualifizierer kann je nach Suchmodus leicht variieren, wie in den folgenden Abschnitten beschrieben.

Die Prädikatschlüssel type, system, location und orgid unterstützen nur den Qualifikator für die genaue Übereinstimmung (=), nicht den Qualifikator für Teilstrings (:), z. B. type=foo oder orgid=number.

Dataplex Universal Catalog unterstützt die folgenden Qualifier für die Stichwortsuche:

Kennzeichner Beschreibung
name:x Führt zu Übereinstimmung von x mit einem Teilstring der Ressourcen-ID.
displayname:x Führt zu Übereinstimmung von x mit einem Teilstring des Anzeigenamens der Ressource.
column:x Führt zu Übereinstimmung von x mit einem Teilstring des Spaltennamens (oder des verschachtelten Spaltennamens) im Schema der Ressource.
description:x Führt zu Übereinstimmung von x mit einem Token in der Ressourcenbeschreibung.
label:bar Führt zu Übereinstimmung mit BigQuery-Ressourcen, die ein Label haben (mit einem Wert) und deren Labelschlüssel bar als Teilstring hat.
label=bar Führt zu Übereinstimmung mit BigQuery-Ressourcen, die ein Label haben (mit einem Wert) und deren Labelschlüssel bar als String entspricht.
label:bar:x Führt zu Übereinstimmung von x mit einem Teilstring im Wert eines Labels mit dem Schlüssel bar, das mit einer BigQuery-Ressource verknüpft ist.
label=foo:bar Führt zu Übereinstimmung mit BigQuery-Ressourcen, bei denen der Schlüssel foo und der Schlüsselwert bar ist.
label.foo=bar Führt zu Übereinstimmung mit BigQuery-Ressourcen, bei denen der Schlüssel foo und der Schlüsselwert bar ist.
label.foo Führt zu Übereinstimmung mit BigQuery-Ressourcen, die ein Label haben, dessen Schlüssel als String foo entspricht.
type=TYPE Führt zu Übereinstimmung mit Ressourcen eines bestimmten Eintrags oder seines Typalias.
projectid:bar Führt zu Übereinstimmung mit Ressourcen in Google Cloud -Projekten, die bar als Teilstring in der ID enthalten.
parent:x Führt zu Übereinstimmung von x mit einem Teilstring des hierarchischen Pfads einer Ressource. Der übergeordnete Pfad ist ein fully_qualified_name der übergeordneten Ressource.
orgid=number Führt zu Übereinstimmung mit Ressourcen in einer Google Cloud Organisation mit dem genauen ID-Wert number.
system=SYSTEM Führt zu Übereinstimmung mit Ressourcen aus einem angegebenen System.
location=LOCATION

Führt zu Übereinstimmung mit Ressourcen an einem angegebenen Standort mit einem genauen Namen. Beispiel: location=us-central1 stimmt mit Assets überein, die in Iowa gehostet werden.

BigQuery Omni-Assets unterstützen diesen Qualifikator mit dem BigQuery Omni-Standortnamen. Beispiel: location=aws-us-east-1 entspricht BigQuery Omni-Assets in Northern Virginia.

createtime

Findet Ressourcen, die an bzw. zu, vor oder nach einem bestimmten Datum oder einer bestimmten Uhrzeit erstellt wurden.

Beispiel:

  • createtime:2019-01-01 führt zu Übereinstimmung mit Ressourcen, die am 01.01.2019 erstellt wurden.
  • createtime<2019-02 stimmt mit Ressourcen überein, die vor dem 01.02.2019 um 00:00:00 Uhr erstellt wurden.
  • createtime>2019-02 stimmt mit Ressourcen überein, die nach dem 01.02.2019 00:00:00 erstellt wurden.

Zeitstempelformat: YYYY-MM-DDThh:mm:ss

Alle Zeitstempel müssen in GMT angegeben sein. Zeitzonen werden nicht unterstützt. Teilzeitstempel sowie die Datumstrennzeichen Bindestrich (-) und Schrägstrich (/) werden unterstützt.

Beispiel:

  • 2010-10-22T05:36:24
  • 2010-10-22T05:36
  • 2010-10-22T05
  • 2010-10-22
  • 2010-10
  • 2010
  • 2010/10/22
updatetime

Findet Ressourcen, die an bzw. zu, vor oder nach einem bestimmten Datum oder einer bestimmten Uhrzeit aktualisiert wurden.

Beispiel:

  • updatetime:2019-01-01 führt zu Übereinstimmung mit Ressourcen, die am 01.01.2019 aktualisiert wurden.
  • updatetime<2019-02 stimmt mit Ressourcen überein, die vor dem 01.02.2019 um 00:00:00 Uhr aktualisiert wurden.
  • updatetime>2019-02 stimmt mit Ressourcen überein, die nach dem 2019-02-01T00:00:00 aktualisiert wurden.

Zeitstempelformat: YYYY-MM-DDThh:mm:ss

Alle Zeitstempel müssen in GMT angegeben sein. Zeitzonen werden nicht unterstützt. Teilzeitstempel sowie die Datumstrennzeichen Bindestrich (-) und Schrägstrich (/) werden unterstützt.

Beispiel:

  • 2010-10-22T05:36:24
  • 2010-10-22T05:36
  • 2010-10-22T05
  • 2010-10-22
  • 2010-10
  • 2010
  • 2010/10/22
fully_qualified_name:x Führt zu Übereinstimmung von x mit einem Teilstring von fully_qualified_name.
fully_qualified_name=x Entspricht x als fully_qualified_name.

Die Prädikatschlüssel type, system, location und description sowie die Aspektsuche (außer has) unterstützen nur den Qualifikator für die genaue Übereinstimmung (=), nicht den Qualifikator für die Teilstring-Übereinstimmung (:). Beispiel: type=foo.

Dataplex Universal Catalog unterstützt die folgenden Qualifier für die Suche in natürlicher Sprache:

Kennzeichner Beschreibung
name:x Führt zu Übereinstimmung von x mit einem Teilstring der Ressourcen-ID oder des Anzeigenamens der Ressource.
displayname:x Führt zu Übereinstimmung von x mit einem Teilstring des Anzeigenamens der Ressource.
column:x Führt zu Übereinstimmung von x mit einem Teilstring des Spaltennamens (oder des verschachtelten Spaltennamens) im Schema der Ressource.
description:x Führt zu Übereinstimmung von x mit einem Token in der Ressourcenbeschreibung.
labels:bar Führt zu Übereinstimmung mit BigQuery-Ressourcen, die ein Label haben (mit einem Wert) und deren Labelschlüssel bar als Teilstring hat.
labels=bar Führt zu Übereinstimmung mit BigQuery-Ressourcen, die ein Label haben (mit einem Wert) und deren Labelschlüssel bar als String entspricht.
labels.bar:x Führt zu Übereinstimmung von x mit einem Teilstring im Wert eines Labels mit dem Schlüssel bar, das mit einer BigQuery-Ressource verknüpft ist.
labels.foo=bar Führt zu Übereinstimmung mit BigQuery-Ressourcen, bei denen der Schlüssel foo und der Schlüsselwert bar ist.
type=TYPE Führt zu Übereinstimmung mit Ressourcen eines bestimmten Eintrags oder seines Typalias.
projectid:bar Führt zu Übereinstimmung mit Ressourcen in Google Cloud -Projekten, die bar als Teilstring in der ID enthalten.
parent:x Führt zu Übereinstimmung von x mit einem Teilstring des hierarchischen Pfads einer Ressource.
system=SYSTEM Führt zu Übereinstimmung mit Ressourcen aus einem angegebenen System.
location=LOCATION

Führt zu Übereinstimmung mit Ressourcen an einem angegebenen Standort mit einem genauen Namen. Beispiel: location=us-central1 stimmt mit Assets überein, die in Iowa gehostet werden.

BigQuery Omni-Assets unterstützen diesen Qualifikator mit dem BigQuery Omni-Standortnamen. Beispiel: location=aws-us-east-1 entspricht BigQuery Omni-Assets in Northern Virginia.

createtime

Findet Ressourcen, die an bzw. zu, vor oder nach einem bestimmten Datum oder einer bestimmten Uhrzeit erstellt wurden.

Beispiel:

  • createtime:2019-01-01 führt zu Übereinstimmung mit allen Ressourcen, die am 01.01.2019 erstellt wurden.
  • createtime<2019-02 stimmt mit allen Ressourcen überein, die vor dem 01.02.2019 um 00:00:00 Uhr erstellt wurden.
  • createtime>2019-02 stimmt mit allen Ressourcen überein, die nach dem 01.02.2019 um 00:00:00 Uhr erstellt wurden.
  • createtime>-30d entspricht allen Ressourcen, die in den letzten 30 Tagen erstellt wurden.
  • createtime<=-30d entspricht allen Ressourcen, die vor 30 Tagen oder früher erstellt wurden.
  • createtime<=-1d entspricht allen Ressourcen, die am Vortag erstellt wurden.

Zeitstempelformat: YYYY-MM-DDThh:mm:ss

Alle Zeitstempel müssen in GMT angegeben sein. Zeitzonen werden nicht unterstützt. Teilzeitstempel sowie die Datumstrennzeichen Bindestrich (-) und Schrägstrich (/) werden unterstützt.

Beispiel:

  • 2010-10-22T05:36:24
  • 2010-10-22T05:36
  • 2010-10-22T05
  • 2010-10-22
  • 2010-10
  • 2010
  • 2010/10/22
updatetime

Findet Ressourcen, die an bzw. zu, vor oder nach einem bestimmten Datum oder einer bestimmten Uhrzeit aktualisiert wurden.

Beispiel:

  • updatetime:2019-01-01 führt zu Übereinstimmung mit allen Ressourcen, die am 01.01.2019 aktualisiert wurden.
  • updatetime<2019-02 stimmt mit allen Ressourcen überein, die vor dem 01.02.2019 um 00:00:00 Uhr aktualisiert wurden.
  • updatetime>2019-02 stimmt mit allen Ressourcen überein, die nach dem 2019-02-01T00:00:00 aktualisiert wurden.
  • updatetime>-30d entspricht allen Ressourcen, die in den letzten 30 Tagen aktualisiert wurden.
  • updatetime<-30d entspricht allen Ressourcen, die vor 30 Tagen oder früher aktualisiert wurden.
  • updatetime=-1d entspricht allen Ressourcen, die am Vortag aktualisiert wurden.
  • updatetime>=-30d entspricht allen Ressourcen, die in den letzten 30 Tagen aktualisiert wurden.
  • updatetime<=-30d entspricht allen Ressourcen, die vor 30 Tagen oder früher aktualisiert wurden.

Zeitstempelformat: YYYY-MM-DDThh:mm:ss

Alle Zeitstempel müssen in GMT angegeben sein. Zeitzonen werden nicht unterstützt. Teilzeitstempel sowie die Datumstrennzeichen Bindestrich (-) und Schrägstrich (/) werden unterstützt.

Beispiel:

  • 2010-10-22T05:36:24
  • 2010-10-22T05:36
  • 2010-10-22T05
  • 2010-10-22
  • 2010-10
  • 2010
  • 2010/10/22

Wenn Sie nach Einträgen anhand der zugehörigen Aspekte suchen möchten, verwenden Sie die folgende Abfragesyntax.

Suche mit Suchbegriffen

Kennzeichner Beschreibung
aspect:x Entspricht x als Teilstring des vollständigen Pfads zum Aspekttyp eines Aspekts, der an den Eintrag angehängt ist, im Format projectid.location.ASPECT_TYPE_ID.
aspect=x Entspricht x als vollständigem Pfad zum Aspekttyp eines Aspekts, der an den Eintrag angehängt ist, im Format projectid.location.ASPECT_TYPE_ID.
aspect:xOPERATORvalue

Sucht nach Werten für das Feld „Seitenverhältnis“. Führt zu Übereinstimmung von x mit einem Teilstring des vollständigen Pfads zum Aspekttyp und Feldnamen eines Aspekts, der an den Eintrag angehängt ist, im Format projectid.location.ASPECT_TYPE_ID.FIELD_NAME.

Die Liste der unterstützten Operatoren hängt vom Feldtyp im Aspekt ab:

  • String: = (genaue Übereinstimmung) und : (Teilstring)
  • Alle Zahlentypen: =, :, <, >, <=, >=, =>, =<
  • Enum: =
  • Datum/Uhrzeit: wie bei Zahlen, aber die zu vergleichenden Werte werden als Datums- und Uhrzeitangaben statt als Zahlen behandelt.
  • Boolesch: =

Es können nur Felder der obersten Ebene des Aspekts durchsucht werden.

Die folgenden Abfragen stimmen beispielsweise alle mit Einträgen überein, bei denen der Wert des Felds is-enrolled im Aspekt employee-info true ist. Es werden auch andere Einträge zurückgegeben, die mit dem Teilstring übereinstimmen.

  • aspect:example-project.us-central1.employee-info.is-enrolled=true
  • aspect:example-project.us-central1.employee=true
  • aspect:employee=true

Suche in natürlicher Sprache

Kennzeichner Beschreibung
has:x Entspricht x als Teilstring des vollständigen Pfads zum Aspekttyp eines Aspekts, der an den Eintrag angehängt ist, im Format projectid.location.ASPECT_TYPE_ID.
has=x Entspricht x als vollständigem Pfad zum Aspekttyp eines Aspekts, der an den Eintrag angehängt ist, im Format projectid.location.ASPECT_TYPE_ID.
has:xOPERATORvalue

Sucht nach Werten für das Feld „Seitenverhältnis“. Entspricht x als Teilstring des vollständigen Pfads zum Aspekttyp und Feldnamen eines Aspekts, der an den Eintrag angehängt ist, in den folgenden Formaten:

  • Syntax für Systemaspekttypen:

    • ASPECT_TYPE_ID.FIELD_NAME
    • dataplex-types.ASPECT_TYPE_ID.FIELD_NAME
    • dataplex-types.LOCATION.ASPECT_TYPE_ID.FIELD_NAME

    Die folgenden Abfragen stimmen beispielsweise mit Einträgen überein, bei denen der Wert des Felds type im Aspekt bigquery-dataset default ist:

    • bigquery-dataset.type=default
    • dataplex-types.bigquery-dataset.type=default
    • dataplex-types.global.bigquery-dataset.type=default
  • Syntax für benutzerdefinierte Aspekttypen:

    • Wenn der Aspekt in der globalen Region erstellt wird: PROJECT_ID.ASPECT_TYPE_ID.FIELD_NAME
    • Wenn der Aspekt in einer bestimmten Region erstellt wird: PROJECT_ID.REGION.ASPECT_TYPE_ID.FIELD_NAME

    Die folgenden Abfragen stimmen beispielsweise mit Einträgen überein, bei denen der Wert des Felds is-enrolled im Aspekt employee-info true ist.

    • example-project.us-central1.employee-info.is-enrolled=true
    • example-project.employee-info.is-enrolled=true

    Die Liste der unterstützten Operatoren hängt vom Feldtyp im Aspekt ab:

    • String: = (genaue Übereinstimmung)
    • Alle Zahlentypen: =, :, <, >, <=, >=, =>, =<
    • Enum: =
    • Datum/Uhrzeit: wie bei Zahlen, aber die zu vergleichenden Werte werden als Datums- und Uhrzeitangaben statt als Zahlen behandelt.
    • Boolesch: =

Es können nur Felder der obersten Ebene des Aspekts durchsucht werden.

Logische Operatoren

Eine Abfrage kann aus mehreren Prädikaten mit logischen Operatoren bestehen. Wenn Sie keinen Operator angeben, wird das logische AND als Operator angenommen. Beispiel: foo bar gibt Ressourcen zurück, die sowohl dem Prädikat foo als auch dem Prädikat bar entsprechen.

Logisches AND und logisches OR werden unterstützt. Beispiel: foo OR bar

Ein Prädikat kann mit einem Präfix - (Bindestrich) oder NOT negiert werden. Beispiel: -name:foo gibt Ressourcen mit Namen zurück, die nicht dem Prädikat foo entsprechen.

Abgekürzte Syntax

Außerdem ist eine abgekürzte Suchsyntax verfügbar, die | (senkrechter Strich) für OR-Operatoren und , (Komma) für AND-Operatoren verwendet.

Für die Suche nach Einträgen in einem der zahlreichen Projekte mit dem Operator OR können Sie beispielsweise die folgende abgekürzte Syntax verwenden:

projectid:(id1|id2|id3|id4)

Dieselbe Suche ohne abgekürzte Syntax sieht so aus:

projectid:id1 OR projectid:id2 OR projectid:id3 OR projectid:id4

So suchen Sie nach Einträgen mit übereinstimmenden Spaltennamen:

  • UND: column:(name1, name2, name3)
  • ODER: column:(name1|name2|name3)

Diese abgekürzte Syntax funktioniert für alle qualifizierten Prädikate, mit Ausnahme von label bei der Keyword-Suche.

Nächste Schritte