Föderierte Abfragen mit Data Boost ausführen

Auf dieser Seite wird erläutert, wie Sie Spanner Data Boost beim Ausführen von föderierten Abfragen verwenden von BigQuery zu Spanner. Mit Data Boost föderierte Abfragen werden nahezu ohne Auswirkungen auf vorhandene Arbeitslasten im Bereitgestellte Spanner-Instanz.

Mit der Spanner-Föderation kann BigQuery Daten abfragen in Echtzeit in Spanner befinden, ohne Daten kopieren oder verschieben zu müssen.

Weitere Informationen zu föderierten Spanner-Abfragen finden Sie unter Spanner föderierte Abfragen.

Weitere Informationen zu Data Boost finden Sie unter Data Boost. .

Hinweise

Führen Sie die folgenden Aufgaben aus, bevor Sie versuchen, föderierte Abfragen mit Daten-Boost.

BigQuery Connection API aktivieren

Mit der BigQuery Connection API können Sie BigQuery-Verbindungen zu externen Datenquellen.

  • BigQuery connection API aktivieren.

    Aktivieren Sie die API

Weitere Informationen finden Sie unter BigQuery-Verbindung API hinzu.

Hauptkonten IAM-Berechtigungen für Data Boost gewähren

Hauptkonten benötigen die spanner.instances.get und spanner.databases.useDataBoost Auszuführende Berechtigungen der Identitäts- und Zugriffsverwaltung (Identity and Access Management, IAM) Abfragen und Exporte mit Data Boost ausführen.

Es empfiehlt sich, eine benutzerdefinierte IAM-Rolle basierend auf Spanner Database Reader (roles/spanner.databaseReader) und fügen Sie spanner.instances.get und spanner.databases.useDataBoost.

Weitere Informationen finden Sie unter Vordefinierte Rollen.

BigQuery-Verbindungen für Spanner mit Data Boost erstellen

Mit BigQuery-Verbindungen können Sie Daten abfragen, die außerhalb BigQuery Um eine Verbindung zwischen Mit BigQuery und Spanner erstellen Sie externe Daten, Sie können dann Abfragen ausführen, bei denen BigQuery-Daten mit Spanner Daten.

So erstellen Sie eine externe Datenverbindung zu Spanner, die Wählen Sie für Data Boost eine der folgenden Optionen aus:

Console

  1. Weitere Informationen finden Sie unter Spanner-Verbindungen erstellen. in der BigQuery-Dokumentation und folgen Sie der Console Anleitung.

  2. Wählen Sie im Bereich Externe Datenquelle sowohl die Option Daten lesen in parallel und Spanner Data Boost verwenden an.

bq

  1. Weitere Informationen finden Sie unter Spanner-Verbindungen erstellen. in der BigQuery-Dokumentation und folgen Sie der Anleitung unter bq. Anleitung.

  2. Legen Sie die folgenden Verbindungsattribute auf true fest:

  • useParallelism
  • useDataBoost

Im folgenden Beispiel wird die Methode bq mk verwendet. zum Erstellen einer neuen Verbindung namens my_connection mit den beiden Erforderliche Attribute für Data Boost:

bq mk --connection --connection_type='CLOUD_SPANNER' --location='us' \
--properties='{"database":"projects/my-project/instances/my-instance/databases/my-database", "useParallelism":true, "useDataBoost": true}' my_connection

Föderierte Abfrage ausführen

Um eine föderierte Abfrage mit Data Boost auszuführen, verwenden Sie eine BigQuery-Verbindung, die die Verwendung von angibt Daten-Boost. Weitere Informationen finden Sie unter Erstellen BigQuery-Verbindungen für Spanner mit Data Boost.

Sie können auf der Spanner-Seite der Google Cloud Console oder BigQuery.

Auf der Spanner-Seite der Console beginnen

  1. Rufen Sie in der Google Cloud Console die Seite Spanner-Instanzen auf.

    Zur Seite "VM-Instanzen"

    In der Konsole wird eine Liste Ihrer Spanner- Instanzen.

  2. Wählen Sie eine Spanner-Instanz und dann eine Datenbank aus.

  3. Klicken Sie auf der Seite Datenbankübersicht im Navigationsmenü auf Spanner Studio.

  4. Klicken Sie auf den Tab In BigQuery ansehen.

  5. Geben Sie im Dialogfeld In BigQuery ansehen eine Verbindungs-ID ein.

    Dadurch wird eine neue Verbindung erstellt. Wenn die ID bereits vorhanden ist, tritt ein Fehler auf.

  6. Füllen Sie den Rest des Dialogfelds aus und wählen Sie die Optionen Read data in parallel (Daten gleichzeitig lesen) aus. Kästchen für Spanner Data Boost verwenden

  7. Klicken Sie auf In BigQuery ansehen.

    BigQuery Studio wird geöffnet. Geben Sie Ihren eine föderierte Abfrage.

    Im folgenden Beispiel wird eine föderierte Abfrage an eine Spanner-Datenbank namens orders gesendet und die Ergebnisse mit einer BigQuery-Tabelle namens mydataset.customers verknüpft.

    SELECT c.customer_id, c.name, rq.first_order_date
    FROM mydataset.customers AS c
    LEFT OUTER JOIN EXTERNAL_QUERY(
      'my-project.us.example-db',
      '''SELECT customer_id, MIN(order_date) AS first_order_date
      FROM orders
      GROUP BY customer_id''') AS rq
      ON rq.customer_id = c.customer_id
    GROUP BY c.customer_id, c.name, rq.first_order_date;
    

Mit BigQuery beginnen

  • Geben Sie die folgende URL in den Browser ein:

    https://console.cloud.google.com/bigquery

    BigQuery wird im zuletzt aufgerufenen Projekt geöffnet und zeigt BigQuery Studio an. Führen Sie hier Ihre föderierte Abfrage aus.

Nächste Schritte