BigQuery-Standardverbindung für Looker (Google Cloud-Kern)

Looker (Google Cloud Core) muss mit einer Datenbank verbunden sein, damit eine explorative Datenanalyse möglich ist. Mit der BigQuery-Schnellstartverbindung können Sie eine Standardverbindung zu einer BigQuery-Standard-SQL-Datenbank herstellen.

Die BigQuery-Schnellstartkachel auf einer Startseite.

Hinweise

Für die Konfiguration einer BigQuery-Schnellstartverbindung sind die folgenden Berechtigungen erforderlich.

Looker-Berechtigungen

Sie können die Seite BigQuery-Schnellstartverbindung auf der Startseite Ihrer Looker-Instanz (Google Cloud Core) aufrufen und bearbeiten, wenn Sie eine der folgenden Looker-Berechtigungen haben:

IAM-Berechtigungen

Looker (Google Cloud Core)-Instanzen können Standardanmeldedaten für Anwendungen (Application Default Credentials, ADC) zur Authentifizierung verwenden, wenn Sie eine Verbindung zu BigQuery einrichten. Wenn Sie ADC verwenden, wird die Verbindung mithilfe der Anmeldedaten des Looker-Dienstkontos (Google Cloud Core) bei der Datenbank authentifiziert. Das Dienstkonto muss die folgenden IAM-Berechtigungen für den Zugriff auf das BigQuery-Dataset haben:

  • Für das Projekt, das das BigQuery-Dataset enthält, muss das Looker-Dienstkonto die folgenden IAM-Rollen haben:

  • Für das Abrechnungsprojekt muss das Looker-Dienstkonto die folgenden IAM-Rollen haben:

Wenn das Looker-Dienstkonto (Google Cloud Core) nicht bereits die erforderlichen IAM-Rollen hat, verwenden Sie die E-Mail-Adresse des Dienstkontos, wenn Sie Rollen in diesem Projekt gewähren. Wenn Sie die E-Mail-Adresse des Dienstkontos ermitteln möchten, rufen Sie in der Google Cloud Console die Seite IAM auf und klicken Sie auf das Kästchen Von Google bereitgestellte Rollenzuweisungen einschließen. Die E-Mail hat das Format service-<project number>@gcp-sa-looker.iam.gserviceaccount.com. Verwenden Sie diese E-Mail-Adresse, um dem Dienstkonto die entsprechenden Rollen zuzuweisen.

BigQuery-Verbindung für die Kurzanleitung konfigurieren

Nutzer mit den entsprechenden Berechtigungen können die BigQuery-Schnellstartverbindung entweder auf der Startseite oder auf der Seite Verbindungen im Bereich Verwaltung aufrufen und bearbeiten. Auf der Seite Verbindungen wird die BigQuery-Schnellstartverbindung unter dem Namen Standard-BigQuery-Verbindung angezeigt. Bei einer neuen Instanz sind die Felder Speicherprojekt-ID und Abrechnungsprojekt-ID standardmäßig mit Kein ausgefüllt.

Klicken Sie auf der Startseite auf die Schaltfläche Verbindung prüfen, um die Verbindung zu verwalten. Sie können die Kachel Startseite schließen, indem Sie auf das x klicken oder die Option BigQuery-Schnellstart in der Seitenleiste Entdecken deaktivieren.

Die BigQuery-Kurzanleitung zur Verbindung enthält die folgenden Abschnitte:

ID des Abrechnungsprojekts

Die Projekt-ID dient als eindeutige Kennzeichnung für das Google Cloud Abrechnungsprojekt. Das Abrechnungsprojekt ist das Google Cloud Projekt, das für die BigQuery-Nutzung in Rechnung gestellt wird. Sie können aber auch Datasets in einem anderen Google Cloud Projekt abfragen, wenn Ihre LookML-Entwickler im Parameter sql_table_name Ihrer LookML-Ansichten, Explores oder Joins voll qualifizierte Tabellennamen angeben. Dies ist ein erforderliches Feld.

Über OAuth bei einer BigQuery-Datenbank authentifizieren: Für BigQuery-Verbindungen kann Looker (Google Cloud Core) automatisch die Anmeldedaten für OAuth-Anwendungen verwenden, die Ihr Looker (Google Cloud Core)-Administrator beim Erstellen der Instanz verwendet hat. Weitere Informationen finden Sie auf der Seite OAuth-Anmeldedaten für die Autorisierung für eine Looker (Google Cloud Core)-Instanz erstellen.

Maximieren Sie den Bereich Statusdetails, um die Einstellungen für Ihre Verbindung zu testen.

Primäres Dataset

Die Seite Primäres Dataset enthält die folgenden Einstellungen.

Speicherprojekt-ID

Geben Sie im Feld Storage Project ID (Speicherprojekt-ID) die Projekt-ID für das Projekt ein, das das BigQuery-Dataset enthält, mit dem Sie eine Verbindung herstellen möchten. Das gilt auch, wenn es sich um dasselbe Projekt handelt, das die Looker-Instanz (Google Cloud Core) enthält. Dies ist ein erforderliches Feld.

Primäres Dataset

Im primären Dataset sucht BigQuery nach Tabellen, wenn ihr Speicherort im SQL-Abfragetext nicht angegeben ist. Looker-Abfragen (Google Cloud Core) können auf Tabellen in beliebigen Projekten oder Datasets verweisen, sofern die Abfragen Tabellennamen mit vollständigem Umfang im Format project_id.dataset_name.table_name verwenden. Das Looker-Dienstkonto (Google Cloud-Kern) benötigt außerdem die entsprechenden IAM-Berechtigungen, um auf die Tabellen an diesem Speicherort zuzugreifen. Dies ist ein erforderliches Feld.

Weitere Informationen zu Datasets finden Sie auf der Dokumentationsseite Looker mit BigQuery verbinden.

Maximieren Sie den Bereich Statusdetails, um die Einstellungen für Ihre Verbindung zu testen.

Optionale Einstellungen

Der Bereich Optionale Einstellungen enthält die folgenden Optionen:

  • Maximale Anzahl von Verbindungen pro Knoten: Die maximale Anzahl von Verbindungen zur Datenbank, die gleichzeitig zulässig sind. Hinweis: Diese Einstellung gilt für jeden Knoten in der Looker (Google Cloud Core)-Bereitstellung. Der Wert muss zwischen 5 und 100 liegen. Der Standardwert kann zunächst unverändert bleiben. Weitere Informationen zu dieser Einstellung finden Sie auf der Seite Looker mit Ihrer Datenbank verbinden im Abschnitt Maximale Verbindungen pro Knoten.

  • Zeitlimit für Verbindungspool: Die Anzahl der Sekunden, die eine Abfrage wartet, bevor es bei einem vollen Verbindungspool zu einer Zeitüberschreitung kommt. Der Standardwert kann zunächst unverändert bleiben. Weitere Informationen zu dieser Einstellung finden Sie auf der Seite Looker mit Ihrer Datenbank verbinden im Abschnitt Zeitüberschreitung für Verbindungspool.

  • Zusätzliche JDBC-Parameter: Fügen Sie alle zusätzlichen JDBC-Parameter wie BigQuery-Bezeichnungen hinzu (weitere Informationen dazu finden Sie auf dieser Seite im Abschnitt Joblabels und Kontextkommentare für BigQuery-Verbindungen).

  • Wartungszeitplan: Cron-Ausdruck, der die maximale Häufigkeit von Datengruppen-Triggerprüfungen und PAT-Wartungen angibt. Weitere Informationen zu dieser Einstellung finden Sie in der Dokumentation Wartungszeitplan für Datengruppe und PAT.

  • SSL: Wählen Sie aus, ob Ihre Daten bei der Übergabe zwischen Looker (Google Cloud-Kern) und Ihrer Datenbank mit SSL-Verschlüsselung geschützt werden sollen. SSL ist nur eine Option, mit der Sie Ihre Daten schützen können. Weitere sichere Optionen werden auf der Dokumentationsseite Sicheren Datenbankzugriff ermöglichen beschrieben.

  • SSL prüfen: Legen Sie fest, ob die Verifizierung des von der Verbindung verwendeten SSL-Zertifikats angefordert werden soll. Weitere Informationen zu dieser Einstellung finden Sie auf der Seite Looker mit Ihrer Datenbank verbinden im Abschnitt SSL prüfen.

  • Tabellen und Spalten vorab im Cache speichern: In SQL-Runner werden alle Tabelleninformationen unmittelbar nach der Auswahl einer Verbindung und eines Schemas vorab geladen. Somit kann SQL-Runner Tabellenspalten schnell anzeigen, nachdem Sie auf einen Tabellennamen geklickt haben. Für Verbindungen und Schemata mit vielen Tabellen oder sehr großen Tabellen soll SQL-Runner jedoch möglicherweise nicht alle Informationen vorab laden.

  • Schema abrufen und im Cache speichern: Für einige Funktionen zum Schreiben von SQL-Code, z. B. die Aggregationserkennung, verwendet Looker (Google Cloud Core) das Informationsschema Ihrer Datenbank, um das Schreiben von SQL-Code zu optimieren. Weitere Informationen zu dieser Einstellung finden Sie auf der Seite Looker mit Ihrer Datenbank verbinden im Abschnitt Informationsschema für SQL-Schreibvorgänge abrufen.

  • PDTs aktivieren: Aktivieren Sie die Option PDTs aktivieren, um persistente abgeleitete Tabellen zu aktivieren. Wenn PDTs aktiviert sind, werden im Fenster Optionale Einstellungen zusätzliche PDT-Felder und der Bereich PDT-Überschreibungen angezeigt.

  • Temporäre Datenbank: Geben Sie das Dataset in BigQuery ein, in dem Looker (Google Cloud Core) persistente abgeleitete Tabellen erstellt. Sie sollten diesen Datensatz im Voraus mit den entsprechenden Schreibberechtigungen konfigurieren. Dieses Feld ist erforderlich, um PDTs zu verwenden.

  • Maximale Anzahl von PAT-Builder-Verbindungen: Die Standardeinstellung für die Maximale Anzahl von PAT-Builder-Verbindungen ist 1. Sie kann jedoch auf bis zu 10 erhöht werden. Der Wert darf jedoch nicht höher als der Wert sein, der unter Maximale Verbindungen pro Knoten festgelegt wurde. Weitere Informationen zu dieser Einstellung finden Sie auf der Seite Looker mit Ihrer Datenbank verbinden im Abschnitt Maximale Anzahl von PAT-Builder-Verbindungen. Wählen Sie diesen Wert mit Bedacht. Ist der Wert zu hoch, überlastet dies möglicherweise Ihre Datenbank. Wenn der Wert niedrig ist, können PDTs oder aggregierte Tabellen mit langer Ausführungszeit die Erstellung anderer persistenter Tabellen verzögern oder andere Abfragen für die Verbindung verlangsamen.

  • Fehlgeschlagene PDT-Builds wiederholen: Mit der Option Fehlgeschlagene PDT-Builds wiederholen wird konfiguriert, wie der Looker-Regenerator (Google Cloud Core) versucht, triggerbasiert gespeicherte Tabellen neu zu erstellen, die im vorherigen Regenerator-Zyklus fehlgeschlagen sind. Weitere Informationen zu dieser Einstellung finden Sie auf der Dokumentationsseite Looker mit Ihrer Datenbank verbinden im Abschnitt Fehlgeschlagene PAT-Builds wiederholen.

  • PDT API Control: Mit der Ein/Aus-Schaltfläche PDT API Control wird festgelegt, ob die API-Aufrufe start_pdt_build, check_pdt_build und stop_pdt_build für diese Verbindung verwendet werden können. Wenn die Ein/Aus-Schaltfläche PDT API Control deaktiviert ist, schlagen diese API-Aufrufe fehl, wenn sie auf PDTs für diese Verbindung verweisen.

  • PDT-Überschreibungen: Wenn Ihre Datenbank nichtflüchtige abgeleitete Tabellen unterstützt und Sie in den Verbindungseinstellungen die Option PDTs aktivieren aktiviert haben, wird in Looker (Google Cloud Core) der Bereich PDT-Überschreibungen angezeigt. Im Bereich PDT-Überschreibungen können Sie eigene JDBC-Parameter eingeben (Host, Port, Datenbank, Nutzername, Passwort, Schema, zusätzliche Parameter und After-Connect-Anweisungen), die für PDT-Prozesse spezifisch sind. Weitere Informationen zu dieser Einstellung finden Sie auf der Dokumentationsseite Looker mit Ihrer Datenbank verbinden im Abschnitt PDT-Überschreibungen.

  • Zeitzone der Datenbank: Die Zeitzone, in der Ihre Datenbank zeitbasierte Informationen speichert. Looker (Google Cloud-Kern) muss diese kennen, damit Zeitwerte für Nutzer konvertiert werden können. Dies erleichtert das Verständnis und die Nutzung zeitbasierter Daten. Weitere Informationen finden Sie auf der Dokumentationsseite Zeitzoneneinstellungen verwenden.

  • Zeitzone der Abfrage: Die Option Zeitzone der Abfrage ist nur sichtbar, wenn Sie Nutzerspezifische Zeitzonen deaktiviert haben. Weitere Informationen finden Sie auf der Dokumentationsseite Zeitzoneneinstellungen verwenden.

Maximieren Sie den Bereich Statusdetails, um die Einstellungen für Ihre Verbindung zu testen.

Überprüfen

Prüfen und ändern Sie im Abschnitt Überprüfen die Verbindungsdetails, die Sie in den vorherigen Abschnitten eingegeben haben.

Maximieren Sie den Bereich Statusdetails, um die Einstellungen für Ihre Verbindung zu testen. Klicken Sie neben den einzelnen Bereichen auf das Bearbeitungssymbol, um die Einstellungen zu ändern.

Verbindung speichern und testen

Klicken Sie auf Speichern, um alle Änderungen an der BigQuery-Kurzanleitungsverbindung zu speichern.

Sie können Ihre Verbindungseinstellungen an mehreren Stellen in der Looker (Google Cloud Core)-Benutzeroberfläche testen:

  • Maximieren Sie den Bereich Statusdetails unten auf einer der Seiten der Quickstart-Verbindung und klicken Sie auf Verbindung testen.
  • Maximieren Sie auf der Seite Startseite den Bereich Statusdetails unter der Kachel „Schnellstartverbindung“ und klicken Sie auf Verbindung testen.
  • Wählen Sie auf der Seite Verbindungen auf der Seite „Verwaltung“ neben dem Eintrag der Verbindung die Schaltfläche Testen aus, wie auf der Dokumentationsseite Verbindungen beschrieben.

Nachdem Sie die Verbindungseinstellungen eingegeben haben, klicken Sie auf Testen, um die Richtigkeit der Daten zu verifizieren und sicherzustellen, dass die Datenbank eine Verbindung herstellen kann.

Sollte Ihre Verbindung einen oder mehrere Tests nicht bestehen, haben Sie folgende Möglichkeiten zur Fehlerbehebung:

Nächste Schritte