BigQuery-Standardverbindung für Looker (Google Cloud-Kern)

Looker (Google Cloud Core) muss mit einer Datenbank verbunden sein, damit eine explorative Datenanalyse möglich ist. Mit der BigQuery-Schnellstartverbindung können Sie eine Standard-BigQuery-Verbindung erstellen, für die die Standardanmeldedaten für Anwendungen verwendet werden können.

Die BigQuery-Kurzanleitung auf einer Startseite

Hinweise

Für die Konfiguration einer BigQuery-Schnellstartverbindung sind die folgenden Berechtigungen erforderlich.

Berechtigungen für Looker (Google Cloud Core)

Sie können die Seite BigQuery-Schnellstartverbindung auf der Startseite Ihrer Looker-Instanz (Google Cloud Core) aufrufen und bearbeiten, wenn Sie eine der folgenden Berechtigungen haben:

BigQuery-Berechtigungen

Looker (Google Cloud Core)-Instanzen können Standardanmeldedaten für Anwendungen verwenden, um sich zu authentifizieren, wenn Sie eine Verbindung zu einer BigQuery Standard-SQL-Datenbank herstellen. Wenn Sie ADC verwenden, wird die Verbindung mithilfe der Anmeldedaten des Dienstkontos des Looker-Projekts (Google Cloud Core) bei der Datenbank authentifiziert.

Wenn dem Looker (Google Cloud Core)-Dienstkonto noch keine IAM-Rollen im Projekt zugewiesen sind, das das BigQuery-Dataset enthält, müssen Sie IAM-Richtlinien in der Google Cloud -Konsole ändern können, um dem Dienst-Agent neue IAM-Rollen zuzuweisen. Gehen Sie dazu so vor:

  1. Melden Sie sich in der Google Cloud -Console an und rufen Sie das Projekt auf, in dem Sie neue Rollen gewähren möchten.
  2. Kopieren Sie die Hauptkonto-ID und fügen Sie sie als Hauptkonto in IAM hinzu.
  3. Weisen Sie dem hinzugefügten Hauptkonto die beiden folgenden Rollen zu:
    • Service Usage Consumer
    • BigQuery Jobs User

Wenn in Ihrer Looker-Instanz (Google Cloud Core) persistente abgeleitete Tabellen mit einem BigQuery-Dataset verwendet werden, müssen Sie dem Looker-Dienstkonto (Google Cloud Core) auch die IAM-Rolle „BigQuery-Datenbearbeiter“ zuweisen.

BigQuery-Verbindung für die Kurzanleitung konfigurieren

Die BigQuery-Schnellstartverbindung enthält die folgenden Abschnitte.

Die Verbindung anzeigen

Nutzer mit den entsprechenden Berechtigungen können die BigQuery-Schnellstartverbindung entweder auf der Seite Startseite oder auf der Seite Verbindungen im Admin-Bereich aufrufen und bearbeiten. Auf der Seite Verbindungen wird die BigQuery-Schnellstartverbindung unter dem Namen Standard-BigQuery-Verbindung angezeigt. Bei einer neuen Instanz sind die Felder Speicherprojekt-ID und Abrechnungsprojekt-ID standardmäßig mit Kein ausgefüllt.

Klicken Sie auf der Startseite auf die Schaltfläche Verbindung prüfen, um die Verbindung zu verwalten. Sie können die Kachel Startseite schließen, indem Sie auf das x klicken oder die Option BigQuery-Schnellstart in der Discover-Seitenleiste deaktivieren.

Die BigQuery-Schnellstartverbindung enthält die folgenden Abschnitte.

ID des Abrechnungsprojekts

Die Projekt-ID dient als eindeutige Kennung für das Abrechnungsprojekt für Google Cloud . Das Abrechnungsprojekt ist das Google Cloud -Projekt, für das in Rechnung gestellt wird. Sie können aber auch Datensätze in einem anderen Google Cloud -Projekt abfragen, wenn Ihre LookML-Entwickler im Parameter „sql_table_name“ Ihrer LookML-Ansichten, Explores oder Joins vollständige Tabellennamen angeben. Dies ist ein Pflichtfeld.

Über OAuth bei einer BigQuery-Datenbank authentifizieren: Für BigQuery-Verbindungen kann Looker (Google Cloud Core) automatisch die Anmeldedaten für OAuth-Anwendungen verwenden, die Ihr Looker (Google Cloud Core)-Administrator beim Erstellen der Instanz verwendet hat. Weitere Informationen finden Sie auf der Seite OAuth-Anmeldedaten für die Autorisierung für eine Looker (Google Cloud Core)-Instanz erstellen.

Maximieren Sie den Bereich Statusdetails, um die Einstellungen für Ihre Verbindung zu testen.

Primäres Dataset

Die Seite Primäres Dataset enthält die folgenden Einstellungen.

Speicherprojekt-ID

Wenn Sie ein anderes Projekt als das BigQuery-Projekt verwenden, in dem sich Looker (Google Cloud Core) befindet, geben Sie die ID des Speicherprojekts ein. Dies ist ein Pflichtfeld.

So finden Sie Ihre Speicherprojekt-ID:

  1. Öffnen Sie die Google Cloud -Konsole.
  2. Wählen Sie in der Projektliste Alle aus. Die Namen und IDs aller Projekte, deren Mitglied Sie sind, werden angezeigt.
  3. Kopieren Sie die Speicherprojekt-ID des Projekts, das die Daten enthält, die Sie mit Looker (Google Cloud Core) verbinden möchten.

Primäres Dataset

Im primären Dataset sucht BigQuery nach Tabellen, wenn ihr Speicherort im SQL-Abfragetext nicht angegeben ist. Looker-Abfragen (Google Cloud Core) können auf Tabellen in beliebigen Projekten oder Datasets verweisen, sofern die Abfragen Tabellennamen mit vollständigem Umfang im Format project_id.dataset_name.table_name verwenden. Der Looker-Dienst-Agent (Google Cloud Core) benötigt außerdem die entsprechenden IAM-Berechtigungen, um auf die Tabellen an diesem Speicherort zuzugreifen. Dies ist ein Pflichtfeld.

Weitere Informationen zu Datasets finden Sie auf der Dokumentationsseite Looker mit BigQuery verbinden.

Maximieren Sie den Bereich Statusdetails, um die Einstellungen für Ihre Verbindung zu testen.

Optionale Einstellungen

Der Bereich Optionale Einstellungen enthält die folgenden Optionen:

  • Maximale Anzahl von Verbindungen pro Knoten: Die maximale Anzahl von Verbindungen zur Datenbank, die gleichzeitig zulässig sind. Hinweis: Diese Einstellung gilt für jeden Knoten in der Looker (Google Cloud Core)-Bereitstellung. Der Wert muss zwischen 5 und 100 liegen. Der Standardwert kann zunächst unverändert bleiben. Weitere Informationen zu dieser Einstellung finden Sie auf der Seite Looker mit Ihrer Datenbank verbinden im Abschnitt Maximale Verbindungen pro Knoten.

  • Zeitlimit für Verbindungspool: Die Anzahl der Sekunden, die eine Abfrage wartet, bevor es bei einem vollen Verbindungspool zu einer Zeitüberschreitung kommt. Der Standardwert kann zunächst unverändert bleiben. Weitere Informationen zu dieser Einstellung finden Sie auf der Seite Looker mit Ihrer Datenbank verbinden im Abschnitt Zeitüberschreitung für Verbindungspool.

  • Zusätzliche JDBC-Parameter: Fügen Sie alle zusätzlichen JDBC-Parameter wie BigQuery-Bezeichnungen hinzu (weitere Informationen dazu finden Sie auf dieser Seite im Abschnitt Joblabels und Kontextkommentare für BigQuery-Verbindungen).

  • Wartungszeitplan: Cron-Ausdruck, der die maximale Häufigkeit von Datengruppen-Triggerprüfungen und PAT-Wartungen angibt. Weitere Informationen zu dieser Einstellung finden Sie in der Dokumentation Wartungszeitplan für Datengruppe und PAT.

  • SSL: Wählen Sie aus, ob Ihre Daten bei der Übergabe zwischen Looker (Google Cloud-Kern) und Ihrer Datenbank mit SSL-Verschlüsselung geschützt werden sollen. SSL ist nur eine Option, mit der Sie Ihre Daten schützen können. Weitere sichere Optionen werden auf der Dokumentationsseite Sicheren Datenbankzugriff ermöglichen beschrieben.

  • SSL prüfen: Legen Sie fest, ob die Verifizierung des von der Verbindung verwendeten SSL-Zertifikats angefordert werden soll. Weitere Informationen zu dieser Einstellung finden Sie auf der Seite Looker mit Ihrer Datenbank verbinden im Abschnitt SSL prüfen.

  • Tabellen und Spalten vorab im Cache speichern: In SQL-Runner werden alle Tabelleninformationen unmittelbar nach der Auswahl einer Verbindung und eines Schemas vorab geladen. So kann SQL Runner Tabellenspalten schnell anzeigen, nachdem Sie auf einen Tabellennamen geklickt haben. Für Verbindungen und Schemata mit vielen Tabellen oder sehr großen Tabellen soll SQL-Runner jedoch möglicherweise nicht alle Informationen vorab laden.

  • Schema abrufen und im Cache speichern: Für einige Funktionen zum Schreiben von SQL-Code, z. B. die Aggregationserkennung, verwendet Looker (Google Cloud Core) das Informationsschema Ihrer Datenbank, um das Schreiben von SQL-Code zu optimieren. Weitere Informationen zu dieser Einstellung finden Sie auf der Seite Looker mit Ihrer Datenbank verbinden im Abschnitt Informationsschema für SQL-Schreibvorgänge abrufen.

  • PDTs aktivieren: Aktivieren Sie die Option PDTs aktivieren, um persistente abgeleitete Tabellen zu aktivieren. Wenn PDTs aktiviert sind, werden im Fenster Optionale Einstellungen zusätzliche PDT-Felder und der Bereich PDT-Überschreibungen angezeigt.

  • Temporäre Datenbank: Geben Sie das Dataset in BigQuery ein, in dem Looker (Google Cloud Core) persistente abgeleitete Tabellen erstellt. Sie sollten diesen Datensatz im Voraus mit den entsprechenden Schreibberechtigungen konfigurieren. Dieses Feld ist erforderlich, um PDTs zu verwenden.

  • Maximale Anzahl von PAT-Builder-Verbindungen: Die Standardeinstellung für die Maximale Anzahl von PAT-Builder-Verbindungen ist 1. Sie kann jedoch auf bis zu 10 erhöht werden. Der Wert darf jedoch nicht höher als der unter Maximale Verbindungen pro Knoten festgelegte Wert sein. Weitere Informationen zu dieser Einstellung finden Sie auf der Seite Looker mit Ihrer Datenbank verbinden im Abschnitt Maximale Anzahl von PAT-Builder-Verbindungen. Wählen Sie diesen Wert mit Bedacht. Ist der Wert zu hoch, überlastet dies möglicherweise Ihre Datenbank. Wenn der Wert niedrig ist, können PDTs oder aggregierte Tabellen mit langer Ausführungszeit die Erstellung anderer persistenter Tabellen verzögern oder andere Abfragen für die Verbindung verlangsamen.

  • Fehlgeschlagene PDT-Builds wiederholen: Mit der Option Fehlgeschlagene PDT-Builds wiederholen wird konfiguriert, wie der Looker-Regenerator (Google Cloud Core) versucht, triggerbasiert gespeicherte Tabellen neu zu erstellen, die im vorherigen Regenerator-Zyklus fehlgeschlagen sind. Weitere Informationen zu dieser Einstellung finden Sie auf der Dokumentationsseite Looker mit Ihrer Datenbank verbinden im Abschnitt Fehlgeschlagene PAT-Builds wiederholen.

  • PDT API-Steuerung: Mit der PDT API-Steuerung wird festgelegt, ob die API-Aufrufe start_pdt_build, check_pdt_build und stop_pdt_build für diese Verbindung verwendet werden können. Wenn die Ein/Aus-Schaltfläche PDT API Control deaktiviert ist, schlagen diese API-Aufrufe fehl, wenn sie auf PDTs für diese Verbindung verweisen.

  • PDT-Überschreibungen: Wenn Ihre Datenbank nichtflüchtige abgeleitete Tabellen unterstützt und Sie in den Verbindungseinstellungen die Option PDTs aktivieren aktiviert haben, wird in Looker (Google Cloud Core) der Bereich PDT-Überschreibungen angezeigt. Im Bereich PDT-Überschreibungen können Sie eigene JDBC-Parameter eingeben (Host, Port, Datenbank, Nutzername, Passwort, Schema, zusätzliche Parameter und After-Connect-Anweisungen), die für PDT-Prozesse spezifisch sind. Weitere Informationen zu dieser Einstellung finden Sie auf der Dokumentationsseite Looker mit Ihrer Datenbank verbinden im Abschnitt PDT-Überschreibungen.

  • Zeitzone der Datenbank: Die Zeitzone, in der Ihre Datenbank zeitbasierte Informationen speichert. Looker (Google Cloud-Kern) muss diese kennen, damit Zeitwerte für Nutzer konvertiert werden können. Dies erleichtert das Verständnis und die Nutzung zeitbasierter Daten. Weitere Informationen finden Sie auf der Dokumentationsseite Zeitzoneneinstellungen verwenden.

  • Zeitzone der Abfrage: Die Option Zeitzone der Abfrage ist nur sichtbar, wenn Sie Nutzerspezifische Zeitzonen deaktiviert haben. Weitere Informationen finden Sie auf der Dokumentationsseite Zeitzoneneinstellungen verwenden.

Maximieren Sie den Bereich Statusdetails, um die Einstellungen für Ihre Verbindung zu testen.

Überprüfen

Überprüfen und ändern Sie die Verbindungsdetails, die Sie in den vorherigen Abschnitten eingegeben haben, im Bereich Überprüfen.

Maximieren Sie den Bereich Statusdetails, um die Einstellungen für Ihre Verbindung zu testen. Klicken Sie neben den einzelnen Bereichen auf das Bearbeitungssymbol, um die Einstellungen für den jeweiligen Bereich zu ändern.

Verbindung speichern und testen

Klicken Sie auf die Schaltfläche Speichern, um alle Änderungen an der BigQuery-Schnellstartverbindung zu speichern.

Sie können Ihre Verbindungseinstellungen an mehreren Stellen in der Looker (Google Cloud Core)-Benutzeroberfläche testen:

  • Maximieren Sie den Bereich Statusdetails unten auf einer der Seiten der Quickstart-Verbindung und klicken Sie auf Verbindung testen.
  • Maximieren Sie auf der Seite Startseite den Bereich Statusdetails unten in der Kachel „Schnellstartverbindung“ und klicken Sie auf Verbindung testen.
  • Wählen Sie auf der Seite Verbindungen auf der Seite „Verwaltung“ neben dem Eintrag der Verbindung die Schaltfläche Testen aus, wie auf der Dokumentationsseite Verbindungen beschrieben.

Nachdem Sie die Verbindungseinstellungen eingegeben haben, klicken Sie auf Testen, um die Richtigkeit der Daten zu verifizieren und sicherzustellen, dass die Datenbank eine Verbindung herstellen kann.

Sollte Ihre Verbindung einen oder mehrere Tests nicht bestehen, haben Sie folgende Möglichkeiten zur Fehlerbehebung:

Nächste Schritte