Databricks

Netzwerk-Datenverkehr verschlüsseln

Es empfiehlt sich, den Netzwerkverkehr zwischen der Looker-Anwendung und Ihrer Datenbank zu verschlüsseln. Sehen Sie sich eine der Optionen an, die auf der Dokumentationsseite Sicheren Datenbankzugriff aktivieren beschrieben werden.

Looker-Nutzer erstellen

Looker authentifiziert sich bei Databricks über persönliche Zugriffstokens. Folgen Sie der Databricks-Dokumentation, um ein persönliches Zugriffstoken für einen Databricks-Nutzer zur Verwendung in Looker zu erstellen.

Fügen Sie diesem Nutzer mit GRANT Berechtigungen hinzu.

Der Looker-Nutzer sollte mindestens SELECT und READ_METADATA haben.

GRANT SELECT ON DATABASE <YOUR_DATABASE> TO `<looker>@<your.databricks.com>`
GRANT READ_METADATA ON DATABASE <YOUR_DATABASE> TO `<looker>@<your.databricks.com>`

Serverinformationen

Folgen Sie der Databricks-Dokumentation, um den HTTP-Pfad für Ihren Databricks-Cluster zu ermitteln. Dieser Vorgang wird auf dieser Seite als <YOUR_HTTP_PATH> bezeichnet.

Persistente abgeleitete Tabellen einrichten

Erstellen Sie eine separate Datenbank, um nichtflüchtige abgeleitete Tabellen zu verwenden.

CREATE DATABASE <YOUR_SCRATCH_DATABASE>

Außerdem müssen zusätzliche schreibbasierte Nutzerberechtigungen gewährt werden.

GRANT SELECT CREATE MODIFY ON DATABASE <YOUR_SCRATCH_DATABASE> TO `<looker>@<your.databricks.com>`
GRANT READ_METADATA ON DATABASE <YOUR_SCRATCH_DATABASE> TO `<looker>@<your.databricks.com>`

Looker-Verbindung zu Ihrer Datenbank erstellen

Wählen Sie im Bereich Admin von Looker die Option Verbindungen aus und klicken Sie dann auf Verbindung hinzufügen.

Geben Sie die Verbindungsdetails ein. Die meisten Einstellungen sind den meisten Datenbankdialekten gemeinsam. Weitere Informationen finden Sie auf der Dokumentationsseite Looker mit Ihrer Datenbank verbinden. Einige der Einstellungen werden im Folgenden beschrieben:

  • Name: Geben Sie den Namen der Verbindung an. So verweisen Sie in LookML-Projekten auf die Verbindung.
  • Dialekt: Geben Sie den Dialekt Databricks an.
  • Host: Geben Sie den Hostnamen an.
  • Port: Geben Sie den Datenbankport an. Der Standardwert ist 443.
  • Datenbank: Geben Sie den Datenbanknamen an. Der Standardwert ist default.
  • Nutzername: Geben Sie den Wert token ein. Geben Sie in dieses Feld nicht die E-Mail-Adresse des Databricks-Nutzers ein.
  • Passwort: Geben Sie das persönliche Zugriffstoken ein, das Sie zuvor erstellt haben.
  • PDTs aktivieren: Verwenden Sie diese Ein/Aus-Schaltfläche, um nichtflüchtige abgeleitete Tabellen zu aktivieren. Wenn PATs aktiviert sind, werden im Fenster Verbindung zusätzliche PAT-Einstellungen und der Abschnitt PDT-Überschreibungen angezeigt.
  • Temp Database: Geben Sie die Datenbank ein, die Sie zum Speichern von PATs verwenden möchten.
  • Maximale Anzahl von PAT-Builder-Verbindungen: Geben Sie die Anzahl der möglichen gleichzeitigen PAT-Builds für diese Verbindung an. Wenn Sie diesen Wert zu hoch festlegen, kann sich das negativ auf die Abfragezeiten auswirken. Weitere Informationen finden Sie auf der Dokumentationsseite Looker mit Ihrer Datenbank verbinden.
  • Zusätzliche JDBC-Parameter: Fügen Sie zusätzliche Spark-JDBC-Parameter hinzu.

  • Wartungszeitplan für Datengruppe und PAT: Ein cron-Ausdruck, der angibt, wann Looker Datengruppen und persistente abgeleitete Tabellen prüfen soll. Weitere Informationen zu dieser Einstellung finden Sie in der Dokumentation zum Wartungsplan für Datengruppen und PATs.

  • SSL: Aktivieren Sie diese Option, um SSL-Verbindungen zu verwenden.

  • SSL überprüfen: Wählen Sie diese Option aus, um eine strenge Überprüfung des SSL-Zertifikats zu erzwingen.

  • Maximale Anzahl von Verbindungen pro Knoten: Sie können diese Einstellung anfangs auf dem Standardwert belassen. Weitere Informationen zu dieser Einstellung finden Sie auf der Dokumentationsseite Looker mit Ihrer Datenbank verbinden im Abschnitt Max. Verbindungen pro Knoten.

  • Zeitüberschreitung beim Verbindungspool: Sie können diese Einstellung anfangs auf dem Standardwert belassen. Weitere Informationen zu dieser Einstellung finden Sie auf der Dokumentationsseite Looker mit Ihrer Datenbank verbinden im Abschnitt Zeitüberschreitung beim Verbindungspool.

  • SQL Runner Precache: Deaktivieren Sie diese Option, damit SQL Runner Tabelleninformationen nicht vorab lädt, sondern nur dann, wenn eine Tabelle ausgewählt ist. Weitere Informationen zu dieser Einstellung finden Sie auf der Dokumentationsseite Looker mit Ihrer Datenbank verbinden im Abschnitt SQL Runner Precache.

  • Datenbank-Zeitzone: Geben Sie die in der Datenbank verwendete Zeitzone an. Lassen Sie dieses Feld leer, wenn Sie die Zeitzone nicht umwandeln möchten. Weitere Informationen finden Sie auf der Dokumentationsseite Zeitzoneneinstellungen verwenden.

Klicken Sie auf Test, um die Verbindung zu testen und zu prüfen, ob sie richtig konfiguriert ist. Wenn Can Connect (Verbindung möglich) angezeigt wird, drücken Sie Connect (Verbinden). Daraufhin werden die übrigen Verbindungstests ausgeführt, um zu überprüfen, ob das Dienstkonto ordnungsgemäß und mit den richtigen Rollen eingerichtet wurde. Informationen zur Fehlerbehebung finden Sie auf der Dokumentationsseite Datenbankkonnektivität testen.

Looker-Funktionalität mit Databricks Unity-Katalog

Bei Looker-Verbindungen zu einer Databricks-Datenbank mit aktiviertem Unity-Katalog greifen die meisten Looker-Funktionen nur auf Schemas aus dem Standardkatalog zu, wie in den folgenden Szenarien:

  • Beim Generieren eines neuen LookML-Projekts aus einem Datenbankschema erstellt Looker die Projektdateien basierend auf den Tabellen im Unity Catalog-Standardkatalog.
  • Wenn Sie bei vorhandenen Projekten die Looker-IDE zum Erstellen einer Ansicht aus einer Tabelle verwenden, kann Looker Ansichtsdateien nur aus den Tabellen im Unity-Katalog-Standardkatalog erstellen.
  • Wenn Sie SQL Runner verwenden, können Sie nur Schemas aus dem Unity Catalog-Standardkatalog auswählen.

Unterstützte Funktionen

Damit Looker einige Funktionen unterstützen kann, müssen diese auch von Ihrem Datenbankdialekt unterstützt werden.

Databricks unterstützt ab Looker 24.6 die folgenden Funktionen:

Funktion Unterstützt?
Supportstufe
Unterstützt
Looker (Google Cloud Core)
Ja
Symmetrische Summen
Ja
Abgeleitete Tabellen
Ja
Abgeleitete SQL-Tabellen
Ja
Nichtflüchtige native abgeleitete Tabellen
Ja
Stabile Ansichten
Ja
Abfrage beenden
Ja
SQL-basierte Pivots
Ja
Zeitzonen
Ja
SSL
Ja
Zwischensummen
Ja
Zusätzliche JDBC-Parameter
Ja
Groß-/Kleinschreibung beachten
Ja
Standorttyp
Ja
Listentyp
Ja
Perzentil
Ja
Unterschiedliche Perzentile
Nein
SQL-Runner-Show-Prozesse
Nein
SQL-Runner – Tabelle beschreiben
Ja
SQL Runner – Indexe anzeigen
Nein
SQL Runner Select 10
Ja
Anzahl der SQL-Runner
Ja
SQL erklären
Ja
OAuth-Anmeldedaten
Nein
Kontextkommentare
Ja
Verbindungs-Pooling
Nein
HLL-Skizzen
Nein
Aggregatfunktion
Ja
Inkrementelle PDTs
Ja
Millisekunden
Ja
Mikrosekunden
Ja
Materialisierte Ansicht
Nein
Ungefähre Anzahl unterschiedlich
Nein