Diese Seite wurde von der Cloud Translation API übersetzt.

Apache Spark

Auf dieser Seite finden Sie Informationen zum Herstellen einer Verbindung zwischen Looker und Apache Spark 3.

Looker stellt über eine JDBC-Verbindung zum Spark Thrift Server eine Verbindung zu Apache Spark 3+ her.

Netzwerk-Datenverkehr verschlüsseln

Es empfiehlt sich, den Netzwerkverkehr zwischen der Looker-Anwendung und Ihrer Datenbank zu verschlüsseln. Prüfen Sie eine der Optionen, die auf der Dokumentationsseite Sicheren Datenbankzugriff ermöglichen beschrieben werden.

Looker-Verbindung zu Ihrer Datenbank erstellen

Wählen Sie in Looker im Bereich Admin die Option Verbindungen aus und klicken Sie dann auf Verbindung hinzufügen.

Geben Sie die Verbindungsdetails ein. Der Großteil der Einstellungen gilt für die meisten Datenbankdialekte. Weitere Informationen finden Sie auf der Dokumentationsseite Looker mit Ihrer Datenbank verbinden. Einige der Einstellungen werden im Folgenden beschrieben:

Name: Der Name der Verbindung. So wird in LookML-Modellen auf die Verbindung verwiesen.
Dialect (Dialekt): Wählen Sie Apache Spark 3+ aus.
Host: Der Host des Thrift-Servers.
Port: Der Thrift-Serverport (standardmäßig 10000).
Datenbank: Das Standardschema bzw. die Standarddatenbank, die modelliert wird. Wenn für eine Tabelle keine Datenbank angegeben ist, wird davon ausgegangen.
Nutzername: Der Nutzer, als der sich Looker authentifizieren wird.
Passwort: Das optionale Passwort für den Looker-Nutzer.
PDTs aktivieren: Mit diesem Schalter können Sie persistente abgeleitete Tabellen aktivieren. Wenn PDTs aktiviert sind, werden im Fenster Verbindung zusätzliche PDT-Einstellungen und der Bereich PDT-Überschreibungen angezeigt.
Temporäre Datenbank: Ein temporäres Schema/eine temporäre Datenbank zum Speichern von PDTs. Sie muss zuvor mit einer Anweisung wie CREATE SCHEMA looker_scratch; erstellt werden.
Zusätzliche JDBC-Parameter: Fügen Sie hier zusätzliche Hive-JDBC-Parameter hinzu, z. B.:
- ;spark.sql.inMemoryColumnarStorage.compressed=true
- ;auth=noSasl
SSL: Lassen Sie das Häkchen hier entfernt.
Zeitzone der Datenbank: Die Zeitzone der in Spark gespeicherten Daten. Normalerweise kann es leer gelassen oder auf UTC gesetzt werden.
Zeitzone der Abfrage: Die Zeitzone, in der in Looker abgefragte Daten angezeigt werden.

Klicken Sie auf Test, um zu prüfen, ob die Verbindung erfolgreich hergestellt wurde. Informationen zur Fehlerbehebung finden Sie auf der Dokumentationsseite Datenbankkonnektivität testen.

Klicken Sie auf Verbinden, um diese Einstellungen zu speichern.

Funktionsunterstützung

Damit Looker einige Funktionen unterstützen kann, müssen diese auch von Ihrem Datenbankdialekt unterstützt werden.

Apache Spark 3+

Apache Spark 3+ unterstützt ab Looker 25.18 die folgenden Funktionen:

Funktion	Unterstützt?
Supportstufe	Unterstützt
Looker (Google Cloud Core)	Ja
Symmetrische Summen	Ja
Abgeleitete Tabellen	Ja
Persistente SQL-basierte abgeleitete Tabellen	Ja
Persistente native abgeleitete Tabellen	Ja
Stabile Ansichten	Ja
Abfrage beenden	Ja
SQL-basierte Pivots	Ja
Zeitzonen	Ja
SSL	Ja
Zwischensummen	Ja
Zusätzliche JDBC-Parameter	Ja
Groß- und Kleinschreibung	Ja
Standorttyp	Ja
Listentyp	Ja
Perzentil	Ja
Perzentil der unterschiedlichen Werte	Nein
SQL Runner – Prozesse anzeigen	Nein
SQL-Runner-Funktion „Tabelle beschreiben“	Ja
SQL Runner-Befehl „Show Indexes“	Nein
SQL Runner Select 10	Ja
SQL-Runner-Zählung	Ja
SQL Explain	Ja
OAuth 2.0-Anmeldedaten	Nein
Kontextkommentare	Ja
Verbindungs-Pooling	Nein
HLL-Skizzen	Nein
Aggregatfunktion	Ja
Inkrementelle PDTs	Nein
Millisekunden	Ja
Mikrosekunden	Ja
Materialisierte Ansichten	Nein
Vergleich zum vorherigen Zeitraum	Nein
Ungefähre Anzahl einzelner Aufrufe	Nein

Nächste Schritte

Nachdem Sie die Verbindung erstellt haben, legen Sie Authentifizierungsoptionen fest.