Apache Spark

Halaman ini berisi informasi tentang cara menghubungkan Looker ke Apache Spark 3.

Looker terhubung ke Apache Spark 3+ melalui koneksi JDBC ke Server Spark Thrift.

Mengenkripsi traffic jaringan

Praktik terbaiknya adalah mengenkripsi traffic jaringan antara aplikasi Looker dan database Anda. Pertimbangkan salah satu opsi yang dijelaskan di halaman dokumentasi Mengaktifkan akses database yang aman.

Membuat koneksi Looker ke database Anda

Di bagian Admin di Looker, pilih Koneksi, lalu klik Tambahkan Koneksi.

Isi detail koneksi. Sebagian besar setelan umum untuk sebagian besar dialek database. Lihat halaman dokumentasi Menghubungkan Looker ke database Anda untuk mengetahui informasinya. Beberapa setelan akan dijelaskan di bawah ini:

  • Nama: Nama koneksi. Ini adalah cara koneksi akan dirujuk dalam model LookML.
  • Dialek: Pilih Apache Spark 3+.
  • Host: Host server Thrift.
  • Port Port server Thrift (10.000 secara default).
  • Database: Skema/database default yang akan dimodelkan. Jika tidak ada database yang ditentukan untuk tabel, hal ini akan diasumsikan.
  • Nama pengguna: Pengguna yang akan diautentikasi oleh Looker.
  • Sandi: Sandi opsional untuk pengguna Looker.
  • Aktifkan PDT: Gunakan tombol ini untuk mengaktifkan tabel turunan persisten. Jika PDT diaktifkan, jendela Koneksi akan menampilkan setelan PDT tambahan dan bagian Penggantian PDT.
  • Database Sementara: Skema/database sementara untuk menyimpan PDT. Ini harus dibuat sebelumnya, dengan pernyataan seperti CREATE SCHEMA looker_scratch;.
  • Parameter JDBC tambahan: Tambahkan parameter JDBC Hive tambahan di sini, seperti:
    • ;spark.sql.inMemoryColumnarStorage.compressed=true
    • ;auth=noSasl
  • SSL: Biarkan opsi ini tidak dicentang.
  • Zona Waktu Database: Zona waktu data yang disimpan di Spark. Biasanya, kolom ini dapat dibiarkan kosong atau ditetapkan ke UTC.
  • Zona Waktu Kueri: Zona waktu untuk menampilkan data yang dikueri di Looker.

Untuk memverifikasi bahwa koneksi berhasil, klik Uji. Lihat halaman dokumentasi Menguji konektivitas database untuk mengetahui informasi pemecahan masalah.

Untuk menyimpan setelan ini, klik Hubungkan.

Dukungan fitur

Agar Looker mendukung beberapa fitur, dialek database Anda juga harus mendukungnya.

Apache Spark 3+

Apache Spark 3+ mendukung fitur berikut mulai Looker 24.20:

Fitur Didukung?
Level Dukungan
Didukung
Looker (Google Cloud core)
Ya
Agregat Simetris
Ya
Tabel Turunan
Ya
Tabel Turunan SQL Persisten
Ya
Tabel Turunan Berbasis Persisten
Ya
Tampilan Stabil
Ya
Penghentian Kueri
Ya
Pivot berbasis SQL
Ya
Zona waktu
Ya
SSL
Ya
Subtotal
Ya
Parameter Tambahan JDBC
Ya
Peka Huruf Besar/Kecil
Ya
Jenis Lokasi
Ya
Jenis Daftar
Ya
Persentil
Ya
Persentil Berbeda
Tidak
Proses Tampilkan SQL Runner
Tidak
SQL Runner Describe Table
Ya
SQL Runner Show Indexes
Tidak
SQL Runner Select 10
Ya
Jumlah SQL Runner
Ya
SQL Explain
Ya
Kredensial Oauth
Tidak
Komentar Konteks
Ya
Penggabungan Koneksi
Tidak
Sketsa HLL
Tidak
Kesadaran Agregat
Ya
PDT inkremental
Tidak
Milidetik
Ya
Mikrodetik
Ya
Tampilan Terwujud
Tidak
Perkiraan Jumlah Berbeda
Tidak

Langkah berikutnya

Setelah membuat koneksi, tetapkan opsi autentikasi.