Membuat dan mengkueri tabel metastore dari Spark
Anda dapat membuat kueri tabel Apache Spark Iceberg di notebook BigQuery menggunakan mesin open source, seperti Spark. Tabel ini adalah tabel Iceberg reguler dengan metadata yang disimpan di metastore BigQuery. Tabel yang sama dapat dikueri dari BigQuery dan Spark.
Sebelum memulai
- Buat tabel Iceberg saat menggunakan Spark di notebook BigQuery. Skema tabel disimpan di metastore BigQuery. Misalnya, Anda dapat membuat tabel dengan notebook BigQuery, Dataproc, Dataproc Serverless, atau prosedur tersimpan.
Pertimbangan
- Saat ini, hanya tabel Iceberg yang didukung.
Saat menjalankan kueri, jangan lupa untuk memetakan nama namespace dan database sebagai nama set data BigQuery. Tabel berikut mencantumkan pemetaan kunci yang berlaku untuk digunakan:
Open source BigQuery Namespace Set data BigQuery Database Set data BigQuery Tabel (dipartisi atau tidak dipartisi) Tabel BigQuery
Melihat dan membuat kueri tabel
Setelah membuat resource BigQuery di Spark, Anda dapat melihat dan membuat kueri di konsolGoogle Cloud . Contoh berikut menunjukkan langkah-langkah umum untuk membuat kueri tabel metastore menggunakan Spark interaktif:
Gunakan katalog Iceberg kustom:
USE `CATALOG_NAME`;
Ganti kode berikut:
CATALOG_NAME
: nama katalog Spark yang Anda gunakan dengan tugas SQL.
Buat namespace
CREATE NAMESPACE IF NOT EXISTS NAMESPACE_NAME;
Ganti kode berikut:
NAMESPACE_NAME
: nama namespace yang mereferensikan tabel Spark Anda.
Gunakan namespace yang dibuat:
USE NAMESPACE_NAME;
Buat tabel Iceberg:
CREATE TABLE TABLE_NAME (id int, data string) USING ICEBERG;
Ganti kode berikut:
TABLE_NAME
: nama untuk tabel Iceberg Anda.
Menyisipkan baris tabel:
INSERT INTO TABLE_NAME VALUES (1, "first row");
Gunakan konsol Google Cloud untuk melakukan salah satu hal berikut:
SELECT * FROM `TABLE_NAME`;
Langkah selanjutnya
- Siapkan fitur metastore BigQuery tambahan.