Menganalisis dengan BigQuery data canvas
Kanvas data BigQuery Studio, yang merupakan fitur Gemini di BigQuery, memungkinkan Anda menemukan, mentransformasi, membuat kueri, dan memvisualisasikan data menggunakan perintah bahasa alami dan antarmuka grafis untuk alur kerja analisis.
Untuk alur kerja analisis, kanvas data BigQuery menggunakan grafik asiklik terarah (DAG), yang menyediakan tampilan grafis alur kerja Anda. Di kanvas data BigQuery, Anda dapat melakukan iterasi pada hasil kueri dan menggunakan beberapa cabang pertanyaan di satu tempat.
Kanvas data BigQuery dirancang untuk mempercepat tugas analisis dan membantu tenaga profesional data seperti analis data, engineer data, dan lainnya dalam perjalanan mereka dari data ke insight. Anda tidak perlu memiliki pengetahuan teknis tentang alat tertentu, hanya pengetahuan dasar tentang membaca dan menulis SQL. Kanvas data BigQuery berfungsi dengan metadata Dataplex untuk mengidentifikasi tabel yang sesuai berdasarkan bahasa alami.
BigQuery data canvas tidak dimaksudkan untuk digunakan langsung oleh pengguna bisnis.
Kanvas data BigQuery menggunakan Gemini di BigQuery untuk menemukan data Anda, membuat SQL, membuat diagram, dan membuat ringkasan data.
Pelajari cara dan waktu Gemini untuk Google Cloud menggunakan data Anda.
Kemampuan
Kanvas data BigQuery memungkinkan Anda melakukan hal berikut:
Gunakan kueri natural language atau sintaksis penelusuran kata kunci dengan metadata Dataplex untuk menemukan aset seperti tabel, tampilan, atau tampilan virtual.
Gunakan bahasa alami untuk kueri SQL dasar seperti berikut:
- Kueri yang berisi klausa
FROM
, fungsi matematika, array, dan struct. - Operasi
JOIN
untuk dua tabel.
- Kueri yang berisi klausa
Visualisasikan data menggunakan jenis grafik berikut:
- Diagram batang
- Peta panas
- Grafik garis
- Diagram lingkaran
- Diagram sebar
Buat visualisasi kustom menggunakan bahasa alami untuk mendeskripsikan apa yang Anda inginkan.
Mengotomatiskan insight data.
Batasan
Perintah bahasa alami mungkin tidak berfungsi dengan baik dengan hal berikut:
- BigQuery ML
- Apache Spark
- Tabel objek
- BigLake
- Dilihat
INFORMATION_SCHEMA
x - JSON
- Kolom bertingkat dan berulang.
- Fungsi dan jenis data yang kompleks seperti
DATETIME
danTIMEZONE
Visualisasi data tidak berfungsi dengan diagram geomap.
Praktik terbaik perintah
Dengan teknik perintah yang tepat, Anda dapat membuat kueri SQL yang kompleks. Saran berikut membantu BigQuery data canvas meningkatkan kualitas perintah bahasa alam Anda untuk meningkatkan akurasi kueri:
Tulis dengan jelas. Nyatakan permintaan Anda dengan jelas dan hindari permintaan yang tidak jelas.
Ajukan pertanyaan langsung. Untuk mendapatkan jawaban yang paling akurat, ajukan satu pertanyaan satu per satu, dan buat perintah Anda ringkas. Jika perlu, pisahkan perintah ke dalam node yang berbeda di kanvas data BigQuery.
Berikan petunjuk yang fokus dan jelas. Tekankan istilah-istilah penting dalam perintah Anda.
Menentukan urutan operasi. Berikan petunjuk dengan cara yang jelas dan teratur. Bagi tugas menjadi langkah-langkah kecil yang terfokus.
Sempurnakan dan lakukan iterasi. Coba berbagai frasa dan pendekatan untuk melihat mana yang menghasilkan hasil terbaik.
Untuk mengetahui informasi selengkapnya, lihat Praktik terbaik untuk kanvas data BigQuery.
Sebelum memulai
- Pastikan Gemini di BigQuery diaktifkan untuk project Google Cloud Anda. Administrator biasanya melakukan langkah ini.
- Pastikan Anda memiliki izin Identity and Access Management (IAM) yang diperlukan untuk menggunakan kanvas data BigQuery.
Peran yang diperlukan
Untuk mendapatkan izin yang diperlukan guna menggunakan kanvas data BigQuery, minta administrator untuk memberi Anda peran IAM berikut di project:
-
BigQuery Studio User (
roles/bigquery.studioUser
) -
Pengguna Gemini untuk Google Cloud (
roles/cloudaicompanion.user
)
Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat Mengelola akses ke project, folder, dan organisasi.
Anda mungkin juga bisa mendapatkan izin yang diperlukan melalui peran khusus atau peran bawaan lainnya.
Untuk mengetahui informasi lebih lanjut tentang peran dan izin IAM di BigQuery, baca Pengantar IAM.
Menggunakan kanvas data BigQuery
Anda dapat menggunakan kanvas data BigQuery di konsol Google Cloud, kueri, atau tabel.
Buka halaman BigQuery.
Di editor kueri, di samping
SQL query, klik Create new, lalu klik Data canvas.Di kolom perintah Natural language, masukkan perintah bahasa alami.
Misalnya, jika Anda memasukkan
Find me tables related to trees
, kanvas data BigQuery akan menampilkan daftar kemungkinan tabel, termasuk set data publik sepertibigquery-public-data.usfs_fia.plot_tree
ataubigquery-public-data.new_york_trees.tree_species
.Pilih tabel.
Node tabel untuk tabel yang dipilih ditambahkan ke kanvas data BigQuery. Untuk melihat informasi skema, melihat detail tabel, atau melihat pratinjau data, pilih berbagai tab di node tabel.
Mencoba contoh alur kerja
Bagian ini menunjukkan berbagai cara menggunakan kanvas data BigQuery dalam alur kerja analisis.
Contoh alur kerja: Menemukan, membuat kueri, dan memvisualisasikan data
Dalam contoh ini, Anda menggunakan perintah natural language di kanvas data BigQuery untuk menemukan data, membuat kueri, dan mengedit kueri. Kemudian, Anda membuat diagram.
Perintah 1: Temukan data
Di konsol Google Cloud, buka halaman BigQuery.
Di editor kueri, di samping
SQL query, klik Create new, lalu klik Data canvas.Di kolom perintah Natural language, masukkan perintah natural language berikut:
Chicago taxi trips
Kanvas data BigQuery menghasilkan daftar tabel potensial berdasarkan metadata Dataplex. Anda dapat memilih beberapa tabel.
Pilih tabel
bigquery-public-data.chicago_taxi_trips.taxi_trips
, lalu klik Tambahkan ke kanvas.Node tabel untuk
taxi_trips
ditambahkan ke kanvas data BigQuery. Untuk melihat informasi skema, melihat detail tabel, atau melihat pratinjau data, pilih berbagai tab di node tabel.
Perintah 2: Buat kueri SQL di tabel yang dipilih
Untuk membuat kueri SQL untuk
tabel bigquery-public-data.chicago_taxi_trips.taxi_trips
, lakukan hal berikut:
Di kanvas data, klik Kueri.
Di kolom perintah Natural language, masukkan perintah berikut:
Get me the 100 longest trips
Kanvas data BigQuery menghasilkan kueri SQL yang mirip dengan yang berikut:
SELECT taxi_id, trip_start_timestamp, trip_end_timestamp, trip_miles FROM `bigquery-public-data.chicago_taxi_trips.taxi_trips` ORDER BY trip_miles DESC LIMIT 100;
Perintah 3: Edit kueri
Untuk mengedit kueri yang Anda buat, Anda dapat mengedit kueri secara manual, atau Anda dapat mengubah perintah bahasa alami dan membuat ulang kueri. Dalam contoh ini, Anda menggunakan perintah bahasa alami untuk mengedit kueri agar hanya memilih perjalanan yang dibayar pelanggan dengan uang tunai.
Di kolom perintah Natural language, masukkan perintah berikut:
Get me the 100 longest trips where the payment type is cash
Kanvas data BigQuery menghasilkan kueri SQL yang mirip dengan yang berikut:
SELECT taxi_id, trip_start_timestamp, trip_end_timestamp, trip_miles FROM `PROJECT_ID.chicago_taxi_trips_123123.taxi_trips` WHERE payment_type = 'Cash' ORDER BY trip_miles DESC LIMIT 100;
Pada contoh sebelumnya,
PROJECT_ID
adalah ID project Google Cloud Anda.Untuk melihat hasil kueri, klik Run.
Membuat chart
- Di kanvas data, klik Visualize.
Klik Create bar chart.
Kanvas data BigQuery membuat diagram batang yang menunjukkan mil perjalanan paling banyak berdasarkan ID perjalanan. Selain menyediakan diagram, kanvas data BigQuery menyaring beberapa detail utama data yang mendukung visualisasi.
Opsional: Lakukan satu atau beberapa hal berikut:
- Untuk mengubah diagram, klik Edit, lalu edit diagram di panel Edit visualization.
- Untuk membagikan kanvas data, klik Bagikan, lalu klik Bagikan Link untuk menyalin link kanvas data BigQuery.
- Untuk membersihkan kanvas data, pilih Tindakan lainnya, lalu pilih Hapus kanvas. Langkah ini akan menghasilkan kanvas kosong.
Contoh alur kerja: Menggabungkan tabel
Dalam contoh ini, Anda menggunakan perintah bahasa alami di kanvas data BigQuery untuk menemukan data dan menggabungkan tabel. Kemudian, Anda mengekspor kueri sebagai notebook.
Perintah 1: Temukan data
Di kolom perintah Natural language, masukkan perintah berikut:
Information about trees
Kanvas data BigQuery menyarankan beberapa tabel yang memiliki informasi tentang pohon.
Untuk contoh ini, pilih tabel
bigquery-public-data.new_york_trees.tree_census_1995
, lalu klik Tambahkan ke kanvas.Tabel ditampilkan di kanvas.
Perintah 2: Gabungkan tabel di alamatnya
Di kanvas data, klik Gabungkan.
BigQuery data canvas menyarankan tabel yang akan digabungkan.
Untuk membuka kolom perintah Natural language baru, klik Telusuri tabel.
Di kolom perintah Natural language, masukkan perintah berikut:
Information about trees
Pilih tabel
bigquery-public-data.new_york_trees.tree_census_2005
, lalu klik Tambahkan ke kanvas.Tabel ditampilkan di kanvas.
Di kanvas data, klik Gabung.
Di bagian Di kanvas ini, centang kotak Sel tabel, lalu klik OK.
Di kolom perintah Natural language, masukkan perintah berikut:
Join on address
Kanvas data BigQuery menyarankan kueri SQL untuk menggabungkan kedua tabel ini berdasarkan alamatnya:
SELECT * FROM `bigquery-public-data.new_york_trees.tree_census_2015` AS t2015 JOIN `bigquery-public-data.new_york_trees.tree_census_1995` AS t1995 ON t2015.address = t1995.address;
Untuk menjalankan kueri dan melihat hasilnya, klik Run.
Mengekspor kueri sebagai notebook
Dengan BigQuery data canvas, Anda dapat mengekspor kueri sebagai notebook.
- Di kanvas data, klik Export as notebook.
- Di panel Save Notebook, masukkan nama untuk notebook dan region tempat Anda ingin menyimpannya.
- Klik Simpan. Notebook berhasil dibuat.
- Opsional: Untuk melihat notebook yang dibuat, klik Buka.
Contoh alur kerja: Mengedit diagram menggunakan perintah
Dalam contoh ini, Anda menggunakan perintah bahasa alami di kanvas data BigQuery untuk menemukan, mengkueri, dan memfilter data, lalu mengedit detail visualisasi.
Perintah 1: Temukan data
Untuk menemukan data tentang nama-nama di Amerika Serikat, masukkan perintah berikut:
Find data about USA names
Kanvas data BigQuery menghasilkan daftar tabel.
Untuk contoh ini, pilih tabel
bigquery-public-data.usa_names.usa_1910_current
, lalu klik Tambahkan ke kanvas.
Perintah 2: Buat kueri data
Untuk membuat kueri data, di kanvas data, klik Query, lalu masukkan perintah berikut:
Summarize this data
BigQuery data canvas menghasilkan kueri yang mirip dengan berikut:
SELECT state, gender, year, name, number FROM `bigquery-public-data.usa_names.usa_1910_current`
Klik Run. Hasil kueri akan ditampilkan.
Perintah 3: Memfilter data
- Di kanvas data, klik Query these results.
Untuk memfilter data, di kolom perintah SQL, masukkan perintah berikut:
Get me the top 10 most popular names in 1980
BigQuery data canvas menghasilkan kueri yang mirip dengan berikut:
SELECT name, SUM(number) AS total_count FROM `bigquery-public-data`.usa_names.usa_1910_current WHERE year = 1980 GROUP BY name ORDER BY total_count DESC LIMIT 10;
Saat menjalankan kueri, Anda akan mendapatkan tabel dengan sepuluh nama paling umum dari anak-anak yang lahir pada tahun 1980.
Membuat dan mengedit diagram
Di kanvas data, klik Visualize.
Kanvas data BigQuery menyarankan beberapa opsi visualisasi, termasuk diagram batang, diagram lingkaran, grafik garis, dan visualisasi kustom.
Untuk contoh ini, klik Create bar chart.
Kanvas data BigQuery membuat diagram batang yang mirip dengan berikut:
Selain menyediakan diagram, kanvas data BigQuery merangkum beberapa detail utama data yang mendukung visualisasi. Anda dapat mengubah diagram dengan mengklik Visualization details dan mengedit diagram di panel samping.
Perintah 4: Mengedit detail visualisasi
Di kolom perintah Visualisasi, masukkan perintah berikut:
Create a bar chart sorted high to low, with a gradient
Kanvas data BigQuery membuat diagram batang yang mirip dengan berikut:
Opsional: Untuk melakukan perubahan lebih lanjut, klik Edit.
Panel Edit visualisasi akan ditampilkan. Anda dapat mengedit detail seperti judul diagram, nama sumbu x, dan nama sumbu y. Selain itu, jika mengklik tab JSON Editor, Anda dapat langsung mengedit diagram berdasarkan nilai JSON.
Melihat semua kanvas data
Untuk melihat daftar semua kanvas data dalam project Anda, lakukan langkah berikut:
Di konsol Google Cloud, buka halaman BigQuery.
Di panel Explorer, klik
View actions di samping Data canvases, lalu lakukan salah satu tindakan berikut:
- Untuk membuka daftar di tab saat ini, klik Tampilkan semua.
- Untuk membuka daftar di tab baru, klik Tampilkan semua di > Tab baru.
- Untuk membuka daftar di tab terpisah, klik Tampilkan semua di > Tab terpisah.
Melihat metadata kanvas data
Untuk melihat metadata kanvas data, lakukan hal berikut:
Di konsol Google Cloud, buka halaman BigQuery.
Di panel Explorer, luaskan project Anda dan folder Kanvas data, dan jika perlu, folder Kanvas data bersama. Klik nama kanvas data yang metadatanya ingin Anda lihat.
Lihat panel Ringkasan untuk melihat informasi tentang kanvas data, seperti region yang digunakan dan tanggal kanvas data terakhir diubah.
Menggunakan versi kanvas data
Anda dapat melihat, membandingkan, dan memulihkan versi kanvas data.
Melihat dan membandingkan versi kanvas data
Untuk melihat berbagai versi kanvas data dan membandingkannya dengan versi saat ini, lakukan tindakan berikut:
Di konsol Google Cloud, buka halaman BigQuery.
Di panel Explorer, luaskan project Anda dan folder Kanvas data, dan jika perlu, folder Kanvas data bersama. Klik nama kanvas data yang ingin Anda lihat aktivitasnya.
Klik tab Aktivitas untuk melihat daftar versi kanvas data dalam urutan menurun berdasarkan tanggal.
Klik
Lihat tindakan di samping versi kanvas data, lalu klik Bandingkan. Panel perbandingan akan terbuka, yang membandingkan versi kanvas data yang Anda pilih dengan versi kanvas data saat ini.Opsional: Untuk membandingkan versi sebagai bagian dari teks, bukan di panel terpisah, klik Bandingkan, lalu klik Inline.
Memulihkan versi kanvas data
Gunakan salah satu opsi berikut untuk memulihkan versi kanvas data. Memulihkan dari panel perbandingan memungkinkan Anda membandingkan versi kanvas data sebelumnya dengan versi saat ini sebelum memilih untuk memulihkannya atau tidak.
Panel aktivitas
- Di panel Explorer, luaskan project Anda dan folder Kanvas data, dan jika perlu, folder Kanvas data bersama. Klik nama kanvas data yang ingin Anda pulihkan ke versi sebelumnya.
- Pilih panel Aktivitas.
- Klik Lihat tindakan di samping versi kanvas data yang ingin Anda pulihkan, lalu klik Pulihkan.
- Klik Konfirmasi untuk mengonfirmasi tindakan.
Panel perbandingan
- Di panel Explorer, luaskan project Anda dan folder Kanvas data, dan jika perlu, folder Kanvas data bersama. Klik nama kanvas data yang ingin Anda pulihkan ke versi sebelumnya.
- Pilih panel Aktivitas.
- Klik Lihat tindakan di samping versi kanvas data, lalu klik Bandingkan. Panel perbandingan akan terbuka, yang membandingkan versi kanvas data yang Anda pilih dengan versi kanvas data terbaru.
- Jika Anda ingin memulihkan versi kanvas data sebelumnya setelah perbandingan, klik Pulihkan.
- Klik Konfirmasi untuk mengonfirmasi tindakan tersebut.
Harga
Untuk mengetahui detail harga fitur ini, lihat ringkasan harga Gemini di BigQuery.
Kuota dan batas
Untuk mengetahui informasi tentang kuota dan batas untuk fitur ini, lihat Kuota untuk Gemini di BigQuery.
Memberikan masukan
Anda dapat membantu meningkatkan kualitas saran kanvas data BigQuery dengan mengirimkan masukan ke Google. Untuk memberikan masukan, lakukan hal berikut:
Di toolbar konsol Google Cloud, klik Kirim masukan.
Opsional: Untuk menyalin informasi JSON DAG guna memberikan konteks tambahan ke masukan Anda, klik
Salin.Untuk mengisi formulir dan memberikan masukan, klik form.
Setelan berbagi data berlaku untuk seluruh project dan hanya dapat ditetapkan oleh
administrator project yang memiliki izin IAM serviceusage.services.enable
dan
serviceusage.services.list
. Untuk mengetahui informasi
selengkapnya tentang penggunaan data dalam Program Penguji Tepercaya, lihat
Gemini dalam Program Penguji Tepercaya
Google Cloud.
Untuk memberikan masukan langsung tentang fitur ini, Anda juga dapat menghubungi datacanvas-feedback@google.com.
Langkah selanjutnya
Pelajari cara menulis kueri dengan bantuan Gemini.
Pelajari cara membuat notebook.