Menganalisis dengan kanvas data
Kanvas data BigQuery memungkinkan Anda menemukan, mengubah, membuat kueri, dan memvisualisasikan data menggunakan bahasa alami. Kanvas data BigQuery menyediakan antarmuka grafis untuk analisis yang memungkinkan Anda bekerja dengan sumber data, kueri, dan visualisasi dalam grafik asiklik terarah (DAG), sehingga memberikan tampilan grafis dari alur kerja analisis yang memetakan ke model mental Anda. Di kanvas data BigQuery, Anda dapat melakukan iterasi hasil kueri dan bekerja dengan beberapa cabang penyelidikan di satu tempat.
Kanvas data BigQuery dirancang untuk membantu perjalanan Anda dari data menjadi insight. Anda dapat bekerja dengan data tanpa memerlukan pengetahuan teknis tentang alat atau produk tertentu. Kanvas data BigQuery berfungsi dengan metadata Dataplex untuk mengidentifikasi tabel yang sesuai berdasarkan natural language.
Kanvas data BigQuery menggunakan Gemini untuk menemukan data Anda, membuat SQL, membuat diagram, dan membuat ringkasan data.
Kapabilitas
Kanvas data BigQuery mendukung kemampuan berikut:
Temukan aset tabel menggunakan sintaksis penelusuran kata kunci dengan metadata Dataplex, seperti tabel, tampilan, atau tampilan terwujud.
Gunakan natural language untuk kueri SQL sederhana, seperti:
- Kueri dengan
SELECT FROM
, fungsi matematika, array, dan struct - Pernyataan
JOIN
di antara dua tabel
- Kueri dengan
Visualisasi umum, termasuk jenis diagram berikut:
- Diagram batang
- {i>Heat map<i}
- Grafik garis
- Diagram lingkaran
- Diagram sebar
Visualisasi kustom, tempat Anda dapat menggunakan natural language untuk mendeskripsikan hal yang Anda inginkan.
Insight data otomatis.
Kanvas data BigQuery memiliki batasan berikut:
Perintah bahasa alami mungkin mengalami kesulitan saat bekerja dengan:
- BigQuery ML
- Apache Spark
- Tabel objek
- BigLake
- INFORMATION_SCHEMA
- JSON
- Kolom bertingkat dan berulang.
- Fungsi dan jenis data kompleks, seperti
DATETIME
danTIMEZONE
Visualisasi data tidak berfungsi dengan diagram peta geografis.
Sebelum memulai
Untuk mengakses Gemini di fitur BigQuery, administrator harus mengaktifkan Gemini di BigQuery. Untuk mempelajari lebih lanjut, lihat Menyiapkan Gemini di BigQuery.
Untuk mendapatkan izin yang diperlukan agar dapat menggunakan kanvas data BigQuery, minta administrator untuk memberi Anda peran IAM berikut pada project:
-
BigQuery Studio (
roles/bigquery.studioUser
) -
Pengguna Pendamping Cloud AI (
roles/cloudaicompanion.user
)
Untuk mengetahui informasi selengkapnya tentang pemberian peran, lihat Mengelola akses.
Anda mungkin juga bisa mendapatkan izin yang diperlukan melalui peran khusus atau peran bawaan lainnya.
Menggunakan kanvas data BigQuery
Kanvas data BigQuery memungkinkan Anda menemukan, mengubah, membuat kueri, dan memvisualisasikan data menggunakan pendekatan natural language forward. Contoh berikut menunjukkan beberapa cara berinteraksi dengan kanvas data BigQuery, termasuk contoh alur kerja dari penemuan data hingga visualisasi.
Untuk mulai menggunakan kanvas data BigQuery:
Buka Konsol Google Cloud.
Di menu navigasi, klik BigQuery Studio.
Klik
Buat kanvas data. Anda juga dapat memulai kanvas data BigQuery langsung dari tabel atau kueri.Masukkan perintah pertama Anda dalam natural language di kolom teks.
Contoh
Contoh berikut menunjukkan alur kerja kanvas data BigQuery yang umum.
Contoh 1: Bekerja dengan satu tabel
Perintah 1: Temukan data
Chicago taxi trips
Hasil potensial:
Kanvas data BigQuery menghasilkan daftar tabel potensial berdasarkan metadata Dataplex. Anda dapat memilih beberapa tabel. Setiap tabel memiliki opsi Add to kanvas, Query, dan Details. Untuk contoh ini, kita akan memilih tabel bigquery-public-data.chicago_taxi_trips.taxi_trips
lalu klik Add to kanvas.
Sel tabel untuk taxi_trips
ditambahkan ke kanvas data BigQuery. Anda dapat melihat seluruh tab dalam sel tabel untuk melihat informasi skema, detail tabel, dan pratinjau data.
Klik Query untuk mengkueri tabel ini dengan natural language.
Perintah 2: Buat kueri SQL dengan tabel yang dipilih
Get me the 100 longest trips
Hasil potensial:
Kanvas data BigQuery menghasilkan kueri SQL yang mirip dengan berikut ini:
SELECT taxi_id, trip_start_timestamp, trip_end_timestamp, trip_miles FROM `bigquery-public-data.chicago_taxi_trips.taxi_trips` ORDER BY trip_miles DESC LIMIT 100;
Anda juga dapat mengedit kueri, baik dengan mengedit kueri SQL secara manual maupun mengubah perintah natural language dan membuat ulang kueri. Untuk contoh ini, kita akan mengedit perintah natural language untuk hanya memilih perjalanan yang mana pelanggan membayar dengan uang tunai.
Perintah 3: Edit kueri dengan mengubah perintah
Get me the 100 longest trips where the payment type is cash
Hasil potensial
Kanvas data BigQuery menghasilkan kueri SQL yang mirip dengan berikut ini:
SELECT taxi_id, trip_start_timestamp, trip_end_timestamp, trip_miles FROM `daui-storage.chicago_taxi_trips_123123.taxi_trips` WHERE payment_type = 'Cash' ORDER BY trip_miles DESC LIMIT 100;
Klik Run untuk melihat hasil kueri.
Perintah 4: Buat diagram
- Klik Visualisasikan
- Klik Buat diagram batang.
Hasil potensial
Kanvas data BigQuery membuat diagram batang yang menampilkan mil perjalanan terbanyak berdasarkan ID perjalanan.
Selain menyediakan diagram, kanvas data BigQuery merangkum beberapa detail penting dari data yang mendukung visualisasi. Anda dapat mengubah diagram dengan mengklik Detail visualisasi dan mengedit diagram di panel samping.
Jika Anda ingin membagikan kanvas data BigQuery, klik Bagikan, lalu klik Bagikan link untuk menyalin link kanvas data BigQuery.
Untuk membersihkan kanvas data BigQuery, klik Hapus kanvas. Proses ini hanya akan memberikan kanvas kosong.
Contoh 2: Bekerja dengan beberapa tabel
Perintah 1:
Information about trees
Hasil potensial:
Kanvas data BigQuery menyarankan beberapa tabel yang berisi informasi tentang hierarki. Untuk
contoh ini, kita akan menggunakan dua tabel:
bigquery-public-data.new_york_trees.tree_census_1995
dan
bigquery-public-data.new_york_trees.tree_census_2015
.
Setelah memilih kedua tabel ini, keduanya akan ditampilkan di kanvas.
Untuk contoh ini, klik Join pada
tabel bigquery-public-data.new_york_trees.tree_census_1995
untuk menggabungkan kedua
tabel. Kanvas data BigQuery menyarankan tabel untuk digabungkan. Pilih
bigquery-public-data.new_york_trees.tree_census_2015
. Sebuah panel baru akan ditampilkan,
dengan koneksi ke setiap tabel.
{i>Prompt<i} (Petunjuk) 2:
Join these tables on their address
Hasil potensial
SELECT * FROM `bigquery-public-data.new_york_trees.tree_census_2015` AS t2015 JOIN `bigquery-public-data.new_york_trees.tree_census_1995` AS t1995 ON t2015.address = t1995.address;
Kanvas data BigQuery mengusulkan kueri SQL untuk menggabungkan kedua tabel ini di alamatnya. Klik Run untuk menjalankan kueri dan melihat hasilnya.
Kanvas data BigQuery memungkinkan Anda mengekspor kueri sebagai notebook. Untuk mengekspor ke buku catatan:
- Klik tab Ekspor sebagai notebook.
- Di panel Save Notebook, masukkan nama dan wilayah tempat Anda ingin menyimpan notebook.
- Klik Save. Notebook berhasil dibuat.
- Klik Open in BQ Studio untuk melihat notebook yang dibuat.
Contoh 3
Perintah 1
Find data about USA names
Hasil potensial
Kanvas data BigQuery menghasilkan daftar tabel. Untuk contoh ini, kita akan
memilih tabel bigquery-public-data.usa_names.usa_1910_current
.
Klik Query untuk mengkueri data. Masukkan perintah untuk membuat kueri data.
Hasil potensial
Kanvas data BigQuery menghasilkan kueri berikut:
SELECT state, gender, year, name, number FROM `bigquery-public-data.usa_names.usa_1910_current`
Kanvas data BigQuery menghasilkan hasil kueri. Kita akan meminta kueri tambahan untuk memfilter data ini. Klik Query this results.
Perintah 2
Get me the top 10 most popular names in 1980
Hasil potensial
Kanvas data BigQuery menghasilkan kueri berikut:
SELECT name, SUM(number) AS total_count FROM `bigquery-public-data`.usa_names.usa_1910_current WHERE year = 1980 GROUP BY name ORDER BY total_count DESC LIMIT 10;
Setelah menjalankan kueri, kita mendapatkan tabel dengan sepuluh nama paling umum dari anak-anak yang lahir pada tahun 1980.
Untuk contoh ini, kita akan memvisualisasikan hasil ini. Klik Visualisasikan. Kanvas data BigQuery menyarankan beberapa opsi visualisasi, termasuk diagram batang, diagram lingkaran, grafik garis, dan visualisasi kustom. Klik Buat diagram batang.
Kanvas data BigQuery membuat diagram batang yang mirip dengan berikut ini:
Selain menyediakan diagram, kanvas data BigQuery merangkum beberapa detail penting dari data yang mendukung visualisasi. Anda dapat mengubah diagram dengan mengklik Detail visualisasi dan mengedit diagram di panel samping.
Perintah 3
Create a bar chart sorted high to low, with a gradient
Hasil potensial
Kanvas data BigQuery membuat diagram batang yang mirip dengan berikut ini:
Untuk membuat perubahan lebih lanjut, klik Detail visualisasi. Sidebar detail Vis akan ditampilkan. Anda dapat mengedit judul diagram, nama sumbu x, nama sumbu y, dan lainnya. Selain itu, jika mengklik tab JSON, Anda dapat melakukan pengeditan langsung pada diagram berdasarkan nilai JSON.
Memberikan masukan
Anda dapat membantu meningkatkan saran kanvas data BigQuery dengan mengirimkan masukan ke Google. Untuk memberikan masukan:
Di konsol Google Cloud, di toolbar, klik Submit feedback.
Opsional: Klik
Copy untuk menyalin informasi JSON DAG guna memberikan konteks tambahan ke masukan Anda.Klik formulir dan isi formulir untuk memberikan masukan.
Setelan berbagi data berlaku untuk seluruh project dan hanya dapat ditetapkan oleh administrator project dengan izin IAM serviceusage.services.enable
dan serviceusage.services.list
. Untuk mengetahui informasi
selengkapnya tentang penggunaan data dalam Program Penguji Tepercaya, lihat
Gemini di Program Penguji Tepercaya
Google Cloud.
Anda juga dapat menghubungi datacanvas-feedback@google.com untuk memberikan masukan langsung tentang fitur ini.
Langkah selanjutnya
Pelajari cara menulis kueri dengan bantuan Gemini.
Pelajari cara membuat notebook.