Menganalisis dengan kanvas data

Kanvas data BigQuery memungkinkan Anda menemukan, mengubah, membuat kueri, dan memvisualisasikan data menggunakan bahasa alami. Kanvas data BigQuery menyediakan antarmuka grafis untuk analisis yang memungkinkan Anda bekerja dengan sumber data, kueri, dan visualisasi dalam grafik asiklik terarah (DAG), sehingga memberikan tampilan grafis dari alur kerja analisis yang memetakan ke model mental Anda. Di kanvas data BigQuery, Anda dapat melakukan iterasi hasil kueri dan bekerja dengan beberapa cabang penyelidikan di satu tempat.

Kanvas data BigQuery dirancang untuk membantu perjalanan Anda dari data menjadi insight. Anda dapat bekerja dengan data tanpa memerlukan pengetahuan teknis tentang alat atau produk tertentu. Kanvas data BigQuery berfungsi dengan metadata Dataplex untuk mengidentifikasi tabel yang sesuai berdasarkan natural language.

Kanvas data BigQuery menggunakan Gemini untuk menemukan data Anda, membuat SQL, membuat diagram, dan membuat ringkasan data.

Kapabilitas

Kanvas data BigQuery mendukung kemampuan berikut:

  • Temukan aset tabel menggunakan sintaksis penelusuran kata kunci dengan metadata Dataplex, seperti tabel, tampilan, atau tampilan terwujud.

  • Gunakan natural language untuk kueri SQL sederhana, seperti:

    • Kueri dengan SELECT FROM, fungsi matematika, array, dan struct
    • Pernyataan JOIN di antara dua tabel
  • Visualisasi umum, termasuk jenis diagram berikut:

    • Diagram batang
    • {i>Heat map<i}
    • Grafik garis
    • Diagram lingkaran
    • Diagram sebar
  • Visualisasi kustom, tempat Anda dapat menggunakan natural language untuk mendeskripsikan hal yang Anda inginkan.

  • Insight data otomatis.

Kanvas data BigQuery memiliki batasan berikut:

  • Perintah bahasa alami mungkin mengalami kesulitan saat bekerja dengan:

    • BigQuery ML
    • Apache Spark
    • Tabel objek
    • BigLake
    • INFORMATION_SCHEMA
    • JSON
    • Kolom bertingkat dan berulang.
    • Fungsi dan jenis data kompleks, seperti DATETIME dan TIMEZONE
  • Visualisasi data tidak berfungsi dengan diagram peta geografis.

Sebelum memulai

Untuk mengakses Gemini di fitur BigQuery, administrator harus mengaktifkan Gemini di BigQuery. Untuk mempelajari lebih lanjut, lihat Menyiapkan Gemini di BigQuery.

Untuk mendapatkan izin yang diperlukan agar dapat menggunakan kanvas data BigQuery, minta administrator untuk memberi Anda peran IAM berikut pada project:

Untuk mengetahui informasi selengkapnya tentang pemberian peran, lihat Mengelola akses.

Anda mungkin juga bisa mendapatkan izin yang diperlukan melalui peran khusus atau peran bawaan lainnya.

Menggunakan kanvas data BigQuery

Kanvas data BigQuery memungkinkan Anda menemukan, mengubah, membuat kueri, dan memvisualisasikan data menggunakan pendekatan natural language forward. Contoh berikut menunjukkan beberapa cara berinteraksi dengan kanvas data BigQuery, termasuk contoh alur kerja dari penemuan data hingga visualisasi.

Untuk mulai menggunakan kanvas data BigQuery:

  1. Buka Konsol Google Cloud.

    Buka BigQuery

  2. Di menu navigasi, klik BigQuery Studio.

  3. Klik Buat kanvas data. Anda juga dapat memulai kanvas data BigQuery langsung dari tabel atau kueri.

  4. Masukkan perintah pertama Anda dalam natural language di kolom teks.

Contoh

Contoh berikut menunjukkan alur kerja kanvas data BigQuery yang umum.

Contoh 1: Bekerja dengan satu tabel

Perintah 1: Temukan data

Chicago taxi trips

Hasil potensial:

Kanvas data BigQuery menghasilkan daftar tabel potensial berdasarkan metadata Dataplex. Anda dapat memilih beberapa tabel. Setiap tabel memiliki opsi Add to kanvas, Query, dan Details. Untuk contoh ini, kita akan memilih tabel bigquery-public-data.chicago_taxi_trips.taxi_trips lalu klik Add to kanvas.

Sel tabel untuk taxi_trips ditambahkan ke kanvas data BigQuery. Anda dapat melihat seluruh tab dalam sel tabel untuk melihat informasi skema, detail tabel, dan pratinjau data.

Klik Query untuk mengkueri tabel ini dengan natural language.

Perintah 2: Buat kueri SQL dengan tabel yang dipilih

Get me the 100 longest trips

Hasil potensial:

Kanvas data BigQuery menghasilkan kueri SQL yang mirip dengan berikut ini:

SELECT
  taxi_id,
  trip_start_timestamp,
  trip_end_timestamp,
  trip_miles
FROM
  `bigquery-public-data.chicago_taxi_trips.taxi_trips`
ORDER BY
  trip_miles DESC
LIMIT
  100;
  

Anda juga dapat mengedit kueri, baik dengan mengedit kueri SQL secara manual maupun mengubah perintah natural language dan membuat ulang kueri. Untuk contoh ini, kita akan mengedit perintah natural language untuk hanya memilih perjalanan yang mana pelanggan membayar dengan uang tunai.

Perintah 3: Edit kueri dengan mengubah perintah

Get me the 100 longest trips where the payment type is cash

Hasil potensial

Kanvas data BigQuery menghasilkan kueri SQL yang mirip dengan berikut ini:

SELECT
  taxi_id,
  trip_start_timestamp,
  trip_end_timestamp,
  trip_miles
FROM
  `daui-storage.chicago_taxi_trips_123123.taxi_trips`
WHERE
  payment_type = 'Cash'
ORDER BY
  trip_miles DESC
LIMIT
  100;
  

Klik Run untuk melihat hasil kueri.

Perintah 4: Buat diagram

  1. Klik Visualisasikan
  2. Klik Buat diagram batang.

Hasil potensial

Kanvas data BigQuery membuat diagram batang yang menampilkan mil perjalanan terbanyak berdasarkan ID perjalanan.

Selain menyediakan diagram, kanvas data BigQuery merangkum beberapa detail penting dari data yang mendukung visualisasi. Anda dapat mengubah diagram dengan mengklik Detail visualisasi dan mengedit diagram di panel samping.

Jika Anda ingin membagikan kanvas data BigQuery, klik Bagikan, lalu klik Bagikan link untuk menyalin link kanvas data BigQuery.

Untuk membersihkan kanvas data BigQuery, klik Hapus kanvas. Proses ini hanya akan memberikan kanvas kosong.

Contoh 2: Bekerja dengan beberapa tabel

Perintah 1:

Information about trees

Hasil potensial:

Kanvas data BigQuery menyarankan beberapa tabel yang berisi informasi tentang hierarki. Untuk contoh ini, kita akan menggunakan dua tabel: bigquery-public-data.new_york_trees.tree_census_1995 dan bigquery-public-data.new_york_trees.tree_census_2015.

Setelah memilih kedua tabel ini, keduanya akan ditampilkan di kanvas.

Untuk contoh ini, klik Join pada tabel bigquery-public-data.new_york_trees.tree_census_1995 untuk menggabungkan kedua tabel. Kanvas data BigQuery menyarankan tabel untuk digabungkan. Pilih bigquery-public-data.new_york_trees.tree_census_2015. Sebuah panel baru akan ditampilkan, dengan koneksi ke setiap tabel.

{i>Prompt<i} (Petunjuk) 2:

Join these tables on their address

Hasil potensial

SELECT
  *
FROM
  `bigquery-public-data.new_york_trees.tree_census_2015` AS t2015
JOIN
  `bigquery-public-data.new_york_trees.tree_census_1995` AS t1995
ON
  t2015.address = t1995.address;

Kanvas data BigQuery mengusulkan kueri SQL untuk menggabungkan kedua tabel ini di alamatnya. Klik Run untuk menjalankan kueri dan melihat hasilnya.

Kanvas data BigQuery memungkinkan Anda mengekspor kueri sebagai notebook. Untuk mengekspor ke buku catatan:

  1. Klik tab Ekspor sebagai notebook.
  2. Di panel Save Notebook, masukkan nama dan wilayah tempat Anda ingin menyimpan notebook.
  3. Klik Save. Notebook berhasil dibuat.
  4. Klik Open in BQ Studio untuk melihat notebook yang dibuat.

Contoh 3

Perintah 1

Find data about USA names

Hasil potensial

Kanvas data BigQuery menghasilkan daftar tabel. Untuk contoh ini, kita akan memilih tabel bigquery-public-data.usa_names.usa_1910_current.

Klik Query untuk mengkueri data. Masukkan perintah untuk membuat kueri data.

Hasil potensial

Kanvas data BigQuery menghasilkan kueri berikut:

SELECT
  state,
  gender,
  year,
  name,
  number
FROM
  `bigquery-public-data.usa_names.usa_1910_current`

Kanvas data BigQuery menghasilkan hasil kueri. Kita akan meminta kueri tambahan untuk memfilter data ini. Klik Query this results.

Perintah 2

Get me the top 10 most popular names in 1980

Hasil potensial

Kanvas data BigQuery menghasilkan kueri berikut:

SELECT
  name,
  SUM(number) AS total_count
FROM
  `bigquery-public-data`.usa_names.usa_1910_current
WHERE
  year = 1980
GROUP BY
  name
ORDER BY
  total_count DESC
LIMIT
  10;

Setelah menjalankan kueri, kita mendapatkan tabel dengan sepuluh nama paling umum dari anak-anak yang lahir pada tahun 1980.

Untuk contoh ini, kita akan memvisualisasikan hasil ini. Klik Visualisasikan. Kanvas data BigQuery menyarankan beberapa opsi visualisasi, termasuk diagram batang, diagram lingkaran, grafik garis, dan visualisasi kustom. Klik Buat diagram batang.

Kanvas data BigQuery membuat diagram batang yang mirip dengan berikut ini:

Diagram batang sepuluh nama teratas.

Selain menyediakan diagram, kanvas data BigQuery merangkum beberapa detail penting dari data yang mendukung visualisasi. Anda dapat mengubah diagram dengan mengklik Detail visualisasi dan mengedit diagram di panel samping.

Perintah 3

Create a bar chart sorted high to low, with a gradient

Hasil potensial

Kanvas data BigQuery membuat diagram batang yang mirip dengan berikut ini:

Diagram batang sepuluh nama teratas diurutkan.

Untuk membuat perubahan lebih lanjut, klik Detail visualisasi. Sidebar detail Vis akan ditampilkan. Anda dapat mengedit judul diagram, nama sumbu x, nama sumbu y, dan lainnya. Selain itu, jika mengklik tab JSON, Anda dapat melakukan pengeditan langsung pada diagram berdasarkan nilai JSON.

Memberikan masukan

Anda dapat membantu meningkatkan saran kanvas data BigQuery dengan mengirimkan masukan ke Google. Untuk memberikan masukan:

  1. Di konsol Google Cloud, di toolbar, klik Submit feedback.

  2. Opsional: Klik Copy untuk menyalin informasi JSON DAG guna memberikan konteks tambahan ke masukan Anda.

  3. Klik formulir dan isi formulir untuk memberikan masukan.

Setelan berbagi data berlaku untuk seluruh project dan hanya dapat ditetapkan oleh administrator project dengan izin IAM serviceusage.services.enable dan serviceusage.services.list. Untuk mengetahui informasi selengkapnya tentang penggunaan data dalam Program Penguji Tepercaya, lihat Gemini di Program Penguji Tepercaya Google Cloud.

Anda juga dapat menghubungi datacanvas-feedback@google.com untuk memberikan masukan langsung tentang fitur ini.

Langkah selanjutnya