Menganalisis dengan BigQuery data canvas

Kanvas data BigQuery Studio, yang merupakan fitur Gemini di BigQuery, memungkinkan Anda menemukan, mentransformasi, membuat kueri, dan memvisualisasikan data menggunakan perintah bahasa alami dan antarmuka grafis untuk alur kerja analisis.

Untuk alur kerja analisis, kanvas data BigQuery menggunakan grafik asiklik terarah (DAG), yang menyediakan tampilan grafis alur kerja Anda. Di kanvas data BigQuery, Anda dapat melakukan iterasi pada hasil kueri dan menggunakan beberapa cabang pertanyaan di satu tempat.

Kanvas data BigQuery dirancang untuk mempercepat tugas analisis dan membantu tenaga profesional data seperti analis data, engineer data, dan lainnya dalam perjalanan mereka dari data ke insight. Anda tidak perlu memiliki pengetahuan teknis tentang alat tertentu, hanya pengetahuan dasar tentang membaca dan menulis SQL. Kanvas data BigQuery berfungsi dengan metadata Dataplex untuk mengidentifikasi tabel yang sesuai berdasarkan bahasa alami.

BigQuery data canvas tidak dimaksudkan untuk digunakan langsung oleh pengguna bisnis.

Kanvas data BigQuery menggunakan Gemini di BigQuery untuk menemukan data Anda, membuat SQL, membuat diagram, dan membuat ringkasan data.

Pelajari cara dan waktu Gemini untuk Google Cloud menggunakan data Anda.

Kemampuan

Kanvas data BigQuery memungkinkan Anda melakukan hal berikut:

  • Gunakan kueri natural language atau sintaksis penelusuran kata kunci dengan metadata Dataplex untuk menemukan aset seperti tabel, tampilan, atau tampilan virtual.

  • Gunakan bahasa alami untuk kueri SQL dasar seperti berikut:

    • Kueri yang berisi klausa FROM, fungsi matematika, array, dan struct.
    • Operasi JOIN untuk dua tabel.
  • Visualisasikan data menggunakan jenis grafik berikut:

    • Diagram batang
    • Peta panas
    • Grafik garis
    • Diagram lingkaran
    • Diagram sebar
  • Buat visualisasi kustom menggunakan bahasa alami untuk mendeskripsikan apa yang Anda inginkan.

  • Mengotomatiskan insight data.

Batasan

  • Perintah bahasa alami mungkin tidak berfungsi dengan baik dengan hal berikut:

    • BigQuery ML
    • Apache Spark
    • Tabel objek
    • BigLake
    • Dilihat INFORMATION_SCHEMAx
    • JSON
    • Kolom bertingkat dan berulang.
    • Fungsi dan jenis data yang kompleks seperti DATETIME dan TIMEZONE
  • Visualisasi data tidak berfungsi dengan diagram geomap.

Praktik terbaik perintah

Dengan teknik perintah yang tepat, Anda dapat membuat kueri SQL yang kompleks. Saran berikut membantu BigQuery data canvas meningkatkan kualitas perintah bahasa alam Anda untuk meningkatkan akurasi kueri:

  • Tulis dengan jelas. Nyatakan permintaan Anda dengan jelas dan hindari permintaan yang tidak jelas.

  • Ajukan pertanyaan langsung. Untuk mendapatkan jawaban yang paling tepat, ajukan satu pertanyaan satu per satu, dan buat perintah Anda ringkas. Jika perlu, pisahkan perintah ke dalam node yang berbeda di kanvas data BigQuery.

  • Berikan petunjuk yang fokus dan jelas. Tekankan istilah-istilah penting dalam perintah Anda.

  • Menentukan urutan operasi. Berikan petunjuk dengan cara yang jelas dan teratur. Bagi tugas menjadi langkah-langkah kecil yang terfokus.

  • Menyempurnakan dan melakukan iterasi. Coba berbagai frasa dan pendekatan untuk melihat mana yang menghasilkan hasil terbaik.

Untuk mengetahui informasi selengkapnya, lihat Praktik terbaik untuk kanvas data BigQuery.

Sebelum memulai

  1. Pastikan Gemini di BigQuery diaktifkan untuk project Google Cloud Anda. Administrator biasanya melakukan langkah ini.
  2. Pastikan Anda memiliki izin Identity and Access Management (IAM) yang diperlukan untuk menggunakan kanvas data BigQuery.

Peran yang diperlukan

Untuk mendapatkan izin yang diperlukan guna menggunakan kanvas data BigQuery, minta administrator untuk memberi Anda peran IAM berikut di project:

Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat Mengelola akses ke project, folder, dan organisasi.

Anda mungkin juga bisa mendapatkan izin yang diperlukan melalui peran khusus atau peran bawaan lainnya.

Untuk mengetahui informasi lebih lanjut tentang peran dan izin IAM di BigQuery, baca Pengantar IAM.

Menggunakan kanvas data BigQuery

Anda dapat menggunakan kanvas data BigQuery di konsol Google Cloud, kueri, atau tabel.

  1. Buka halaman BigQuery.

    Buka BigQuery

  2. Di editor kueri, di samping SQL query, klik Create new, lalu klik Data canvas.

    Membuat ikon kanvas data.

  3. Di kolom perintah Natural language, masukkan perintah bahasa alami.

    Misalnya, jika Anda memasukkan Find me tables related to trees, kanvas data BigQuery akan menampilkan daftar kemungkinan tabel, termasuk set data publik seperti bigquery-public-data.usfs_fia.plot_tree atau bigquery-public-data.new_york_trees.tree_species.

  4. Pilih tabel.

    Node tabel untuk tabel yang dipilih ditambahkan ke kanvas data BigQuery. Untuk melihat informasi skema, melihat detail tabel, atau melihat pratinjau data, pilih berbagai tab di node tabel.

Mencoba contoh alur kerja

Bagian ini menunjukkan berbagai cara menggunakan kanvas data BigQuery dalam alur kerja analisis.

Contoh alur kerja: Menemukan, membuat kueri, dan memvisualisasikan data

Dalam contoh ini, Anda menggunakan perintah bahasa alami di kanvas data BigQuery untuk menemukan data, membuat kueri, dan mengedit kueri. Kemudian, Anda membuat diagram.

Perintah 1: Temukan data

  1. Di konsol Google Cloud, buka halaman BigQuery.

    Buka BigQuery

  2. Di editor kueri, di samping SQL query, klik Create new, lalu klik Data canvas.

    Membuat ikon kanvas data.

  3. Di kolom perintah Natural language, masukkan perintah natural language berikut:

    Chicago taxi trips
    

    Kanvas data BigQuery menghasilkan daftar tabel potensial berdasarkan metadata Dataplex. Anda dapat memilih beberapa tabel.

  4. Pilih tabel bigquery-public-data.chicago_taxi_trips.taxi_trips, lalu klik Tambahkan ke kanvas.

    Node tabel untuk taxi_trips ditambahkan ke kanvas data BigQuery. Untuk melihat informasi skema, melihat detail tabel, atau melihat pratinjau data, pilih berbagai tab di node tabel.

Perintah 2: Buat kueri SQL di tabel yang dipilih

Untuk membuat kueri SQL untuk tabel bigquery-public-data.chicago_taxi_trips.taxi_trips, lakukan hal berikut:

  1. Di kanvas data, klik Kueri.

  2. Di kolom perintah Natural language, masukkan perintah berikut:

    Get me the 100 longest trips
    

    Kanvas data BigQuery menghasilkan kueri SQL yang mirip dengan yang berikut:

    SELECT
      taxi_id,
      trip_start_timestamp,
      trip_end_timestamp,
      trip_miles
    FROM
      `bigquery-public-data.chicago_taxi_trips.taxi_trips`
    ORDER BY
      trip_miles DESC
    LIMIT
      100;

Perintah 3: Edit kueri

Untuk mengedit kueri yang Anda buat, Anda dapat mengedit kueri secara manual, atau Anda dapat mengubah perintah bahasa alami dan membuat ulang kueri. Dalam contoh ini, Anda menggunakan perintah bahasa alami untuk mengedit kueri agar hanya memilih perjalanan yang dibayar pelanggan dengan uang tunai.

  1. Di kolom perintah Natural language, masukkan perintah berikut:

    Get me the 100 longest trips where the payment type is cash
    

    Kanvas data BigQuery menghasilkan kueri SQL yang mirip dengan yang berikut:

    SELECT
      taxi_id,
      trip_start_timestamp,
      trip_end_timestamp,
      trip_miles
    FROM
      `PROJECT_ID.chicago_taxi_trips_123123.taxi_trips`
    WHERE
      payment_type = 'Cash'
    ORDER BY
      trip_miles DESC
    LIMIT
      100;

    Pada contoh sebelumnya, PROJECT_ID adalah ID project Google Cloud Anda.

  2. Untuk melihat hasil kueri, klik Run.

Membuat chart

  1. Di kanvas data, klik Visualize.
  2. Klik Create bar chart.

    Kanvas data BigQuery membuat diagram batang yang menunjukkan mil perjalanan paling banyak berdasarkan ID perjalanan. Selain menyediakan diagram, kanvas data BigQuery menyaring beberapa detail utama data yang mendukung visualisasi.

  3. Opsional: Lakukan satu atau beberapa hal berikut:

    • Untuk mengubah diagram, klik Edit, lalu edit diagram di panel Edit visualisasi.
    • Untuk membagikan kanvas data, klik Bagikan, lalu klik Bagikan Link untuk menyalin link kanvas data BigQuery.
    • Untuk membersihkan kanvas data, pilih Tindakan lainnya, lalu pilih Hapus kanvas. Langkah ini akan menghasilkan kanvas kosong.

Contoh alur kerja: Menggabungkan tabel

Dalam contoh ini, Anda menggunakan perintah bahasa alami di kanvas data BigQuery untuk menemukan data dan menggabungkan tabel. Kemudian, Anda mengekspor kueri sebagai notebook.

Perintah 1: Temukan data

  1. Di kolom perintah Natural language, masukkan perintah berikut:

    Information about trees
    

    Kanvas data BigQuery menyarankan beberapa tabel yang memiliki informasi tentang pohon.

  2. Untuk contoh ini, pilih tabel bigquery-public-data.new_york_trees.tree_census_1995, lalu klik Tambahkan ke kanvas.

    Tabel ditampilkan di kanvas.

Perintah 2: Gabungkan tabel di alamatnya

  1. Di kanvas data, klik Gabung.

    BigQuery data canvas menyarankan tabel yang akan digabungkan.

  2. Untuk membuka kolom perintah Natural language baru, klik Telusuri tabel.

  3. Di kolom perintah Natural language, masukkan perintah berikut:

    Information about trees
    
  4. Pilih tabel bigquery-public-data.new_york_trees.tree_census_2005, lalu klik Tambahkan ke kanvas.

    Tabel ditampilkan di kanvas.

  5. Di kanvas data, klik Gabung.

  6. Di bagian Di kanvas ini, centang kotak Sel tabel, lalu klik OK.

  7. Di kolom perintah Natural language, masukkan perintah berikut:

    Join on address
    

    Kanvas data BigQuery menyarankan kueri SQL untuk menggabungkan kedua tabel ini berdasarkan alamatnya:

    SELECT
      *
    FROM
      `bigquery-public-data.new_york_trees.tree_census_2015` AS t2015
    JOIN
      `bigquery-public-data.new_york_trees.tree_census_1995` AS t1995
    ON
      t2015.address = t1995.address;
  8. Untuk menjalankan kueri dan melihat hasilnya, klik Run.

Mengekspor kueri sebagai notebook

Dengan BigQuery data canvas, Anda dapat mengekspor kueri sebagai notebook.

  1. Di kanvas data, klik Export as notebook.
  2. Di panel Save Notebook, masukkan nama untuk notebook dan region tempat Anda ingin menyimpannya.
  3. Klik Simpan. Notebook berhasil dibuat.
  4. Opsional: Untuk melihat notebook yang dibuat, klik Buka.

Contoh alur kerja: Mengedit diagram menggunakan perintah

Dalam contoh ini, Anda menggunakan perintah bahasa alami di kanvas data BigQuery untuk menemukan, mengkueri, dan memfilter data, lalu mengedit detail visualisasi.

Perintah 1: Temukan data

  1. Untuk menemukan data tentang nama-nama di Amerika Serikat, masukkan perintah berikut:

    Find data about USA names
    

    Kanvas data BigQuery menghasilkan daftar tabel.

  2. Untuk contoh ini, pilih tabel bigquery-public-data.usa_names.usa_1910_current, lalu klik Tambahkan ke kanvas.

Perintah 2: Buat kueri data

  1. Untuk membuat kueri data, di kanvas data, klik Query, lalu masukkan perintah berikut:

    Summarize this data
    

    BigQuery data canvas menghasilkan kueri yang mirip dengan berikut:

    SELECT
      state,
      gender,
      year,
      name,
      number
    FROM
      `bigquery-public-data.usa_names.usa_1910_current`
  2. Klik Run. Hasil kueri akan ditampilkan.

Perintah 3: Memfilter data

  1. Di kanvas data, klik Query these results.
  2. Untuk memfilter data, di kolom perintah SQL, masukkan perintah berikut:

    Get me the top 10 most popular names in 1980
    

    BigQuery data canvas menghasilkan kueri yang mirip dengan berikut:

    SELECT
      name,
      SUM(number) AS total_count
    FROM
      `bigquery-public-data`.usa_names.usa_1910_current
    WHERE
      year = 1980
    GROUP BY
      name
    ORDER BY
      total_count DESC
    LIMIT
      10;

    Saat menjalankan kueri, Anda akan mendapatkan tabel dengan sepuluh nama paling umum dari anak-anak yang lahir pada tahun 1980.

Membuat dan mengedit diagram

  1. Di kanvas data, klik Visualize.

    Kanvas data BigQuery menyarankan beberapa opsi visualisasi, termasuk diagram batang, diagram lingkaran, grafik garis, dan visualisasi kustom.

  2. Untuk contoh ini, klik Create bar chart.

    Kanvas data BigQuery membuat diagram batang yang mirip dengan berikut:

    Diagram batang sepuluh nama teratas.

Selain menyediakan diagram, kanvas data BigQuery merangkum beberapa detail utama data yang mendukung visualisasi. Anda dapat mengubah diagram dengan mengklik Visualization details dan mengedit diagram di panel samping.

Perintah 4: Mengedit detail visualisasi

  1. Di kolom perintah Visualisasi, masukkan perintah berikut:

    Create a bar chart sorted high to low, with a gradient
    

    Kanvas data BigQuery membuat diagram batang yang mirip dengan berikut:

    Diagram batang sepuluh nama teratas diurutkan.

  2. Opsional: Untuk melakukan perubahan lebih lanjut, klik Edit.

    Panel Edit visualisasi akan ditampilkan. Anda dapat mengedit detail seperti judul diagram, nama sumbu x, dan nama sumbu y. Selain itu, jika mengklik tab JSON Editor, Anda dapat langsung mengedit diagram berdasarkan nilai JSON.

Melihat semua kanvas data

Untuk melihat daftar semua kanvas data dalam project Anda, lakukan hal berikut:

  1. Di konsol Google Cloud, buka halaman BigQuery.

    Buka BigQuery

  2. Di panel Explorer, klik View actions di samping Data canvases, lalu lakukan salah satu tindakan berikut:

  • Untuk membuka daftar di tab saat ini, klik Tampilkan semua.
  • Untuk membuka daftar di tab baru, klik Tampilkan semua di > Tab baru.
  • Untuk membuka daftar di tab terpisah, klik Tampilkan semua di > Tab terpisah.

Melihat metadata kanvas data

Untuk melihat metadata kanvas data, lakukan hal berikut:

  1. Di konsol Google Cloud, buka halaman BigQuery.

    Buka BigQuery

  2. Di panel Explorer, luaskan project Anda dan folder Kanvas data, dan jika perlu, folder Kanvas data bersama. Klik nama kanvas data yang metadatanya ingin Anda lihat.

  3. Lihat panel Ringkasan untuk melihat informasi tentang kanvas data, seperti region yang digunakan dan tanggal kanvas data terakhir diubah.

Menggunakan versi kanvas data

Anda dapat melihat, membandingkan, dan memulihkan versi kanvas data.

Melihat dan membandingkan versi kanvas data

Untuk melihat berbagai versi kanvas data dan membandingkannya dengan versi saat ini, lakukan hal berikut:

  1. Di konsol Google Cloud, buka halaman BigQuery.

    Buka BigQuery

  2. Di panel Explorer, luaskan project Anda dan folder Kanvas data, dan jika perlu, folder Kanvas data bersama. Klik nama kanvas data yang ingin Anda lihat aktivitasnya.

  3. Klik tab Aktivitas untuk melihat daftar versi kanvas data dalam urutan menurun berdasarkan tanggal.

  4. Klik Lihat tindakan di samping versi kanvas data, lalu klik Bandingkan. Panel perbandingan akan terbuka, yang membandingkan versi kanvas data yang Anda pilih dengan versi kanvas data saat ini.

  5. Opsional: Untuk membandingkan versi sebagai bagian dari teks, bukan di panel terpisah, klik Bandingkan, lalu klik Inline.

Memulihkan versi kanvas data

Gunakan salah satu opsi berikut untuk memulihkan versi kanvas data. Memulihkan dari panel perbandingan memungkinkan Anda membandingkan versi kanvas data sebelumnya dengan versi saat ini sebelum memilih untuk memulihkannya atau tidak.

Panel aktivitas

  1. Di panel Explorer, luaskan project Anda dan folder Kanvas data, dan jika perlu, folder Kanvas data bersama. Klik nama kanvas data yang ingin Anda pulihkan ke versi sebelumnya.
  2. Pilih panel Aktivitas.
  3. Klik Lihat tindakan di samping versi kanvas data yang ingin Anda pulihkan, lalu klik Pulihkan.
  4. Klik Konfirmasi untuk mengonfirmasi tindakan tersebut.

Panel perbandingan

  1. Di panel Explorer, luaskan project Anda dan folder Kanvas data, dan jika perlu, folder Kanvas data bersama. Klik nama kanvas data yang ingin Anda pulihkan ke versi sebelumnya.
  2. Pilih panel Aktivitas.
  3. Klik Lihat tindakan di samping versi kanvas data, lalu klik Bandingkan. Panel perbandingan akan terbuka, yang membandingkan versi kanvas data yang Anda pilih dengan versi kanvas data terbaru.
  4. Jika Anda ingin memulihkan versi kanvas data sebelumnya setelah perbandingan, klik Pulihkan.
  5. Klik Konfirmasi untuk mengonfirmasi tindakan tersebut.

Harga

Untuk mengetahui detail harga fitur ini, lihat ringkasan harga Gemini di BigQuery.

Kuota dan batas

Untuk mengetahui informasi tentang kuota dan batas untuk fitur ini, lihat Kuota untuk Gemini di BigQuery.

Memberikan masukan

Anda dapat membantu meningkatkan kualitas saran kanvas data BigQuery dengan mengirimkan masukan ke Google. Untuk memberikan masukan, lakukan hal berikut:

  1. Di toolbar konsol Google Cloud, klik Kirim masukan.

  2. Opsional: Untuk menyalin informasi JSON DAG guna memberikan konteks tambahan ke masukan Anda, klik Salin.

  3. Untuk mengisi formulir dan memberikan masukan, klik form.

Setelan berbagi data berlaku untuk seluruh project dan hanya dapat ditetapkan oleh administrator project yang memiliki izin IAM serviceusage.services.enable dan serviceusage.services.list. Untuk mengetahui informasi selengkapnya tentang penggunaan data dalam Program Penguji Tepercaya, lihat Gemini dalam Program Penguji Tepercaya Google Cloud.

Untuk memberikan masukan langsung tentang fitur ini, Anda juga dapat menghubungi datacanvas-feedback@google.com.

Langkah selanjutnya