Menganalisis data dengan bantuan Gemini

Tutorial ini menjelaskan cara menggunakan bantuan yang didukung teknologi AI dalam Gemini di BigQuery menganalisis data.

Untuk contoh dalam tutorial ini, anggaplah Anda adalah data analis yang perlu menganalisis dan memprediksi penjualan produk dari sebuah dataset.

Tutorial ini mengasumsikan bahwa Anda sudah memahami SQL dan analitik data dasar tugas klasifikasi. Pengetahuan tentang produk Google Cloud tidak diasumsikan. Jika Anda baru saja BigQuery, lihat Panduan memulai BigQuery.

Tujuan

  • Gunakan Gemini di BigQuery untuk menjawab pertanyaan tentang bagaimana BigQuery menangani analisis data tertentu tugas klasifikasi.
  • Perintahkan Gemini di BigQuery untuk menemukan set data, serta menjelaskan dan menghasilkan kueri SQL.
  • Membangun model machine learning (ML) untuk memperkirakan periode mendatang.

Biaya

Tutorial ini menggunakan produk Google Cloud yang dapat ditagih berikut:

Untuk memperkirakan biaya berdasarkan proyeksi penggunaan, gunakan kalkulator harga.

Sebelum memulai

  1. Di konsol Google Cloud, pada halaman pemilih project, pilih atau buat project Google Cloud.

    Buka pemilih project

  2. Pastikan Gemini di BigQuery disiapkan untuk project Google Cloud Anda.
  3. Di Konsol Google Cloud, buka halaman BigQuery.

    Buka BigQuery

  4. Membuat set data yang bernama bqml_tutorial. Anda menggunakan dataset untuk menyimpan database objek, termasuk tabel dan model.

  5. Untuk mengaktifkan Gemini di fitur BigQuery yang Anda perlukan untuk menyelesaikan tutorial ini, di BigQuery klik pen_spark Gemini, lalu pilih opsi berikut:

    • Pelengkapan otomatis
    • Pembuatan otomatis
    • Explanation

Mempelajari kemampuan BigQuery

Sebelum Anda memulai, pertimbangkan bahwa Anda ingin mempelajari lebih lanjut tentang cara BigQuery menangani kueri data. Untuk mendapatkan bantuan, Anda dapat mengirim Pernyataan natural language di Gemini di BigQuery (atau perintah) seperti berikut:

  • "How do I get started with BigQuery?"
  • "What are the benefits of using BigQuery for data analysis?"
  • "How does BigQuery handle auto-scaling for queries?"

Gemini di BigQuery juga dapat memberikan informasi cara menganalisis data. Untuk jenis bantuan tersebut, Anda mungkin mengirim perintah seperti berikut:

  • “Bagaimana cara membuat model perkiraan deret waktu di BigQuery?"
  • "Bagaimana cara memuat berbagai jenis data ke BigQuery?"

Mengakses dan menganalisis data

Gemini di BigQuery dapat membantu Anda mengetahui data apa yang dapat Anda akses untuk melakukan analisis, dan cara menganalisis data tersebut.

Untuk contoh ini, pertimbangkan bahwa Anda memerlukan bantuan terkait hal berikut:

  • Menemukan dataset dan tabel penjualan untuk dianalisis.
  • Mengetahui bagaimana tabel dan kueri data terkait dalam dataset penjualan.
  • Memahami kueri kompleks dan menulis kueri yang menggunakan dataset.

Menemukan data

Sebelum dapat membuat kueri data, Anda perlu mengetahui data apa yang dapat Anda akses. Setiap data produk mengatur dan menyimpan data secara berbeda.

Untuk mendapatkan bantuan, Anda dapat mengirim Gemini di BigQuery prompt seperti "Bagaimana cara mempelajari dataset dan tabel mana yang tersedia untuk saya BigQuery?"

  1. Di Konsol Google Cloud, buka halaman BigQuery.

    Buka BigQuery

  2. Di toolbar Konsol Google Cloud, klik spark Buka atau tutup percakapan Gemini AI.

  3. Di panel Gemini, masukkan perintah How do I learn which datasets and tables are available to me in BigQuery?.

  4. Klik send Kirim perintah.

    Pelajari bagaimana dan kapan Gemini untuk Google Cloud menggunakan data Anda.

    Respons mencakup beberapa cara untuk menampilkan daftar project, set data, atau tabel dalam sebuah dataset.

  5. Opsional: Untuk mereset histori chat, di panel Gemini, klik delete Hapus chat, dan lalu klik Reset chat.

Memahami dan menulis SQL di BigQuery

Untuk contoh ini, asumsikan bahwa Anda memilih data untuk dianalisis dan sekarang ingin melakukan kueri terhadap data tersebut. Gemini di BigQuery dapat membantu Anda bekerja dengan SQL—apakah itu untuk membantu Anda memahami kueri yang kompleks dan sulit untuk diurai, atau menghasilkan kueri SQL baru.

Minta bantuan Gemini untuk menjelaskan kueri SQL

Pertimbangkan bahwa Anda ingin memahami kueri kompleks yang ditulis orang lain. Gemini di BigQuery dapat menjelaskan kueri secara sederhana seperti sintaksis kueri, skema dasar, dan konteks bisnis.

  1. Di Konsol Google Cloud, buka halaman BigQuery.

    Buka BigQuery

  2. Di editor kueri, buka atau tempel kueri yang ingin Anda minta untuk dijelaskan. Contoh:

    SELECT
      u.id AS user_id,
      u.first_name,
      u.last_name,
      avg(oi.sale_price) AS avg_sale_price
    FROM `bigquery-public-data.thelook_ecommerce.users` AS u
    JOIN `bigquery-public-data.thelook_ecommerce.order_items` AS oi
      ON u.id = oi.user_id
    GROUP BY 1, 2, 3
    ORDER BY avg_sale_price DESC
    LIMIT 10
    
  3. Tandai kueri, lalu klik auto_awesome Jelaskan kueri yang dipilih ini.

    Di panel Gemini, respons yang ditampilkan mirip dengan berikut ini:

    The intent of this query is to find the top 10 users by average sale price.
    The query first joins the users and order_items tables on the user_id
    column. It then groups the results by user_id, first_name, and last_name,
    and calculates the average sale price for each group. The results are then
    ordered by average sale price in descending order, and the top 10 results
    are returned.
    

Membuat kueri SQL yang mengelompokkan penjualan berdasarkan hari dan produk

Dalam contoh ini, Anda ingin membuat kueri yang mencantumkan produk teratas Anda untuk setiap harinya. Kemudian, Anda menggunakan tabel dalam set data dan perintah thelook_ecommerce Gemini di BigQuery untuk menghasilkan kueri menghitung penjualan berdasarkan item pesanan dan berdasarkan nama produk.

Jenis kueri ini sering kali rumit, tetapi dengan menggunakan Gemini di BigQuery, Anda dapat membuat pernyataan secara otomatis. Anda dapat memberikan prompt untuk menghasilkan kueri SQL berdasarkan skema data Anda. Meskipun jika Anda memulai dengan tanpa kode, pengetahuan yang terbatas tentang skema data, atau hanya pengetahuan dasar sintaks SQL, bantuan Gemini dapat menyarankan satu atau lebih pernyataan SQL.

Untuk memerintahkan Gemini di BigQuery agar membuat kueri yang mencantumkan produk teratas Anda, ikuti langkah-langkah berikut:

  1. Di Konsol Google Cloud, buka halaman BigQuery.

    Buka BigQuery

  2. Di Navigation menu, klik BigQuery Studio.

  3. Klik Compose a new query. Panel Explorer akan otomatis memuat database yang dipilih.

  4. Di editor kueri, masukkan perintah berikut, lalu tekan Masukkan:

    # select the sum of sales by date and product casted to day from bigquery-public-data.thelook_ecommerce.order_items joined with bigquery-public-data.thelook_ecommerce.products
    

    Karakter pagar (#) memerintahkan Gemini di menggunakan BigQuery untuk menghasilkan SQL. Gemini di BigQuery menyarankan kueri SQL yang mirip dengan berikut ini:

    SELECT
      sum(sale_price),
      DATE(created_at),
      product_id
    FROM
      `bigquery-public-data.thelook_ecommerce.order_items`
        AS t1
    INNER JOIN `bigquery-public-data.thelook_ecommerce.products` AS t2
      ON t1.product_id = t2.id
    GROUP BY 2, 3
    
  5. Untuk menerima kode yang disarankan, klik Tab, lalu klik Jalankan untuk jalankan pernyataan SQL. Anda juga dapat menelusuri SQL yang disarankan dan menerima kata-kata tertentu yang disarankan dalam pernyataan.

  6. Di panel Query results, lihat hasil kueri.

Membuat model perkiraan dan melihat hasilnya

Dalam contoh ini, Anda menggunakan BigQuery ML untuk melakukan hal berikut:

  • Menggunakan kueri tren untuk membuat model perkiraan.
  • Gunakan Gemini di BigQuery untuk menjelaskan dan membantu Anda menulis kueri untuk melihat hasil model perkiraan.

Anda menggunakan contoh kueri berikut dengan penjualan aktual, yang digunakan sebagai input teks ke model. Kueri digunakan sebagai bagian dari pembuatan model ML.

  1. Untuk membuat model ML perkiraan, di editor kueri, jalankan kueri SQL berikut:

    CREATE MODEL bqml_tutorial.sales_forecasting_model
      OPTIONS (
        MODEL_TYPE = 'ARIMA_PLUS',
        time_series_timestamp_col = 'date_col',
        time_series_data_col = 'total_sales',
        time_series_id_col = 'product_id')
    AS
    SELECT
      sum(sale_price) AS total_sales,
      DATE(created_at) AS date_col,
      product_id
    FROM
      `bigquery-public-data.thelook_ecommerce.order_items`
        AS t1
    INNER JOIN `bigquery-public-data.thelook_ecommerce.products` AS t2
      ON t1.product_id = t2.id
    GROUP BY 2, 3;
    

    Anda dapat menggunakan Gemini di BigQuery untuk membantu memahami kueri ini.

    Ketika model dibuat, tab Results dari Query results akan menampilkan pesan yang mirip dengan contoh berikut:

    Successfully created model named sales_forecasting_model.
    
  2. Di panel Gemini, masukkan perintah untuk Gemini di BigQuery untuk membantu Anda menulis kueri guna mendapatkan perkiraan model saat sudah selesai—misalnya, masukkan How can I get a forecast in SQL from the model?

    Berdasarkan konteks perintahnya, responsnya dengan menyertakan contoh Model ML yang memperkirakan penjualan:

    SELECT
      *
    FROM
      ML.FORECAST(
        MODEL `PROJECT_ID.bqml_tutorial.sales_forecasting_model`,
        STRUCT(
          7 AS horizon,
          0.95 AS confidence_level))
    

    Dalam respons ini, PROJECT_ID adalah project Google Cloud Anda.

  3. Di panel Gemini, salin kueri SQL.

  4. Di editor kueri, jalankan kueri SQL.

Pembersihan

Agar tidak menimbulkan biaya ke akun Google Cloud Anda untuk resource digunakan dalam tutorial ini, Anda dapat menghapus project Google Cloud yang yang dibuat untuk tutorial ini. Atau, Anda dapat menghapus resource satu per satu.

Hapus project

  1. Di konsol Google Cloud, buka halaman Manage resource.

    Buka Manage resource

  2. Pada daftar project, pilih project yang ingin Anda hapus, lalu klik Delete.
  3. Pada dialog, ketik project ID, lalu klik Shut down untuk menghapus project.

Menghapus set data

Jika project Anda dihapus, semua set data dan semua tabel dalam project akan dihapus. Jika Anda memilih untuk menggunakan kembali proyek, maka Anda dapat menghapus dataset yang telah dibuat di dalam tutorial ini.

  1. Di Konsol Google Cloud, buka halaman BigQuery.

    Buka BigQuery

  2. Di menu navigasi, pilih set data bqml_tutorial yang telah Anda dibuat.

  3. Untuk menghapus set data, tabel, dan semua data, klik Hapus set data.

  4. Untuk mengonfirmasi penghapusan, pada dialog Delete dataset, ketik nama set data (bqml_tutorial), lalu klik Delete.

Langkah selanjutnya