Menganalisis data dengan bantuan Duet AI

Tutorial ini menjelaskan cara menggunakan Duet AI, kolaborator dengan teknologi AI di Google Cloud, untuk menganalisis data. Dalam tutorial ini, Anda menggunakan Duet AI di BigQuery untuk menganalisis dan memprediksi penjualan produk.

Tutorial ini mengasumsikan bahwa Anda telah memahami tugas-tugas analisis data dasar dan SQL. Pengetahuan tentang produk Google Cloud tidak diasumsikan. Jika Anda baru menggunakan BigQuery, baca panduan memulai BigQuery.

Tujuan

  • Gunakan Duet AI untuk menjawab pertanyaan Anda tentang produk dan kasus penggunaan analisis data Google Cloud.
  • Minta Duet AI untuk menjelaskan dan menghasilkan kueri SQL di BigQuery.
  • Buat model machine learning (ML) untuk memperkirakan periode mendatang.

Biaya

Tutorial ini menggunakan komponen Google Cloud yang dapat ditagih berikut:

Gunakan Kalkulator Harga untuk memperkirakan biaya berdasarkan penggunaan yang diproyeksikan.

Sebelum memulai

  1. Di konsol Google Cloud, pada halaman pemilih project, pilih atau buat project Google Cloud.

    Buka pemilih project

  2. Pastikan Duet AI sudah disiapkan untuk akun pengguna dan project Google Cloud Anda.
  3. Di konsol Google Cloud, buka halaman BigQuery.

    Buka BigQuery

  4. Buat set data yang bernama bqml_tutorial. Anda menggunakan {i>dataset<i} tersebut untuk menyimpan objek {i>database<i}, termasuk tabel dan model.

  5. Aktifkan fitur Duet AI di BigQuery yang Anda perlukan untuk menyelesaikan tutorial ini:

    1. Untuk melihat fitur Duet AI di BigQuery, di toolbar, klik pen_spark Duet AI.

    2. Dalam daftar Duet AI di editor SQL BigQuery, pilih semua opsi berikut:

      • Pelengkapan otomatis
      • Pembuatan otomatis
      • Penjelasan

    Untuk menonaktifkan fitur Duet AI di BigQuery, batalkan pilihan fitur Duet AI yang ingin Anda nonaktifkan.

Menggunakan Duet AI untuk menganalisis data Anda

Duet AI dapat membantu Anda mengetahui data yang dapat diakses untuk analisis, dan cara menganalisis data tersebut.

Sebelum dapat melakukan kueri data, Anda perlu mengetahui data apa yang dapat diakses. Setiap produk data mengatur dan menyimpan data secara berbeda. Untuk mendapatkan bantuan, Anda dapat mengirimkan pernyataan natural language (atau perintah) pada Duet AI, seperti "Bagaimana cara melihat set data dan tabel yang tersedia untuk saya di BigQuery?"

Jika ingin memahami karakteristik berbagai sistem kueri data, Anda dapat meminta informasi produk tertentu pada Duet AI seperti berikut:

  • "Bagaimana cara memulai BigQuery?"
  • "Apa manfaat menggunakan BigQuery untuk analisis data?"
  • "Bagaimana BigQuery menangani penskalaan otomatis untuk kueri?"

Duet AI juga dapat memberikan informasi tentang cara menganalisis data Anda. Untuk jenis bantuan tersebut, Anda dapat mengirim perintah Duet AI seperti berikut:

  • "Bagaimana cara membuat model perkiraan deret waktu di BigQuery?"
  • "Bagaimana cara memuat berbagai jenis data ke BigQuery?"

Untuk meminta Duet AI menjawab pertanyaan tentang data Anda, ikuti langkah-langkah berikut:

  1. Di konsol Google Cloud, buka halaman BigQuery.

    Buka BigQuery

  2. Di toolbar konsol Google Cloud, klik chat_spark Open Duet AI.

  3. Di panel Duet AI, masukkan perintah seperti How do I learn which datasets and tables are available to me in BigQuery?.

  4. Klik kirim Kirim perintah.

    Duet AI tidak menggunakan perintah Anda atau responsnya sebagai data untuk melatih modelnya. Untuk mengetahui informasi selengkapnya, lihat Cara Duet AI di Google Cloud menggunakan data Anda.

    Duet AI menampilkan respons yang mirip dengan berikut ini:

    To learn which datasets and tables are available to you in
    BigQuery, you can use the Google Cloud console, the
    Google Cloud CLI, or the BigQuery API.
    ...
    
  5. Opsional: Untuk mereset histori chat, di panel Duet AI, klik ikon hapus, lalu klik Reset chat.

Menggunakan Duet AI untuk memahami dan menulis SQL di BigQuery

Duet AI dapat membantu Anda bekerja dengan SQL. Misalnya, jika Anda menangani kueri SQL yang ditulis orang lain, Duet AI di BigQuery dapat menjelaskan kueri yang kompleks dalam bahasa yang sederhana. Penjelasan tersebut dapat membantu Anda memahami sintaksis kueri, skema dasar, dan konteks bisnis.

Minta Duet AI untuk menjelaskan kueri SQL dalam set data penjualan

Untuk meminta Duet AI menjelaskan contoh kueri SQL, ikuti langkah-langkah berikut:

  1. Di konsol Google Cloud, buka halaman BigQuery.

    Buka BigQuery

  2. Di editor kueri, buka atau tempel kueri yang ingin Anda minta untuk dijelaskan.

    Misalnya, Anda mungkin ingin memahami bagaimana tabel data dan kueri terkait dalam set data penjualan, dan Anda mungkin ingin membantu menulis kueri yang menggunakan set data tersebut. Dalam contoh kueri berikut, Anda mungkin memahami tabel mana yang sedang digunakan, tetapi bagian lain dari kueri mungkin memerlukan waktu untuk diurai dan dipahami.

    SELECT u.id as user_id, u.first_name, u.last_name, avg(oi.sale_price) as avg_sale_price
    FROM `bigquery-public-data.thelook_ecommerce.users` as u
    JOIN `bigquery-public-data.thelook_ecommerce.order_items` as oi
    ON u.id = oi.user_id
    GROUP BY 1,2,3
    ORDER BY avg_sale_price DESC
    LIMIT 10
    
  3. Tandai kueri yang Anda inginkan untuk dijelaskan oleh Duet AI, lalu klik pen_spark Jelaskan kueri ini.

    Penjelasan SQL muncul di panel Duet AI.

    Dengan menggunakan contoh kueri dari langkah sebelumnya, Duet AI menampilkan penjelasan yang mirip dengan berikut ini:

    The intent of this query is to find the top 10 users by average sale price.
    The query first joins the users and order_items tables on the user_id
    column. It then groups the results by user_id , first_name , and last_name,
    and calculates the average sale price for each group. The results are then
    ordered by average sale price in descending order, and the top 10 results
    are returned.
    

Buat kueri SQL yang mengelompokkan penjualan berdasarkan hari dan produk

Anda dapat memberikan perintah kepada Duet AI untuk membuat kueri SQL berdasarkan skema data Anda. Meskipun Anda memulai tanpa kode, pengetahuan terbatas tentang skema data, atau hanya pengetahuan dasar tentang sintaksis SQL, Duet AI dapat menyarankan satu atau beberapa pernyataan SQL.

Pada contoh berikut, Anda membuat kueri yang mencantumkan produk teratas untuk setiap hari. Jenis kueri ini sering kali rumit, tetapi dengan menggunakan Duet AI, Anda dapat membuat pernyataan secara otomatis. Anda kemudian menggunakan tabel dalam set data thelook_ecommerce dan meminta Duet AI untuk membuat kueri guna menghitung penjualan berdasarkan item pesanan dan nama produk.

Untuk meminta Duet AI membuat kueri yang mencantumkan produk teratas Anda, ikuti langkah-langkah berikut:

  1. Di Google Cloud Console, buka halaman BigQuery.

    Buka BigQuery

  2. Di menu navigasi, klik BigQuery Studio.

  3. Klik Tulis kueri baru. Panel Explorer otomatis memuat database yang dipilih.

  4. Di editor kueri, masukkan perintah berikut, lalu tekan Enter. Karakter pound (#) meminta Duet AI untuk menghasilkan SQL.

    # select the sum of sales by date and product casted to day from bigquery-public-data.thelook_ecommerce.order_items joined with products
    

    Duet AI menyarankan kueri SQL yang mirip dengan yang berikut:

    SELECT sum(sale_price),
    DATE(created_at),
    product_id
    FROM `bigquery-public-data.thelook_ecommerce.order_items`
    AS t1
    INNER JOIN `bigquery-public-data.thelook_ecommerce.products`
    AS t2
    ON t1.product_id = t2.id
    GROUP BY 2, 3
    
  5. Untuk menerima kode yang disarankan, klik Tab, lalu klik Run untuk menjalankan pernyataan SQL. Anda juga dapat menggulir SQL yang disarankan dan menerima kata-kata tertentu yang disarankan dalam pernyataan.

  6. Di panel Query results, lihat hasil kueri.

Membuat model perkiraan dan melihat hasilnya

Di bagian ini, Anda akan menggunakan BigQuery ML untuk melakukan hal berikut:

  • Gunakan kueri tren untuk membuat model perkiraan.
  • Gunakan Duet AI untuk menjelaskan dan membantu Anda menulis kueri guna melihat hasil model perkiraan.

Anda menggunakan contoh kueri berikut dengan penjualan aktual, yang digunakan sebagai input ke model. Kueri digunakan sebagai bagian dari pembuatan model ML.

  1. Untuk membuat model ML perkiraan, jalankan SQL berikut di editor BigQuery SQL:

    CREATE MODEL bqml_tutorial.sales_forecasting_model
    OPTIONS(MODEL_TYPE='ARIMA_PLUS',
    time_series_timestamp_col='date_col',
    time_series_data_col='total_sales',
    time_series_id_col='product_id') AS
    SELECT sum(sale_price) as total_sales,
    DATE(created_at) as date_col,
    product_id
    FROM `bigquery-public-data.thelook_ecommerce.order_items`
    AS t1
    INNER JOIN `bigquery-public-data.thelook_ecommerce.products`
    AS t2
    ON t1.product_id = t2.id
    GROUP BY 2, 3;
    

    Anda dapat menggunakan Duet AI untuk membantu memahami kueri ini

    Saat model dibuat, panel Results akan menampilkan pesan yang mirip dengan berikut:

    This statement will replace the model named sales_forecasting_model.
    Depending on the type of model, this may take several hours to complete.
    
  2. Di panel Duet AI, masukkan perintah untuk Duet AI guna membantu Anda menulis kueri guna mendapatkan perkiraan dari model saat selesai. Misalnya, masukkan How can I get a forecast in SQL from the model?

    Berdasarkan konteks perintah, Duet AI menampilkan contoh model ML yang memperkirakan penjualan:

    To get a forecast in SQL from the model, you can use the following query:
    
    SELECT
    *
    FROM
      ML.FORECAST(MODEL `PROJECT_ID.DATASET_ID.MODEL_NAME`,
    STRUCT(
          7 AS horizon,
          0.95 AS confidence_level
    )
    )
    
  3. Di panel Duet AI, salin kueri SQL.

  4. Di editor BigQuery SQL, tempel, lalu jalankan kueri SQL.

Pembersihan

Agar tidak menimbulkan biaya pada akun Google Cloud Anda untuk resource yang digunakan dalam tutorial ini, Anda dapat menghapus project Google Cloud yang dibuat untuk tutorial ini. Atau, Anda dapat menghapus resource satu per satu.

  1. Di konsol Google Cloud, buka halaman Manage resource.

    Buka Manage resource

  2. Pada daftar project, pilih project yang ingin Anda hapus, lalu klik Delete.
  3. Pada dialog, ketik project ID, lalu klik Shut down untuk menghapus project.

Menghapus set data

Jika project Anda dihapus, semua set data dan semua tabel dalam project akan dihapus. Jika memilih untuk menggunakan kembali project, Anda dapat menghapus set data yang dibuat dalam tutorial ini.

  1. Di Google Cloud Console, buka halaman BigQuery.

    Buka BigQuery

  2. Di navigasi, pilih set data bqml_tutorial yang Anda buat.

  3. Untuk menghapus set data, tabel, dan semua data, klik Delete dataset.

  4. Untuk mengonfirmasi penghapusan, di dialog Delete dataset, ketik nama set data Anda (bqml_tutorial), lalu klik Delete.

Langkah selanjutnya