Menganalisis data dengan bantuan Gemini
Tutorial ini menjelaskan cara menggunakan bantuan yang didukung AI di Gemini di BigQuery untuk menganalisis data.
Untuk contoh dalam tutorial ini, anggaplah Anda adalah data analis yang perlu menganalisis dan memprediksi penjualan produk dari sebuah dataset.
Tutorial ini mengasumsikan bahwa Anda sudah memahami SQL dan tugas analisis data dasar. Pengetahuan tentang produk Google Cloud tidak diasumsikan. Jika Anda pengguna baru BigQuery, lihat panduan memulai BigQuery.
Tujuan
- Gunakan Gemini di BigQuery untuk menjawab pertanyaan tentang cara BigQuery menangani tugas analisis data tertentu.
- Meminta Gemini di BigQuery untuk menemukan set data, serta menjelaskan dan membuat kueri SQL.
- Membangun model machine learning (ML) untuk memperkirakan periode mendatang.
Biaya
Tutorial ini menggunakan produk Google Cloud yang dapat ditagih berikut:
Untuk memperkirakan biaya berdasarkan proyeksi penggunaan Anda, gunakan kalkulator harga.
Sebelum memulai
-
Di konsol Google Cloud, pada halaman pemilih project, pilih atau buat project Google Cloud.
- Pastikan Gemini di BigQuery disiapkan untuk project Google Cloud Anda.
Di Konsol Google Cloud, buka halaman BigQuery.
Membuat set data yang bernama
bqml_tutorial
. Anda menggunakan dataset untuk menyimpan database objek, termasuk tabel dan model.Untuk mengaktifkan fitur Gemini di BigQuery yang Anda perlukan untuk menyelesaikan tutorial ini, di toolbar BigQuery, klik pen_spark Gemini, lalu pilih opsi berikut:
- Pelengkapan otomatis
- Pembuatan otomatis
- Explanation
Pelajari kemampuan BigQuery
Sebelum memulai, pertimbangkan bahwa Anda ingin mempelajari lebih lanjut cara BigQuery menangani kueri data. Untuk mendapatkan bantuan, Anda dapat mengirim pernyataan bahasa alami (atau perintah) ke Gemini di BigQuery seperti berikut:
- "How do I get started with BigQuery?"
- "What are the benefits of using BigQuery for data analysis?"
- "How does BigQuery handle auto-scaling for queries?"
Gemini di BigQuery juga dapat memberikan informasi tentang cara menganalisis data Anda. Untuk jenis bantuan tersebut, Anda dapat mengirim perintah seperti berikut:
- "How do I create a time series forecasting model in BigQuery?"
- "How do I load different types of data into BigQuery?"
Mengakses dan menganalisis data
Gemini di BigQuery dapat membantu Anda mengetahui data yang dapat diakses untuk analisis, dan cara menganalisis data tersebut.
Untuk contoh ini, anggaplah Anda memerlukan bantuan terkait hal berikut:
- Menemukan dataset dan tabel penjualan untuk dianalisis.
- Mengetahui bagaimana tabel dan kueri data terkait dalam dataset penjualan.
- Memahami kueri kompleks dan menulis kueri yang menggunakan dataset.
Menemukan data
Sebelum dapat membuat kueri data, Anda perlu mengetahui data apa yang dapat Anda akses. Setiap produk data mengatur dan menyimpan data dengan cara yang berbeda.
Untuk mendapatkan bantuan, Anda dapat mengirim Gemini di BigQuery prompt seperti "Bagaimana cara mempelajari dataset dan tabel mana yang tersedia untuk saya BigQuery?"
Di Konsol Google Cloud, buka halaman BigQuery.
Di toolbar konsol Google Cloud, klik spark Open or close Gemini AI chat.
Di panel Gemini, masukkan perintah
How do I learn which datasets and tables are available to me in BigQuery?
.Klik send Kirim perintah.
Pelajari cara dan waktu Gemini untuk Google Cloud menggunakan data Anda.
Respons mencakup beberapa cara untuk menampilkan daftar project, set data, atau tabel dalam sebuah dataset.
Opsional: Untuk mereset histori percakapan Anda, di panel Gemini, klik delete Clear chat, lalu klik Reset chat.
Memahami dan menulis SQL di BigQuery
Untuk contoh ini, asumsikan bahwa Anda memilih data untuk dianalisis dan sekarang ingin mengkueri data tersebut. Gemini di BigQuery dapat membantu Anda menggunakan SQL—baik untuk membantu Anda memahami kueri yang kompleks dan sulit diuraikan, maupun untuk membuat kueri SQL baru.
Meminta bantuan Gemini untuk menjelaskan kueri SQL
Misalnya, Anda ingin memahami kueri kompleks yang ditulis orang lain. Gemini di BigQuery dapat menjelaskan kueri dalam bahasa sederhana—seperti sintaksis kueri, skema dasar, dan konteks bisnis.
Di Konsol Google Cloud, buka halaman BigQuery.
Di editor kueri, buka atau tempel kueri yang ingin Anda minta untuk dijelaskan. Contoh:
SELECT u.id AS user_id, u.first_name, u.last_name, avg(oi.sale_price) AS avg_sale_price FROM `bigquery-public-data.thelook_ecommerce.users` AS u JOIN `bigquery-public-data.thelook_ecommerce.order_items` AS oi ON u.id = oi.user_id GROUP BY 1, 2, 3 ORDER BY avg_sale_price DESC LIMIT 10
Tandai kueri, lalu klik auto_awesome Jelaskan kueri yang dipilih ini.
Di panel Gemini, respons yang ditampilkan mirip dengan berikut:
The intent of this query is to find the top 10 users by average sale price. The query first joins the users and order_items tables on the user_id column. It then groups the results by user_id, first_name, and last_name, and calculates the average sale price for each group. The results are then ordered by average sale price in descending order, and the top 10 results are returned.
Membuat kueri SQL yang mengelompokkan penjualan berdasarkan hari dan produk
Dalam contoh ini, Anda ingin membuat kueri yang mencantumkan produk unggulan Anda untuk
setiap hari. Kemudian, Anda menggunakan tabel dalam set data thelook_ecommerce
dan meminta Gemini di BigQuery untuk membuat kueri agar dapat menghitung penjualan berdasarkan item pesanan dan nama produk.
Jenis kueri ini biasanya kompleks, tetapi dengan menggunakan Gemini di BigQuery, Anda dapat membuat pernyataan secara otomatis. Anda dapat memberikan perintah untuk membuat kueri SQL berdasarkan skema data Anda. Meskipun Anda memulai tanpa kode, memiliki pengetahuan terbatas tentang skema data, atau hanya memiliki pengetahuan dasar tentang sintaksis SQL, bantuan Gemini dapat menyarankan satu atau beberapa pernyataan SQL.
Untuk meminta Gemini di BigQuery membuat kueri yang mencantumkan produk teratas Anda, ikuti langkah-langkah berikut:
Di Konsol Google Cloud, buka halaman BigQuery.
Di Navigation menu, klik BigQuery Studio.
Klik
Kueri SQL. Panel Explorer secara otomatis memuat database yang dipilih.Di editor kueri, masukkan perintah berikut, lalu tekan Enter:
# select the sum of sales by date and product casted to day from bigquery-public-data.thelook_ecommerce.order_items joined with bigquery-public-data.thelook_ecommerce.products
Karakter tanda pagar (
#
) meminta Gemini di BigQuery untuk membuat SQL. Gemini di BigQuery menyarankan kueri SQL yang mirip dengan contoh berikut:SELECT sum(sale_price), DATE(created_at), product_id FROM `bigquery-public-data.thelook_ecommerce.order_items` AS t1 INNER JOIN `bigquery-public-data.thelook_ecommerce.products` AS t2 ON t1.product_id = t2.id GROUP BY 2, 3
Untuk menerima kode yang disarankan, klik Tab, lalu klik Run untuk menjalankan pernyataan SQL. Anda juga dapat men-scroll SQL yang disarankan dan menerima kata-kata tertentu yang disarankan dalam pernyataan.
Di panel Query results, lihat hasil kueri.
Membuat model perkiraan dan melihat hasilnya
Dalam contoh ini, Anda menggunakan BigQuery ML untuk melakukan hal berikut:
- Gunakan kueri tren untuk membuat model perkiraan.
- Gunakan Gemini di BigQuery untuk menjelaskan dan membantu Anda menulis kueri agar dapat melihat hasil model perkiraan.
Anda menggunakan contoh kueri berikut dengan penjualan sebenarnya, yang digunakan sebagai input ke model. Kueri digunakan sebagai bagian dari pembuatan model ML.
Untuk membuat model ML perkiraan, di editor kueri, jalankan kueri SQL berikut:
CREATE MODEL bqml_tutorial.sales_forecasting_model OPTIONS ( MODEL_TYPE = 'ARIMA_PLUS', time_series_timestamp_col = 'date_col', time_series_data_col = 'total_sales', time_series_id_col = 'product_id') AS SELECT sum(sale_price) AS total_sales, DATE(created_at) AS date_col, product_id FROM `bigquery-public-data.thelook_ecommerce.order_items` AS t1 INNER JOIN `bigquery-public-data.thelook_ecommerce.products` AS t2 ON t1.product_id = t2.id GROUP BY 2, 3;
Anda dapat menggunakan Gemini di BigQuery untuk membantu Anda memahami kueri ini.
Saat model dibuat, tab Results di panel Query results akan menampilkan pesan yang mirip dengan berikut ini:
Successfully created model named sales_forecasting_model.
Di panel Gemini, masukkan perintah untuk Gemini di BigQuery untuk membantu Anda menulis kueri guna mendapatkan perkiraan model saat sudah selesai—misalnya, masukkan
How can I get a forecast in SQL from the model?
Berdasarkan konteks perintah tersebut, respons akan menyertakan contoh model ML yang memperkirakan penjualan:
SELECT * FROM ML.FORECAST( MODEL `PROJECT_ID.bqml_tutorial.sales_forecasting_model`, STRUCT( 7 AS horizon, 0.95 AS confidence_level))
Dalam respons ini,
PROJECT_ID
adalah project Google Cloud Anda.Di panel Gemini, salin kueri SQL.
Di editor kueri, jalankan kueri SQL.
Pembersihan
Agar tidak menimbulkan biaya pada akun Google Cloud Anda untuk resource yang digunakan dalam tutorial ini, Anda dapat menghapus project Google Cloud yang Anda buat untuk tutorial ini. Atau, Anda dapat menghapus resource satu per satu.
Hapus project
- Di konsol Google Cloud, buka halaman Manage resource.
- Pada daftar project, pilih project yang ingin Anda hapus, lalu klik Delete.
- Pada dialog, ketik project ID, lalu klik Shut down untuk menghapus project.
Menghapus set data
Jika project Anda dihapus, semua set data dan semua tabel dalam project akan dihapus. Jika Anda memilih untuk menggunakan kembali proyek, maka Anda dapat menghapus dataset yang telah dibuat di dalam tutorial ini.
Di Konsol Google Cloud, buka halaman BigQuery.
Di menu navigasi, pilih set data
bqml_tutorial
yang Anda buat.Untuk menghapus set data, tabel, dan semua data, klik Hapus set data.
Untuk mengonfirmasi penghapusan, pada dialog Delete dataset, ketik nama set data Anda (
bqml_tutorial
), lalu klik Delete.
Langkah selanjutnya
- Baca Ringkasan Gemini untuk Google Cloud.
- Pelajari kuota dan batas Gemini untuk Google Cloud.
- Pelajari lokasi untuk Gemini untuk Google Cloud.