Ringkasan analisis kontribusi
Anda dapat menggunakan analisis kontribusi, yang juga disebut analisis pendorong utama, untuk menghasilkan insight tentang perubahan pada metrik utama dalam data multidimensi. Misalnya, Anda dapat menggunakan analisis kontribusi untuk melihat perubahan jumlah pendapatan
di dua kuartal, atau membandingkan dua set data pelatihan untuk memahami
perubahan performa model ML. Anda dapat menggunakan pernyataan CREATE MODEL
untuk membuat model analisis kontribusi di BigQuery.
Analisis kontribusi adalah bentuk analisis augmented, yaitu penggunaan kecerdasan buatan (AI) untuk meningkatkan dan mengotomatiskan analisis dan pemahaman data. Analisis kontribusi mencapai salah satu tujuan utama analisis augmented, yaitu membantu pengguna menemukan pola dalam data mereka.
Model analisis kontribusi mendeteksi segmen data yang menunjukkan perubahan yang signifikan secara statistik dalam metrik dari waktu ke waktu, dengan membandingkan set data pengujian dengan set data kontrol. Hal ini memungkinkan Anda melihat perubahan data seiring waktu, lokasi, segmen pelanggan, atau metrik lainnya yang penting bagi Anda. Misalnya, Anda dapat membandingkan snapshot tabel yang diambil pada akhir tahun 2023 dengan snapshot tabel yang diambil pada akhir tahun 2022 untuk melihat perbedaan data selama dua tahun.
Metrik ini adalah nilai numerik yang digunakan model analisis kontribusi untuk mengukur dan membandingkan perubahan antara data pengujian dan kontrol. Anda dapat menentukan metrik yang dapat dijumlahkan atau metrik rasio yang dapat dijumlahkan dengan model analisis kontribusi.
Segmen adalah bagian data yang diidentifikasi oleh kombinasi nilai dimensi tertentu. Misalnya, untuk model analisis kontribusi berdasarkan dimensi store_number
, customer_id
, dan day
, setiap kombinasi unik nilai dimensi tersebut mewakili segmen. Dalam tabel berikut, setiap baris mewakili segmen yang berbeda:
store_number |
customer_id |
day |
toko 1 | ||
toko 1 | pelanggan 1 | |
toko 1 | pelanggan 1 | Senin |
toko 1 | pelanggan 1 | Selasa |
toko 1 | customer 2 | |
toko 2 |
Untuk membuat model segmen terbesar dan paling relevan, tentukan nilai minimum dukungan apriori yang memangkas segmen kecil agar tidak digunakan oleh model. Hal ini juga mengurangi waktu pembuatan model.
Setelah membuat model analisis kontribusi, Anda dapat menggunakan
fungsi ML.GET_INSIGHTS
untuk mengambil informasi metrik yang dihitung oleh model.