Fungsi agregat yang ditentukan pengguna
Untuk dukungan selama pratinjau, kirim email ke bigquery-sql-preview-support@google.com.
Dokumen ini menjelaskan cara membuat, memanggil, dan menghapus fungsi agregat yang ditetapkan pengguna (UDAF) di BigQuery.
UDAF memungkinkan Anda membuat fungsi agregat menggunakan ekspresi yang berisi kode. UDAF menerima kolom input, melakukan penghitungan pada sekelompok baris dalam satu waktu, lalu menampilkan hasil penghitungan tersebut sebagai satu nilai.
Membuat UDAF SQL
Bagian ini menjelaskan berbagai cara untuk membuat UDAF SQL persisten atau sementara di BigQuery.
Membuat UDAF SQL persisten
Anda dapat membuat UDAF SQL yang persisten, artinya Anda dapat menggunakan kembali UDAF tersebut pada beberapa kueri. UDAF persisten aman untuk dipanggil jika dibagikan di antara pemilik. UDAF tidak dapat mengubah data, berkomunikasi dengan sistem eksternal, atau mengirim log ke Kemampuan observasi Google Cloud atau aplikasi serupa.
Untuk membuat UDAF persisten, gunakan pernyataan CREATE AGGREGATE FUNCTION
tanpa kata kunci TEMP
atau TEMPORARY
. Anda harus menyertakan set data di jalur fungsi.
Misalnya, kueri berikut membuat UDAF persisten yang disebut
ScaledAverage
:
CREATE AGGREGATE FUNCTION myproject.mydataset.ScaledAverage( dividend FLOAT64, divisor FLOAT64) RETURNS FLOAT64 AS ( AVG(dividend / divisor) );
Membuat UDAF SQL sementara
Anda dapat membuat UDAF SQL yang bersifat sementara, yang berarti UDAF hanya ada dalam cakupan kueri, skrip, sesi, atau prosedur tunggal.
Untuk membuat UDAF sementara, gunakan pernyataan CREATE AGGREGATE FUNCTION
dengan kata kunci TEMP
atau TEMPORARY
.
Misalnya, kueri berikut membuat UDAF sementara yang disebut
ScaledAverage
:
CREATE TEMP AGGREGATE FUNCTION ScaledAverage( dividend FLOAT64, divisor FLOAT64) RETURNS FLOAT64 AS ( AVG(dividend / divisor) );
Menggunakan parameter gabungan dan non-agregat
Anda dapat membuat UDAF SQL yang memiliki parameter agregat dan non-agregat.
UDAF biasanya menggabungkan parameter fungsi di semua baris dalam grup.
Namun, Anda dapat menentukan parameter fungsi sebagai non-agregat dengan kata kunci NOT AGGREGATE
.
Parameter fungsi non-agregasi adalah parameter fungsi skalar dengan nilai konstan untuk semua baris dalam grup. Parameter fungsi non-agregasi yang valid harus berupa literal. Di dalam definisi UDAF, parameter fungsi agregat hanya dapat muncul sebagai argumen fungsi untuk menggabungkan panggilan fungsi. Referensi ke parameter fungsi non-agregat dapat muncul di mana saja dalam definisi UDAF.
Misalnya, fungsi berikut berisi parameter agregat yang disebut dividend
, dan parameter non-gabungan yang disebut divisor
:
-- Create the function. CREATE TEMP AGGREGATE FUNCTION ScaledSum( dividend FLOAT64, divisor FLOAT64 NOT AGGREGATE) RETURNS FLOAT64 AS ( SUM(dividend) / divisor );
Menggunakan project default dalam isi fungsi
Dalam isi UDAF SQL, semua referensi ke entity BigQuery, seperti tabel atau tampilan, harus menyertakan project ID kecuali jika entity tersebut berada dalam project yang sama yang berisi UDAF.
Misalnya, perhatikan pernyataan berikut:
CREATE AGGREGATE FUNCTION project1.dataset_a.ScaledAverage( dividend FLOAT64, divisor FLOAT64) RETURNS FLOAT64 AS ( ( SELECT AVG(dividend / divisor) FROM dataset_a.my_table ) );
Jika Anda menjalankan pernyataan sebelumnya dalam project project1
, pernyataan tersebut
akan berhasil karena my_table
ada di project1
. Namun, jika Anda menjalankan
pernyataan sebelumnya dari project yang berbeda, pernyataan tersebut akan gagal.
Untuk memperbaiki error tersebut, sertakan project ID dalam referensi tabel:
CREATE AGGREGATE FUNCTION project1.dataset_a.ScaledAverage( dividend FLOAT64, divisor FLOAT64) RETURNS FLOAT64 AS ( ( SELECT AVG(dividend / divisor) FROM project1.dataset_a.my_table ) );
Anda juga dapat mereferensikan entity dalam project atau set data yang berbeda dengan set data tempat Anda membuat fungsi:
CREATE AGGREGATE FUNCTION project1.dataset_a.ScaledAverage( dividend FLOAT64, divisor FLOAT64) RETURNS FLOAT64 AS ( ( SELECT AVG(dividend / divisor) FROM project2.dataset_c.my_table ) );
Memanggil UDAF SQL
Bagian ini menjelaskan berbagai cara memanggil UDAF SQL persisten atau sementara setelah membuatnya di BigQuery.
Memanggil UDAF SQL persisten
Anda dapat memanggil UDAF SQL persisten dengan cara yang sama seperti memanggil fungsi agregat bawaan. Untuk informasi selengkapnya, lihat Aturan panggilan fungsi. Anda harus menyertakan set data di jalur fungsi.
Misalnya, kueri berikut memanggil UDAF persisten yang disebut ScaledAverage
:
SELECT myproject.mydataset.ScaledAverage(col1, 2) AS scaled_avg FROM ( SELECT 1 AS col1 UNION ALL SELECT 3 AS col1 UNION ALL SELECT 5 AS col1 );
Tabel dengan hasil berikut dihasilkan:
/*------------*
| scaled_avg |
+------------+
| 1.5 |
*------------*/
Memanggil UDAF SQL sementara
Anda dapat memanggil UDAF SQL sementara dengan cara yang sama seperti memanggil fungsi agregat bawaan. Untuk mengetahui detailnya, lihat Aturan panggilan fungsi.
Misalnya, kueri berikut memanggil UDAF sementara yang disebut
ScaledAverage
:
SELECT ScaledAverage(col1, 2) AS scaled_avg FROM ( SELECT 1 AS col1 UNION ALL SELECT 3 AS col1 UNION ALL SELECT 5 AS col1 );
Tabel dengan hasil berikut dihasilkan:
/*------------*
| scaled_avg |
+------------+
| 1.5 |
*------------*/
Menghapus UDAF SQL
Bagian ini menjelaskan berbagai cara menghapus UDAF SQL persisten atau sementara setelah membuatnya di BigQuery.
Menghapus UDAF SQL persisten
Untuk menghapus UDAF SQL, gunakan
pernyataan DROP FUNCTION
.
Anda harus menyertakan set data di jalur fungsi.
Misalnya, kueri berikut menghapus UDAF persisten yang disebut ScaledAverage
:
DROP FUNCTION IF EXISTS myproject.mydataset.ScaledAverage;
Menghapus UDAF SQL sementara
Untuk menghapus UDAF sementara, gunakan
pernyataan DROP FUNCTION
.
Misalnya, kueri berikut menghapus UDAF sementara yang disebut ScaledAverage
:
DROP FUNCTION IF EXISTS ScaledAverage;
UDAF sementara akan berakhir segera setelah kueri selesai, dan UDAF tidak perlu dihapus kecuali jika Anda ingin menghapusnya lebih awal dari kueri multi-pernyataan atau prosedur.
Mencantumkan UDAF
UDAF adalah jenis rutinitas. Untuk mencantumkan semua rutinitas dalam set data, lihat Mencantumkan rutinitas.
Batasan
UDAF SQL memiliki batasan yang sama dengan UDF. Untuk mengetahui detailnya, lihat Batasan UDF.
Hanya literal yang dapat diteruskan sebagai argumen non-agregat untuk SQL UDAF.
Harga
UDAF ditagih menggunakan model harga BigQuery standar.
Kuota dan batas
UDAF memiliki kuota dan batas yang sama dengan yang berlaku untuk UDF. Untuk mengetahui informasi tentang kuota UDF, lihat Kuota dan batas.