APPROX_COUNT_DISTINCT

Fungsi APPROX_COUNT_DISTINCT menghitung perkiraan jumlah item unik dalam kolom.

APPROX_COUNT_DISTINCT is only available when your data comes from a BigQuery data source. For other data source types, use COUNT_DISTINCT .

Sintaks

APPROX_COUNT_DISTINCT( X )

Parameter

  • X - kolom atau ekspresi yang berisi item yang akan dihitung.

Cara kerja fungsi APPROX_COUNT_DISTINCT

Fungsi APPROX_COUNT_DISTINCT mengambil satu parameter, yang dapat berupa nama metrik, dimensi, atau ekspresi dari jenis apa pun. APPROX_COUNT_DISTINCT menampilkan perkiraan jumlah item unik dalam kolom atau ekspresi tersebut.

APPROX_COUNT_DISTINCT lebih efisien dalam hal pemrosesan kueri daripada COUNT_DISTINCT, tetapi menampilkan hasil yang kurang tepat. Jika set data Anda sangat besar, atau jika performa laporan Anda lebih penting daripada jumlah yang tepat, pertimbangkan untuk menggunakan APPROX_COUNT_DISTINCT. Menggunakan APPROX_COUNT_DISTINCT alih-alih COUNT_DISTINCT juga dapat membantu mengurangi biaya kueri saat menggunakan sumber data BigQuery.

Untuk penjelasan mendalam tentang cara kerja perkiraan agregasi, lihat dokumentasi BigQuery.

Contoh

APPROX_COUNT_DISTINCT( Page ) - menghitung perkiraan jumlah nilai unik dalam dimensi Halaman.

Batas APPROX_COUNT_DISTINCT

  • Fungsi APPROX_COUNT_DISTINCT hanya tersedia saat digunakan dengan sumber data BigQuery. Khusus Internal Google: APPROX_COUNT_DISTINCT juga tersedia untuk sumber data #plx.
  • Untuk sumber data yang tidak mendukung APPROX_COUNT_DISTINCT, APPROX_COUNT_DISTINCT akan berfungsi seperti COUNT_DISTINCT.
  • Anda tidak dapat menerapkan fungsi ini ke metrik pra-agregasi ( jenis Agregasi Otomatis), atau ke ekspresi yang merupakan hasil dari fungsi agregasi lainnya. Misalnya, formula seperti APPROX_COUNT_DISTINCT(Sessions) di sumber data Google Analytics akan menghasilkan error.