Pengantar framework resolusi entity BigQuery
Dokumen ini menjelaskan arsitektur framework resolusi entity BigQuery. Resolusi entity adalah kemampuan untuk mencocokkan kumpulan data di seluruh data bersama yang tidak memiliki ID umum atau untuk meningkatkan kualitas data bersama menggunakan layanan identitas dari partner Google Cloud.
Dokumen ini ditujukan untuk pengguna akhir terkait resolusi entitas (selanjutnya disebut sebagai pengguna akhir) dan penyedia identitas. Untuk mengetahui detail implementasi, lihat Mengonfigurasi dan menggunakan resolusi entity di BigQuery.
Anda dapat menggunakan resolusi entity BigQuery untuk data apa pun yang telah disiapkan sebelum memberikan data ke data clean room. Resolusi entity tersedia dalam model harga sesuai permintaan dan kapasitas serta di semua edisi BigQuery.
Manfaat
Sebagai pengguna akhir, Anda dapat memperoleh manfaat dari resolusi entitas dengan cara berikut:
- Anda dapat me-resolve entity yang diterapkan tanpa meminta biaya transfer data karena pelanggan atau partner Google Cloud mencocokkan data Anda dengan tabel identitas mereka dan menulis hasil yang cocok ke set data dalam project Anda.
- Anda tidak perlu mengelola tugas ekstrak, transformasi, dan muat (ETL).
Sebagai penyedia identitas, Anda dapat memanfaatkan penyelesaian entitas dengan cara berikut:
- Anda dapat menawarkan resolusi entity sebagai penawaran software as a service (SaaS) terkelola di Google Cloud Marketplace.
- Anda dapat menggunakan grafik identitas eksklusif dan mencocokkan logika tanpa menampilkannya kepada pengguna.
Arsitektur
BigQuery menerapkan resolusi entity menggunakan panggilan fungsi jarak jauh yang mengaktifkan proses resolusi entity di lingkungan penyedia identitas. Data Anda tidak perlu disalin atau dipindahkan selama proses ini. Diagram dan penjelasan berikut menjelaskan alur kerja untuk resolusi entity:
- Pengguna akhir memberi akun layanan penyedia identitas akses baca ke set data input mereka, dan akses tulis ke set data output mereka.
- Pengguna memanggil fungsi jarak jauh yang mencocokkan data input dengan data grafik identitas penyedia. Parameter yang cocok diteruskan ke penyedia dengan fungsi jarak jauh.
- Akun layanan penyedia akan membaca set data input dan memprosesnya.
- Akun layanan penyedia menulis hasil resolusi entity ke set data output pengguna.
Bagian berikut menjelaskan komponen pengguna akhir dan project penyedia.
Komponen pengguna akhir
Komponen pengguna akhir meliputi:
- Panggilan fungsi jarak jauh: panggilan yang menjalankan prosedur yang ditentukan dan diterapkan oleh penyedia identitas. Panggilan ini akan memulai proses resolusi entity.
- Set data input: set data sumber yang berisi data yang akan dicocokkan. Secara opsional, set data dapat berisi tabel metadata dengan parameter tambahan. Penyedia menentukan persyaratan skema untuk set data input.
- Set data output: set data tujuan tempat penyedia menyimpan hasil yang cocok sebagai tabel output. Secara opsional, penyedia dapat menulis tabel status tugas yang berisi detail tugas resolusi entity ke set data ini. Set data output bisa sama dengan set data input.
Komponen penyedia identitas
Komponen penyedia identitas mencakup hal berikut:
- Bidang kontrol: berisi fungsi jarak jauh BigQuery yang mengatur proses pencocokan. Fungsi ini dapat diterapkan sebagai tugas Cloud Run, atau Cloud Function. Bidang kontrol juga dapat berisi layanan lain, seperti autentikasi dan otorisasi.
- Bidang data: berisi set data grafik identitas dan prosedur tersimpan yang mengimplementasikan logika pencocokan penyedia. Prosedur yang disimpan dapat diterapkan sebagai prosedur yang disimpan di SQL atau prosedur yang disimpan Apache Spark. Set data grafik identitas berisi tabel yang cocok dengan data pengguna akhir.
Langkah selanjutnya
- Untuk mempelajari cara menggunakan resolusi entity di project Anda, lihat Mengonfigurasi dan menggunakan resolusi entity di BigQuery.