Pengantar framework resolusi entity BigQuery

Dokumen ini menjelaskan arsitektur framework resolusi entity BigQuery. Resolusi entity adalah kemampuan untuk mencocokkan kumpulan data di seluruh data bersama yang tidak memiliki ID umum atau untuk meningkatkan kualitas data bersama menggunakan layanan identitas dari partner Google Cloud.

Dokumen ini ditujukan untuk pengguna akhir terkait resolusi entitas (selanjutnya disebut sebagai pengguna akhir) dan penyedia identitas. Untuk mengetahui detail implementasi, lihat Mengonfigurasi dan menggunakan resolusi entity di BigQuery.

Anda dapat menggunakan resolusi entity BigQuery untuk data apa pun yang telah disiapkan sebelum memberikan data ke data clean room. Resolusi entity tersedia dalam model harga sesuai permintaan dan kapasitas serta di semua edisi BigQuery.

Manfaat

Sebagai pengguna akhir, Anda dapat memperoleh manfaat dari resolusi entitas dengan cara berikut:

  • Anda dapat me-resolve entity yang diterapkan tanpa meminta biaya transfer data karena pelanggan atau partner Google Cloud mencocokkan data Anda dengan tabel identitas mereka dan menulis hasil yang cocok ke set data dalam project Anda.
  • Anda tidak perlu mengelola tugas ekstrak, transformasi, dan muat (ETL).

Sebagai penyedia identitas, Anda dapat memanfaatkan penyelesaian entitas dengan cara berikut:

  • Anda dapat menawarkan resolusi entity sebagai penawaran software as a service (SaaS) terkelola di Google Cloud Marketplace.
  • Anda dapat menggunakan grafik identitas eksklusif dan mencocokkan logika tanpa menampilkannya kepada pengguna.

Arsitektur

BigQuery menerapkan resolusi entity menggunakan panggilan fungsi jarak jauh yang mengaktifkan proses resolusi entity di lingkungan penyedia identitas. Data Anda tidak perlu disalin atau dipindahkan selama proses ini. Diagram dan penjelasan berikut menjelaskan alur kerja untuk resolusi entity:

Diagram yang menampilkan dua bagian utama: project pengguna akhir dan project penyedia identitas.

  1. Pengguna akhir memberi akun layanan penyedia identitas akses baca ke set data input mereka, dan akses tulis ke set data output mereka.
  2. Pengguna memanggil fungsi jarak jauh yang mencocokkan data input dengan data grafik identitas penyedia. Parameter yang cocok diteruskan ke penyedia dengan fungsi jarak jauh.
  3. Akun layanan penyedia akan membaca set data input dan memprosesnya.
  4. Akun layanan penyedia menulis hasil resolusi entity ke set data output pengguna.

Bagian berikut menjelaskan komponen pengguna akhir dan project penyedia.

Komponen pengguna akhir

Komponen pengguna akhir meliputi:

  • Panggilan fungsi jarak jauh: panggilan yang menjalankan prosedur yang ditentukan dan diterapkan oleh penyedia identitas. Panggilan ini akan memulai proses resolusi entity.
  • Set data input: set data sumber yang berisi data yang akan dicocokkan. Secara opsional, set data dapat berisi tabel metadata dengan parameter tambahan. Penyedia menentukan persyaratan skema untuk set data input.
  • Set data output: set data tujuan tempat penyedia menyimpan hasil yang cocok sebagai tabel output. Secara opsional, penyedia dapat menulis tabel status tugas yang berisi detail tugas resolusi entity ke set data ini. Set data output bisa sama dengan set data input.

Komponen penyedia identitas

Komponen penyedia identitas mencakup hal berikut:

Langkah selanjutnya