Pengantar tata kelola data di BigQuery

Dokumen ini berisi pengantar tata kelola data BigQuery dan menjelaskan cara menggunakan fitur BigQuery untuk menerapkan dan menegakkan kebijakan tata kelola data BigQuery. Untuk ringkasan yang lebih lengkap tentang tata kelola data di Google Cloud, lihat Apa itu tata kelola data?

Tata kelola data adalah pengelolaan keamanan dan kualitas data di sepanjang siklus prosesnya untuk memastikan bahwa akses dan akurasi sesuai dengan kebijakan dan peraturan organisasi. Prioritas tata kelola data ini dapat dibagi menjadi tiga kategori:

Bagian berikut menentukan kategori tata kelola data ini, membahas cara fitur BigQuery mendukungnya, dan merekomendasikan langkah berikutnya untuk Anda.

Kontrol akses

Pengelolaan akses data adalah proses menentukan, menerapkan, dan memantau aturan dan kebijakan yang mengatur siapa yang memiliki akses ke data. Pengelolaan akses memastikan bahwa data hanya dapat diakses oleh orang yang memiliki otorisasi untuk mengaksesnya. BigQuery menyediakan fitur berikut untuk membantu Anda mengakses data:

  • Identity and Access Management (IAM). IAM memungkinkan Anda mengontrol siapa yang memiliki akses ke resource BigQuery Anda seperti project, set data, tabel, dan tampilan. Anda dapat memberikan peran IAM kepada pengguna, grup, dan akun layanan. Peran ini menentukan hal yang dapat mereka lakukan dengan resource Anda.
  • Kontrol akses tingkat kolom dan kontrol akses tingkat baris. Kontrol akses tingkat kolom dan tingkat baris memungkinkan Anda membatasi akses ke kolom dan baris tertentu dalam tabel, berdasarkan atribut pengguna atau nilai data. Kontrol ini memungkinkan Anda menerapkan akses terperinci untuk membantu melindungi data sensitif dari akses yang tidak sah.
  • Pengelolaan transfer data. Kontrol Layanan VPC memungkinkan Anda membuat perimeter di sekitar resource Google Cloud dan mengontrol akses ke resource tersebut berdasarkan kebijakan organisasi Anda.
  • Log audit. Log audit memberi Anda data aktivitas pengguna dan peristiwa sistem yang mendetail di organisasi Anda. Log ini membantu Anda menerapkan kebijakan tata kelola data dan mengidentifikasi potensi risiko keamanan.

Langkah berikutnya untuk kontrol akses

Tabel berikut menguraikan langkah berikutnya yang dapat Anda lakukan untuk mempelajari lebih lanjut fitur kontrol akses:

Tingkat pengalaman Jalur pembelajaran
Pengguna cloud baru
Pengguna cloud berpengalaman
  • Untuk fleksibilitas dan perincian yang lebih besar dalam mengelola izin, pertimbangkan untuk membuat peran kustom yang sesuai dengan kebutuhan Anda.
  • Tambahkan kontrol baris dan kolom untuk membantu mengontrol akses ke baris dan kolom tertentu dalam tabel Anda.
  • Buat perimeter akses di sekitar resource Google Cloud Anda dengan menyiapkan Kontrol Layanan VPC.

Data stewardship

Pengelolaan data membantu melindungi data sensitif dengan mengkategorikan, menyamarkan, menyamarkan, atau mengenkripsinya dengan tepat selama kueri, pengiriman, atau penyimpanan. Pendekatan ini meningkatkan perlindungan dan pengaturan data. BigQuery menyediakan fitur berikut untuk membantu Anda dalam pengelolaan data:

  • Data masking. Penyamaran data memungkinkan Anda menyamarkan data sensitif dalam tabel sekaligus mengizinkan pengguna yang diotorisasi untuk mengakses data di sekitarnya. Fitur ini juga dapat menyembunyikan data yang cocok dengan pola data sensitif, sehingga melindungi dari pengungkapan data yang tidak disengaja.
  • Enkripsi. BigQuery secara otomatis mengenkripsi semua data dalam penyimpanan dan saat dalam pengiriman, sekaligus memungkinkan Anda menyesuaikan setelan enkripsi untuk memenuhi kebutuhan dan persyaratan khusus Anda.
  • Pengelolaan metadata. Pengelolaan metadata memungkinkan Anda memberi tag pada resource, yang pada akhirnya membantu Anda dalam penelusuran, pengaturan, dan kategorisasi data.

Langkah berikutnya untuk pengelolaan data

Tabel berikut menguraikan langkah berikutnya yang dapat Anda lakukan untuk mempelajari lebih lanjut fitur pengelolaan data:

Tingkat pengalaman Jalur pembelajaran
Pengguna cloud baru
Pengguna cloud berpengalaman
  • Tambahkan masking data tingkat kolom ke tabel Anda untuk mempermudah berbagi informasi melalui organisasi Anda tanpa mengungkapkan data sensitif.
  • Gunakan Perlindungan Data Sensitif untuk memindai data Anda guna menemukan informasi sensitif dan berisiko tinggi, seperti informasi identitas pribadi (PII), data keuangan, dan informasi kesehatan.

Kualitas data

Pengelolaan kualitas data adalah proses melacak garis keturunan data dan memastikan data memenuhi standar akurasi, kelengkapan, dan konsistensi Anda. BigQuery menyediakan fitur berikut untuk membantu Anda terkait kualitas data:

  • Linimasa data. Silsilah data memungkinkan Anda melacak alur data dari waktu ke waktu, memberikan insight tentang asal data, perubahannya dari waktu ke waktu, dan tujuan akhirnya dalam sistem Anda.
  • Pemindaian profil data. Pemindaian profil data memungkinkan Anda menganalisis karakteristik statistik data, seperti nilai rata-rata dan unik.
  • Pemindaian kualitas data. Pemindaian kualitas data memungkinkan Anda melakukan pemeriksaan data, memvalidasi data berdasarkan aturan yang ditentukan, dan memecahkan masalah kualitas data.

Langkah berikutnya untuk kualitas data

Tabel berikut menguraikan langkah berikutnya yang dapat Anda lakukan untuk mempelajari lebih lanjut fitur kualitas data akses:

Tingkat pengalaman Jalur pembelajaran
Pengguna cloud baru
  • Jalankan pemindaian profil data untuk mendapatkan insight tentang data Anda, termasuk batas atau rata-rata data Anda.
Pengguna cloud berpengalaman

Langkah selanjutnya