Pengantar tata kelola data di BigQuery

Dokumen ini memberikan pengantar tata kelola data BigQuery dan menjelaskan cara menggunakan fitur BigQuery untuk menerapkan dan menegakkan kebijakan tata kelola data BigQuery. Untuk ringkasan yang lebih komprehensif tentang tata kelola data di Google Cloud, lihat Apa yang dimaksud dengan tata kelola data?

Tata kelola data adalah pengelolaan keamanan dan kualitas data di sepanjang siklus prosesnya untuk memastikan bahwa akses dan akurasinya sesuai dengan kebijakan dan peraturan organisasi. Prioritas tata kelola data ini dapat dipecah menjadi tiga kategori:

Bagian berikut menentukan kategori tata kelola data tersebut, membahas cara fitur BigQuery mendukungnya, dan merekomendasikan langkah selanjutnya untuk Anda.

Kontrol akses

Pengelolaan akses data adalah proses menentukan, menerapkan, dan memantau aturan serta kebijakan yang mengatur siapa yang memiliki akses ke data. Pengelolaan akses memastikan bahwa data hanya dapat diakses oleh mereka yang berwenang untuk mengaksesnya. BigQuery menyediakan fitur berikut untuk membantu Anda mengakses data:

  • Identity and Access Management (IAM). Dengan IAM, Anda dapat mengontrol siapa saja yang memiliki akses ke resource BigQuery, seperti project, set data, tabel, dan tampilan. Anda dapat memberikan peran IAM kepada pengguna, grup, dan akun layanan. Peran ini menentukan hal yang dapat dilakukannya dengan resource Anda.
  • Kontrol akses tingkat kolom dan kontrol akses tingkat baris. Kontrol akses tingkat kolom dan tingkat baris memungkinkan Anda membatasi akses ke kolom dan baris tertentu dalam tabel, berdasarkan atribut pengguna atau nilai data. Kontrol ini memungkinkan Anda menerapkan akses terperinci untuk membantu melindungi data sensitif dari akses yang tidak sah.
  • Pengelolaan transfer data. Dengan Kontrol Layanan VPC, Anda dapat membuat perimeter di seputar resource Google Cloud dan mengontrol akses ke resource tersebut berdasarkan kebijakan organisasi Anda.
  • Log audit. Log audit memberi Anda data mendetail tentang aktivitas pengguna dan peristiwa sistem di organisasi Anda. Log ini membantu Anda menegakkan kebijakan tata kelola data dan mengidentifikasi potensi risiko keamanan.

Langkah berikutnya untuk kontrol akses

Tabel berikut menguraikan langkah selanjutnya yang dapat Anda lakukan untuk mempelajari fitur kontrol akses lebih lanjut:

Tingkat pengalaman Jalur pembelajaran
Pengguna cloud baru
Pengguna cloud berpengalaman
  • Untuk fleksibilitas dan perincian yang lebih besar dalam mengelola izin, pertimbangkan untuk membuat peran khusus yang sesuai dengan kebutuhan Anda.
  • Tambahkan baris dan kontrol kolom untuk membantu mengontrol akses ke baris dan kolom tertentu di tabel Anda.
  • Tetapkan perimeter akses di seputar resource Google Cloud Anda dengan menyiapkan Kontrol Layanan VPC.

Pengelolaan data

Pengelolaan data membantu mengamankan data sensitif dengan mengategorikan, menyamarkan, menyamarkan, atau mengenkripsinya secara tepat selama pembuatan kueri, transit, atau penyimpanan. Pendekatan ini meningkatkan perlindungan data dan organisasi. BigQuery menyediakan fitur berikut untuk membantu Anda pengelolaan data:

  • Data masking. Data masking memungkinkan Anda menyamarkan data sensitif dalam tabel, sekaligus tetap mengizinkan pengguna yang diberi otorisasi untuk mengakses data di sekitarnya. Fitur ini juga dapat menyembunyikan data yang cocok dengan pola data sensitif, sehingga melindungi dari pengungkapan data yang tidak disengaja.
  • Enkripsi. BigQuery secara otomatis mengenkripsi semua data dalam penyimpanan dan saat transit, sekaligus memungkinkan Anda menyesuaikan setelan enkripsi untuk memenuhi kebutuhan dan persyaratan khusus Anda.
  • Pengelolaan metadata. Pengelolaan metadata memungkinkan Anda memberi tag pada resource, yang pada akhirnya membantu Anda dalam penelusuran, pengaturan, dan kategorisasi data.

Langkah selanjutnya untuk pengelolaan data

Tabel berikut menguraikan langkah selanjutnya yang dapat Anda lakukan untuk mempelajari fitur pengelolaan data lebih lanjut:

Tingkat pengalaman Jalur pembelajaran
Pengguna cloud baru
Pengguna cloud berpengalaman
  • Tambahkan data masking tingkat kolom ke tabel Anda untuk mempermudah berbagi informasi melalui organisasi Anda tanpa mengungkapkan data sensitif.
  • Gunakan Perlindungan Data Sensitif untuk memindai data Anda guna menemukan informasi sensitif dan berisiko tinggi, seperti informasi identitas pribadi (PII), data keuangan, dan informasi kesehatan.

Kualitas data

Pengelolaan kualitas data adalah proses pelacakan silsilah data dan memastikan bahwa data memenuhi standar akurasi, kelengkapan, dan konsistensi Anda. BigQuery menyediakan fitur berikut untuk membantu Anda terkait kualitas data:

  • Garis keturunan data. Silsilah data memungkinkan Anda melacak aliran data dari waktu ke waktu, memberikan insight tentang asal data, perubahannya dari waktu ke waktu, dan tujuan akhirnya dalam sistem Anda.
  • Pemindaian profil data. Pemindaian profil data memungkinkan Anda menganalisis karakteristik statistik data, seperti nilai rata-rata dan nilai unik.
  • Pemindaian kualitas data. Pemindaian kualitas data memungkinkan Anda melakukan pemeriksaan data, memvalidasi data terhadap aturan yang ditetapkan, dan memecahkan masalah kualitas data.

Langkah selanjutnya untuk kualitas data

Tabel berikut menguraikan langkah selanjutnya yang dapat Anda lakukan untuk mempelajari fitur kualitas data akses lebih lanjut:

Tingkat pengalaman Jalur pembelajaran
Pengguna cloud baru
  • Jalankan pemindaian profil data untuk mendapatkan insight tentang data Anda, termasuk batas atau rata-rata data Anda.
Pengguna cloud berpengalaman

Langkah selanjutnya