Pengantar tata kelola data di BigQuery
Dokumen ini berisi pengantar tata kelola data BigQuery dan menjelaskan cara menggunakan fitur BigQuery untuk menerapkan dan menegakkan kebijakan tata kelola data BigQuery. Untuk ringkasan yang lebih komprehensif tentang tata kelola data di Google Cloud, lihat Apa itu tata kelola data?
Tata kelola data adalah pengelolaan keamanan dan kualitas data di sepanjang siklus prosesnya untuk memastikan bahwa akses dan akurasi sesuai dengan kebijakan dan peraturan organisasi. Prioritas tata kelola data ini dapat dibagi menjadi tiga kategori:
Bagian berikut menentukan kategori tata kelola data ini, membahas cara fitur BigQuery mendukungnya, dan merekomendasikan langkah berikutnya untuk Anda.
Kontrol akses
Pengelolaan akses data adalah proses penentuan, penerapan, dan pemantauan aturan dan kebijakan yang mengatur siapa yang memiliki akses ke data. Pengelolaan akses memastikan bahwa data hanya dapat diakses oleh orang yang memiliki otorisasi untuk mengaksesnya. BigQuery menyediakan fitur berikut untuk membantu Anda mengakses data:
- Identity and Access Management (IAM). IAM memungkinkan Anda mengontrol siapa yang memiliki akses ke resource BigQuery Anda seperti project, set data, tabel, dan tampilan. Anda dapat memberikan peran IAM kepada pengguna, grup, dan akun layanan. Peran ini menentukan hal yang dapat mereka lakukan dengan resource Anda.
- Kontrol akses tingkat kolom dan kontrol akses tingkat baris. Kontrol akses tingkat kolom dan tingkat baris memungkinkan Anda membatasi akses ke kolom dan baris tertentu dalam tabel, berdasarkan atribut pengguna atau nilai data. Kontrol ini memungkinkan Anda menerapkan akses terperinci untuk membantu melindungi data sensitif dari akses yang tidak sah.
- Pengelolaan transfer data. Kontrol Layanan VPC memungkinkan Anda membuat perimeter di sekitar resource Google Cloud dan mengontrol akses ke resource tersebut berdasarkan kebijakan organisasi Anda.
- Log audit. Log audit memberi Anda data aktivitas pengguna dan peristiwa sistem yang mendetail di organisasi Anda. Log ini membantu Anda menerapkan kebijakan tata kelola data dan mengidentifikasi potensi risiko keamanan.
Langkah berikutnya untuk kontrol akses
Tabel berikut menguraikan langkah berikutnya yang dapat Anda lakukan untuk mempelajari lebih lanjut fitur kontrol akses:
Tingkat pengalaman | Jalur pembelajaran |
---|---|
Pengguna cloud baru |
|
Pengguna cloud berpengalaman |
|
Data stewardship
Pengelolaan data membantu melindungi data sensitif dengan mengkategorikan, menyamarkan, menyamarkan, atau mengenkripsinya dengan tepat selama kueri, pengiriman, atau penyimpanan. Pendekatan ini meningkatkan perlindungan dan pengaturan data. BigQuery menyediakan fitur berikut untuk membantu Anda dalam pengelolaan data:
- Data masking. Penyamaran data memungkinkan Anda menyamarkan data sensitif dalam tabel sekaligus mengizinkan pengguna yang diotorisasi untuk mengakses data di sekitarnya. Fitur ini juga dapat menyembunyikan data yang cocok dengan pola data sensitif, sehingga melindungi dari pengungkapan data yang tidak disengaja.
- Enkripsi. BigQuery secara otomatis mengenkripsi semua data dalam penyimpanan dan saat dalam pengiriman, sekaligus memungkinkan Anda menyesuaikan setelan enkripsi untuk memenuhi kebutuhan dan persyaratan khusus Anda.
- Pengelolaan metadata. Pengelolaan metadata memungkinkan Anda memberi tag pada resource, yang pada akhirnya membantu Anda dalam penelusuran, pengaturan, dan kategorisasi data.
Langkah berikutnya untuk pengelolaan data
Tabel berikut menguraikan langkah berikutnya yang dapat Anda lakukan untuk mempelajari lebih lanjut fitur pengelolaan data:
Tingkat pengalaman | Jalur pembelajaran |
---|---|
Pengguna cloud baru |
|
Pengguna cloud berpengalaman |
|
Kualitas data
Pengelolaan kualitas data adalah proses melacak garis keturunan data dan memastikan data memenuhi standar akurasi, kelengkapan, dan konsistensi Anda. BigQuery menyediakan fitur berikut untuk membantu Anda terkait kualitas data:
- Linimasa data. Silsilah data memungkinkan Anda melacak alur data dari waktu ke waktu, memberikan insight tentang asal data, perubahannya dari waktu ke waktu, dan tujuan akhirnya dalam sistem Anda.
- Pemindaian profil data. Pemindaian profil data memungkinkan Anda menganalisis karakteristik statistik data, seperti nilai rata-rata dan unik.
- Pemindaian kualitas data. Pemindaian kualitas data memungkinkan Anda melakukan pemeriksaan data, memvalidasi data berdasarkan aturan yang ditentukan, dan memecahkan masalah kualitas data.
Langkah berikutnya untuk kualitas data
Tabel berikut menguraikan langkah berikutnya yang dapat Anda lakukan untuk mempelajari lebih lanjut fitur kualitas data akses:
Tingkat pengalaman | Jalur pembelajaran |
---|---|
Pengguna cloud baru |
|
Pengguna cloud berpengalaman |
|
Langkah selanjutnya
- Pelajari autentikasi di Google.
- Pelajari penghapusan data di Google Cloud.
- Pelajari lebih lanjut praktik terbaik IAM.
- Pelajari hierarki resource di Google Cloud.
- Pelajari IAM di Google Cloud.