Pengantar tata kelola data di BigQuery
Dokumen ini memberikan pengantar tata kelola data BigQuery dan menjelaskan cara menggunakan fitur BigQuery untuk menerapkan dan menegakkan kebijakan tata kelola data BigQuery. Untuk ringkasan yang lebih komprehensif tentang tata kelola data di Google Cloud, lihat Apa yang dimaksud dengan tata kelola data?
Tata kelola data adalah pengelolaan keamanan dan kualitas data di sepanjang siklus prosesnya untuk memastikan bahwa akses dan akurasinya sesuai dengan kebijakan dan peraturan organisasi. Prioritas tata kelola data ini dapat dipecah menjadi tiga kategori:
Bagian berikut menentukan kategori tata kelola data tersebut, membahas cara fitur BigQuery mendukungnya, dan merekomendasikan langkah selanjutnya untuk Anda.
Kontrol akses
Pengelolaan akses data adalah proses menentukan, menerapkan, dan memantau aturan serta kebijakan yang mengatur siapa yang memiliki akses ke data. Pengelolaan akses memastikan bahwa data hanya dapat diakses oleh mereka yang berwenang untuk mengaksesnya. BigQuery menyediakan fitur berikut untuk membantu Anda mengakses data:
- Identity and Access Management (IAM). Dengan IAM, Anda dapat mengontrol siapa saja yang memiliki akses ke resource BigQuery, seperti project, set data, tabel, dan tampilan. Anda dapat memberikan peran IAM kepada pengguna, grup, dan akun layanan. Peran ini menentukan hal yang dapat dilakukannya dengan resource Anda.
- Kontrol akses tingkat kolom dan kontrol akses tingkat baris. Kontrol akses tingkat kolom dan tingkat baris memungkinkan Anda membatasi akses ke kolom dan baris tertentu dalam tabel, berdasarkan atribut pengguna atau nilai data. Kontrol ini memungkinkan Anda menerapkan akses terperinci untuk membantu melindungi data sensitif dari akses yang tidak sah.
- Pengelolaan transfer data. Dengan Kontrol Layanan VPC, Anda dapat membuat perimeter di seputar resource Google Cloud dan mengontrol akses ke resource tersebut berdasarkan kebijakan organisasi Anda.
- Log audit. Log audit memberi Anda data mendetail tentang aktivitas pengguna dan peristiwa sistem di organisasi Anda. Log ini membantu Anda menegakkan kebijakan tata kelola data dan mengidentifikasi potensi risiko keamanan.
Langkah berikutnya untuk kontrol akses
Tabel berikut menguraikan langkah selanjutnya yang dapat Anda lakukan untuk mempelajari fitur kontrol akses lebih lanjut:
Tingkat pengalaman | Jalur pembelajaran |
---|---|
Pengguna cloud baru |
|
Pengguna cloud berpengalaman |
|
Pengelolaan data
Pengelolaan data membantu mengamankan data sensitif dengan mengategorikan, menyamarkan, menyamarkan, atau mengenkripsinya secara tepat selama pembuatan kueri, transit, atau penyimpanan. Pendekatan ini meningkatkan perlindungan data dan organisasi. BigQuery menyediakan fitur berikut untuk membantu Anda pengelolaan data:
- Data masking. Data masking memungkinkan Anda menyamarkan data sensitif dalam tabel, sekaligus tetap mengizinkan pengguna yang diberi otorisasi untuk mengakses data di sekitarnya. Fitur ini juga dapat menyembunyikan data yang cocok dengan pola data sensitif, sehingga melindungi dari pengungkapan data yang tidak disengaja.
- Enkripsi. BigQuery secara otomatis mengenkripsi semua data dalam penyimpanan dan saat transit, sekaligus memungkinkan Anda menyesuaikan setelan enkripsi untuk memenuhi kebutuhan dan persyaratan khusus Anda.
- Pengelolaan metadata. Pengelolaan metadata memungkinkan Anda memberi tag pada resource, yang pada akhirnya membantu Anda dalam penelusuran, pengaturan, dan kategorisasi data.
Langkah selanjutnya untuk pengelolaan data
Tabel berikut menguraikan langkah selanjutnya yang dapat Anda lakukan untuk mempelajari fitur pengelolaan data lebih lanjut:
Tingkat pengalaman | Jalur pembelajaran |
---|---|
Pengguna cloud baru |
|
Pengguna cloud berpengalaman |
|
Kualitas data
Pengelolaan kualitas data adalah proses pelacakan silsilah data dan memastikan bahwa data memenuhi standar akurasi, kelengkapan, dan konsistensi Anda. BigQuery menyediakan fitur berikut untuk membantu Anda terkait kualitas data:
- Garis keturunan data. Silsilah data memungkinkan Anda melacak aliran data dari waktu ke waktu, memberikan insight tentang asal data, perubahannya dari waktu ke waktu, dan tujuan akhirnya dalam sistem Anda.
- Pemindaian profil data. Pemindaian profil data memungkinkan Anda menganalisis karakteristik statistik data, seperti nilai rata-rata dan nilai unik.
- Pemindaian kualitas data. Pemindaian kualitas data memungkinkan Anda melakukan pemeriksaan data, memvalidasi data terhadap aturan yang ditetapkan, dan memecahkan masalah kualitas data.
Langkah selanjutnya untuk kualitas data
Tabel berikut menguraikan langkah selanjutnya yang dapat Anda lakukan untuk mempelajari fitur kualitas data akses lebih lanjut:
Tingkat pengalaman | Jalur pembelajaran |
---|---|
Pengguna cloud baru |
|
Pengguna cloud berpengalaman |
|
Langkah selanjutnya
- Pelajari autentikasi di Google.
- Pelajari penghapusan data di Google Cloud.
- Pelajari praktik terbaik IAM lebih lanjut.
- Pelajari hierarki resource di Google Cloud.
- Pelajari IAM di Google Cloud.