Pengantar set data
Halaman ini menyediakan ringkasan set data di BigQuery.
Set data
Set data terdapat dalam project tertentu. Set data adalah container tingkat teratas yang digunakan untuk mengatur dan mengontrol akses ke tabel dan tampilan Anda. Tabel atau tampilan harus merupakan bagian dari set data, jadi Anda harus membuat minimal satu set data sebelum memuat data ke BigQuery.
Gunakan format projectname.datasetname
agar nama set data sepenuhnya memenuhi syarat saat menggunakan GoogleSQL, atau format projectname:datasetname
agar nama set data sepenuhnya memenuhi syarat saat menggunakan alat command line bq.
Lokasi
Anda menentukan lokasi untuk menyimpan data BigQuery saat membuat set data. Untuk mengetahui daftar lokasi set data BigQuery, baca artikel Lokasi BigQuery. Setelah membuat set data, lokasi tidak dapat diubah, tetapi Anda dapat menyalin set data ke lokasi lain, atau memindahkan (membuat ulang) set data secara manual di lokasi lain.
BigQuery memproses kueri di lokasi yang sama dengan set data yang berisi tabel yang Anda buat kuerinya. BigQuery menyimpan data Anda di lokasi yang dipilihsesuai dengan Persyaratan Khusus Layanan.
Retensi data
Set data menggunakan perjalanan waktu bersama dengan periode fail-safe untuk mempertahankan data yang dihapus dan diubah selama jangka waktu singkat, jika Anda perlu memulihkannya. Untuk mengetahui informasi selengkapnya, lihat Retensi data dengan perjalanan waktu dan fail-safe.
Model penagihan penyimpanan
Anda dapat ditagih untuk penyimpanan data BigQuery dalam byte logis atau fisik (terkompresi), atau kombinasi keduanya. Model penagihan penyimpanan yang Anda pilih menentukan harga penyimpanan. Model penagihan penyimpanan yang Anda pilih tidak memengaruhi performa BigQuery. Apa pun model penagihan yang Anda pilih, data Anda akan disimpan sebagai byte fisik.
Anda menetapkan model penagihan penyimpanan di tingkat set data. Jika Anda tidak menentukan model penagihan penyimpanan saat membuat set data, set data tersebut akan menggunakan penagihan penyimpanan logis secara default. Namun, Anda dapat mengubah model penagihan penyimpanan set data setelah membuatnya. Jika Anda mengubah model penagihan penyimpanan set data, Anda harus menunggu 14 hari sebelum dapat mengubah model penagihan penyimpanan lagi.
Jika Anda mengubah model penagihan set data, perlu waktu 24 jam agar perubahan diterapkan. Setiap tabel atau partisi tabel dalam penyimpanan jangka panjang tidak direset ke penyimpanan aktif saat Anda mengubah model penagihan set data. Performa kueri dan latensi kueri tidak terpengaruh oleh perubahan model penagihan set data.
Set data menggunakan penyimpanan perjalanan waktu dan fail-safe untuk retensi data. Penyimpanan perjalanan waktu dan fail-safe ditagih secara terpisah dengan tarif penyimpanan aktif saat Anda menggunakan penagihan penyimpanan fisik, tetapi disertakan dalam tarif dasar yang dikenakan saat Anda menggunakan penagihan penyimpanan logis. Anda dapat mengubah periode perjalanan waktu yang digunakan untuk set data guna menyeimbangkan biaya penyimpanan fisik dengan retensi data. Anda tidak dapat mengubah periode fail-safe. Untuk mengetahui informasi selengkapnya tentang retensi data set, lihat Retensi data dengan perjalanan waktu dan fail-safe. Untuk informasi selengkapnya tentang perkiraan biaya penyimpanan, lihat Memperkirakan penagihan penyimpanan.
Anda tidak dapat mendaftarkan set data dalam penagihan penyimpanan fisik jika organisasi Anda memiliki komitmen slot tarif tetap lama yang berada di region yang sama dengan set data tersebut. Hal ini tidak berlaku untuk komitmen yang dibeli dengan edisi BigQuery.
Set data eksternal
Selain set data BigQuery, Anda dapat membuat set data eksternal, yang merupakan link ke sumber data eksternal:
Perhatikan bahwa set data eksternal juga dikenal sebagai set data gabungan dan kedua istilah tersebut dapat digunakan secara bergantian.
Setelah dibuat, set data eksternal akan berisi tabel dari sumber data eksternal yang dirujuk. Data dari tabel ini tidak disalin ke BigQuery, tetapi dikueri setiap kali digunakan. Untuk mengetahui informasi selengkapnya, lihat Kueri gabungan Spanner.
Batasan
Set data BigQuery memiliki batasan berikut:
- Lokasi data set hanya dapat ditetapkan pada waktu pembuatan. Setelah set data dibuat, lokasinya tidak dapat diubah.
- Semua tabel yang direferensikan dalam kueri harus disimpan dalam set data di lokasi yang sama.
Set data eksternal tidak mendukung habis masa berlaku tabel, replika, perjalanan waktu, pengurutan default, mode pembulatan default, atau opsi untuk mengaktifkan atau menonaktifkan nama tabel yang tidak peka huruf besar/kecil.
Saat Anda menyalin tabel, set data yang berisi tabel sumber dan tabel tujuan harus berada di lokasi yang sama.
Nama set data untuk setiap project harus unik.
Jika Anda mengubah model penagihan penyimpanan set data, Anda harus menunggu 14 hari sebelum dapat mengubah model penagihan penyimpanan lagi.
Anda tidak dapat mendaftarkan set data dalam penagihan penyimpanan fisik jika memiliki komitmen slot tarif tetap lama yang berada di region yang sama dengan set data.
Kuota
Untuk mengetahui informasi lebih lanjut mengenai kuota dan batas set data, baca Kuota dan batas.
Harga
Anda tidak dikenai biaya untuk membuat, memperbarui, atau menghapus set data.
Untuk mengetahui informasi tentang harga BigQuery, lihat Harga.
Keamanan
Untuk mengontrol akses ke set data di BigQuery, lihat Mengontrol akses ke set data. Untuk informasi tentang enkripsi data, lihat Enkripsi dalam penyimpanan.
Langkah selanjutnya
- Untuk informasi selengkapnya tentang cara membuat set data, lihat Membuat set data.
- Untuk mengetahui informasi selengkapnya tentang cara menetapkan kontrol akses ke set data, baca Mengontrol akses ke set data.