Ringkasan BigQuery

BigQuery adalah platform data yang terkelola sepenuhnya dan siap pakai untuk AI yang membantu Anda mengelola dan menganalisis data dengan fitur bawaan seperti machine learning, penelusuran, analisis geospasial, dan business intelligence. Arsitektur serverless BigQuery memungkinkan Anda menggunakan bahasa seperti SQL dan Python untuk menjawab pertanyaan terbesar organisasi Anda tanpa perlu mengelola infrastruktur.

BigQuery menyediakan cara yang seragam untuk menggunakan data terstruktur dan tidak terstruktur serta mendukung format tabel terbuka seperti Apache Iceberg, Delta, dan Hudi. Streaming BigQuery mendukung penyerapan dan analisis data berkelanjutan, sementara mesin analisis terdistribusi yang skalabel dari BigQuery memungkinkan Anda membuat kueri terabyte dalam hitungan detik dan petabyte dalam hitungan menit.

Arsitektur BigQuery terdiri dari dua bagian: lapisan penyimpanan yang menyerap, menyimpan, dan mengoptimalkan data serta lapisan komputasi yang menyediakan kemampuan analisis. Lapisan komputasi dan penyimpanan ini beroperasi secara mandiri satu sama lain secara efisien berkat jaringan skala petabit Google yang memungkinkan komunikasi yang diperlukan di antara keduanya.

Database lama biasanya harus berbagi resource antara operasi baca dan tulis serta operasi analisis. Hal ini dapat menyebabkan konflik resource dan dapat memperlambat kueri saat data ditulis ke atau dibaca dari penyimpanan. Kumpulan resource bersama dapat semakin terbebani saat resource diperlukan untuk tugas pengelolaan database seperti menetapkan atau mencabut izin. Pemisahan lapisan komputasi dan penyimpanan BigQuery memungkinkan setiap lapisan mengalokasikan resource secara dinamis tanpa memengaruhi performa atau ketersediaan lapisan lainnya.

Arsitektur BigQuery memisahkan resource dengan jaringan petabit.

Prinsip pemisahan ini memungkinkan BigQuery berinovasi lebih cepat karena peningkatan penyimpanan dan komputasi dapat di-deploy secara independen, tanpa periode nonaktif atau dampak negatif pada performa sistem. Anda juga harus menawarkan data warehouse serverless terkelola sepenuhnya tempat tim engineering BigQuery menangani update dan pemeliharaan. Hasilnya, Anda tidak perlu menyediakan atau menskalakan resource secara manual, sehingga Anda dapat berfokus pada pengiriman nilai, bukan tugas pengelolaan database tradisional.

Antarmuka BigQuery mencakup antarmuka konsol Google Cloud dan alat command line BigQuery. Developer dan data scientist dapat menggunakan library klien dengan pemrograman familier termasuk Python, Java, JavaScript, dan Go, serta REST API dan RPC API BigQuery untuk mengubah dan mengelola data. Driver ODBC dan JDBC menyediakan interaksi dengan aplikasi yang ada, termasuk alat dan utilitas pihak ketiga.

Sebagai analis data, data engineer, administrator data warehouse, atau ilmuwan data, BigQuery membantu Anda memuat, memproses, dan menganalisis data untuk mendasari keputusan bisnis yang penting.

Mulai menggunakan BigQuery

Anda dapat mulai menjelajahi BigQuery dalam hitungan menit. Manfaatkan paket penggunaan gratis atau sandbox gratis BigQuery untuk mulai memuat dan membuat kueri data.

  1. Sandbox BigQuery: Mulai di sandbox BigQuery, bebas risiko dan tanpa biaya.
  2. Panduan memulai konsol Google Cloud: Pahami kecanggihan Konsol BigQuery.
  3. Set data publik: Rasakan performa BigQuery dengan menjelajahi data dunia nyata yang besar dari Program Set Data Publik.

Jelajahi BigQuery

Infrastruktur serverless BigQuery memungkinkan Anda berfokus pada data, bukan pada pengelolaan resource. BigQuery menggabungkan data warehouse berbasis cloud dan alat analisis yang andal.

Penyimpanan BigQuery

BigQuery menyimpan data menggunakan format penyimpanan berbasis kolom yang dioptimalkan untuk kueri analitis. BigQuery menyajikan data dalam tabel, baris, dan kolom, serta memberikan dukungan penuh untuk semantik transaksi database (ACID). Penyimpanan BigQuery secara otomatis direplikasi ke beberapa lokasi untuk memberikan ketersediaan tinggi.

Untuk mengetahui informasi selengkapnya, lihat Ringkasan penyimpanan BigQuery.

Analisis BigQuery

Penggunaan analisis deskriptif dan preskriptif mencakup business intelligence, analisis ad hoc, analisis geospasial, dan machine learning. Anda dapat membuat kueri untuk data yang tersimpan di BigQuery atau menjalankan kueri pada data di tempat data tersebut berada menggunakan tabel eksternal atau kueri gabungan termasuk Cloud Storage, Bigtable, Spanner, atau Google Spreadsheet yang disimpan di Google Drive.

  • Kueri SQL standar ANSI (Dukungan SQL:2011) termasuk dukungan untuk gabungan, kolom bertingkat dan berulang, fungsi analisis dan agregasi, kueri multi-pernyataan, serta berbagai fungsi spasial dengan analisis geospasial - Sistem Informasi Geografis.
  • Buat tampilan untuk membagikan analisis Anda.
  • Dukungan alat business intelligence termasuk BI Engine dengan Looker Studio, Looker, Google Sheets, serta alat pihak ketiga seperti Tableau dan Power BI.
  • BigQuery ML menyediakan machine learning dan analisis prediktif.
  • BigQuery Studio menawarkan fitur seperti notebook Python, dan kontrol versi untuk notebook dan kueri tersimpan. Fitur-fitur ini dapat memudahkan Anda menyelesaikan analisis data dan alur kerja machine learning (ML) di BigQuery.
  • Buat kueri data di luar BigQuery dengan tabel eksternal dan kueri gabungan.

Untuk mengetahui informasi selengkapnya, baca Ringkasan analisis BigQuery.

Administrasi BigQuery

BigQuery menyediakan pengelolaan resource komputasi dan data terpusat, sementara Identity and Access Management (IAM) membantu Anda mengamankan resource tersebut dengan model akses yang digunakan di seluruh Google Cloud. Praktik terbaik keamanan Google Cloud memberikan pendekatan yang solid tetapi fleksibel yang dapat mencakup keamanan perimeter tradisional atau pendekatan pertahanan mendalam yang lebih kompleks dan terperinci.

  • Pengantar keamanan dan tata kelola data membantu Anda memahami tata kelola data, dan kontrol apa saja yang mungkin Anda perlukan untuk mengamankan resource BigQuery.
  • Tugas adalah tindakan yang dijalankan BigQuery atas nama Anda untuk memuat, mengekspor, membuat kueri, atau menyalin data.
  • Reservasi memungkinkan Anda beralih antara harga sesuai permintaan dan harga berdasarkan kapasitas.

Untuk informasi lebih lanjut, lihat Pengantar administrasi BigQuery.

Referensi BigQuery

Pelajari referensi BigQuery:

API, alat, dan referensi

Materi referensi untuk developer dan analis BigQuery:

Peran dan resource BigQuery

BigQuery memenuhi kebutuhan para profesional data dalam berbagai peran dan tanggung jawab berikut.

Analis Data

Panduan tugas untuk membantu jika Anda perlu melakukan hal berikut:

Untuk mengikuti tur fitur analisis data BigQuery langsung di konsol Google Cloud , klik Ikuti tur.

Ikut tur produk

Administrator Data

Panduan tugas untuk membantu jika Anda perlu melakukan hal berikut:

Untuk informasi selengkapnya, lihat Pengantar administrasi BigQuery.

Untuk mengikuti tur fitur administrasi data BigQuery langsung di konsol Google Cloud , klik Ikuti tur.

Ikut tur produk

Data Scientist

Panduan tugas untuk membantu jika Anda perlu menggunakan machine learning BigQuery ML untuk melakukan hal berikut:

Developer Data

Panduan tugas untuk membantu jika Anda perlu melakukan hal berikut:

Tutorial video BigQuery

Rangkaian tutorial video berikut akan membantu Anda memulai BigQuery:

Title

Deskripsi

Cara memulai BigQuery (17:18) Ringkasan yang merangkum apa yang dimaksud dengan BigQuery dan cara menggunakannya. Segmen mencakup: pipeline ETL, harga dan pengoptimalan, BigQuery ML dan BI Engine, serta diakhiri dengan demo BigQuery di konsol Google Cloud .
Apa itu BigQuery? (4:39) Ringkasan BigQuery tentang desain BigQuery yang dirancang untuk menyerap dan menyimpan data dalam jumlah besar guna membantu analis dan developer
Menggunakan sandbox BigQuery (3:05) Cara menyiapkan sandbox BigQuery, yang memungkinkan Anda menjalankan kueri tanpa memerlukan kartu kredit
Mengajukan pertanyaan, menjalankan kueri (5:11) Cara menulis dan menjalankan kueri SQL di UI BigQuery, serta memilih nomor jersey pemenang
Memuat data ke BigQuery (5:31) Cara menyerap dan menganalisis data secara real time, atau hanya analisis data dalam batch satu kali - plus cats v. dogs
Memvisualisasikan hasil kueri (5:38) Bagaimana visualisasi data berguna untuk membuat {i>dataset<i} yang kompleks lebih mudah dipahami dan diinternalisasi
Mengelola akses dengan IAM (5:23) Cara mengizinkan pengguna lain membuat kueri set data Anda di BigQuery dengan izin IAM dan kontrol akses
Menyimpan dan membagikan kueri (6:17) Cara menyimpan dan membagikan kueri Anda di BigQuery tanpa repot
Melindungi data sensitif dengan tampilan yang diizinkan (7:12) Cara mudah membagikan set data kepada berbagai pengguna dengan menetapkan kontrol akses yang disesuaikan
Membuat kueri data eksternal dengan BigQuery (5:49) Cara menyiapkan sumber data eksternal di BigQuery dan membuat kueri data dari Cloud Storage, Cloud SQL, Google Drive, dan lainnya
Apa yang dimaksud dengan fungsi yang ditentukan pengguna? (4:59) Cara membuat fungsi yang ditentukan pengguna (UDF) untuk menganalisis set data di BigQuery

Langkah berikutnya