Masa depan data lakehouse: Terbuka dan interoperabel untuk era agentic. Baca blog.

Lakehouse untuk Apache Iceberg (sebelumnya BigLake)

Lakehouse lintas cloud yang terbuka untuk era agentic

Penyimpanan, tata kelola, dan performa perusahaan untuk membangun kasus penggunaan AI analisis, operasional, dan real-time yang skalabel di lakehouse terbuka multimodal lintas cloud yang terpadu.

Apache Iceberg adalah merek dagang dari Apache Software Foundation.

Fitur

Iceberg yang terkelola sepenuhnya dengan interoperabilitas baca/tulis

Tabel Apache Iceberg, yang dikelola menggunakan katalog Lakehouse Iceberg REST, menyediakan interoperabilitas baca dan tulis antara BigQuery dan Google Cloud Managed Service untuk Apache Spark serta mesin OSS yang kompatibel dengan Iceberg seperti Spark, Trino, dan Flink, serta kini dengan mesin pihak ketiga seperti Snowflake dan Databricks (Pratinjau). Hal ini membantu Anda menghubungkan tabel Iceberg dengan mudah langsung ke mesin seperti BigQuery dan Spark yang dikelola Google sehingga Anda dapat mempercepat workload AI.

AI Google terhubung ke data Iceberg lintas cloud Anda

Manfaatkan Cross-Cloud Interconnect dan pembuatan cache(Pratinjau) untuk mendapatkan akses cepat dan berlatensi rendah ke data S3 Iceberg. Jalankan BigQuery, Spark, dan Gemini Enterprise melalui tugas API analisis percakapan pada data AWS yang memiliki karakteristik performa harga yang sebanding dengan solusi platform data native. Selain itu, gabungan katalog runtime Lakehouse baru (Pratinjau) menyatukan ekosistem Anda dengan lancar, sehingga BigQuery dan Spark terkelola Google dapat menemukan dan menganalisis data perusahaan di Snowflake, Databricks, dan AWS Glue.

Akselerasi harga-performa untuk Iceberg

Eksekusi vektor yang ditingkatkan BigQuery kini menjadi default untuk tabel Katalog Lakehouse Iceberg REST serta tabel Iceberg dan Parquet di katalog BigQuery. Kurangi beban pemeliharaan Iceberg rutin seperti pemadatan, pengelompokan, dan pengumpulan sampah memori langsung ke Google Lakehouse. Fitur otomatis baru—termasuk pengelolaan tabel, partisi, pengelompokan, dan pengoptimalan berbasis histori (GA untuk tabel Iceberg di katalog BigQuery; Pratinjau untuk katalog REST)—mempercepat performa harga tanpa overhead manual.

Perbedaan BigQuery dan Spark

Dukung insight real-time dengan Iceberg menggunakan streaming BigQuery untuk penyerapan throughput tinggi dengan latensi baca nol. Bangun pipeline pemrosesan yang kompleks dengan transaksi multi-pernyataan dan replikasi data perubahan BigQuery ke tabel Iceberg (GA untuk katalog BigQuery; Pratinjau untuk katalog REST). Dapatkan analisis multimodal, vektor, dan grafik dengan menggabungkan data terstruktur dan tidak terstruktur menggunakan BigQueryObjectRefs. Tingkatkan workload data science Spark dengan Lightning Engine yang memiliki performa hingga 4,5 kali lebih cepat.

Konteks dan tata kelola real-time untuk agen

Dukung agen AI dengan data transaksional real-time. Streaming data operasional dari Spanner, AlloyDB, dan Cloud SQL ke BigQuery dan tabel Iceberg terkelola untuk analisis instan, serta kirim insight analisis ini langsung kembali ke AlloyDB atau Spanner, untuk menyajikannya dengan latensi sub-milidetik dan QPS tinggi. Dapatkan tata kelola terpadu dengan silsilah, pembuatan profil, dan kualitas data melalui integrasi Knowledge Catalog (sebelumnya Dataplex). Petakan data Iceberg transaksional yang tidak terstruktur ke logika bisnis Anda, sehingga memberi agen Anda konteks mendalam yang mereka perlukan untuk memberikan hasil yang akurat, andal, dan sepenuhnya terkelola. Anda dapat menggunakan Agen Data Cloud siap pakai atau menyederhanakan alur kerja langsung dari IDE Anda sendiri menggunakan Data Agent Kit.

Cara Kerjanya

Katalog Lakehouse REST berfungsi sebagai hub pusat untuk tabel Iceberg Anda. Katalog ini menyediakan akses baca/tulis universal di BigQuery, Managed Service untuk Apache Spark, mesin OSS, dan partner, yang menghubungkan data Anda secara lancar ke mesin apa pun untuk mempercepat AI.

Penggunaan Umum

Dasar dan modernisasi lakehouse

Melakukan modernisasi ke arsitektur lakehouse terbuka dan terpadu

Modernisasi fondasi data Anda dengan Lakehouse Google. Pindahkan Hadoop lama ke Cloud Storage serverless dan satukan data lintas cloud dengan membuat kueri Iceberg dan Delta Lake langsung di BigQuery. Katalog Lakehouse Iceberg REST menghilangkan silo, dengan menawarkan runtime yang dapat dioperasikan untuk Spark, Trino, dan Flink. Dengan dukungan katalog Hive, Anda dapat dengan mudah memodernisasi workload Hadoop ke Iceberg.

Tutorial, panduan memulai, dan lab

Melakukan modernisasi ke arsitektur lakehouse terbuka dan terpadu

Modernisasi fondasi data Anda dengan Lakehouse Google. Pindahkan Hadoop lama ke Cloud Storage serverless dan satukan data lintas cloud dengan membuat kueri Iceberg dan Delta Lake langsung di BigQuery. Katalog Lakehouse Iceberg REST menghilangkan silo, dengan menawarkan runtime yang dapat dioperasikan untuk Spark, Trino, dan Flink. Dengan dukungan katalog Hive, Anda dapat dengan mudah memodernisasi workload Hadoop ke Iceberg.

Interoperabilitas multi-engine

Berbagi baca/tulis yang lancar antara BigQuery dan mesin OSS

Bawa pipeline Iceberg yang ada dan baca atau tulis ke tabel tersebut dengan lancar menggunakan BigQuery atau Spark terkelola, sekaligus melakukan modernisasi dengan mudah menggunakan kapabilitas BigQuery yang canggih. Dukung data science dengan menjalankan ETL Spark dan BigQuery AI di tabel Iceberg yang sama persis tanpa perpindahan data. Bangun agen analisis percakapan di BigQuery yang bekerja dengan data Anda di S3.

Tutorial, panduan memulai, dan lab

Berbagi baca/tulis yang lancar antara BigQuery dan mesin OSS

Bawa pipeline Iceberg yang ada dan baca atau tulis ke tabel tersebut dengan lancar menggunakan BigQuery atau Spark terkelola, sekaligus melakukan modernisasi dengan mudah menggunakan kapabilitas BigQuery yang canggih. Dukung data science dengan menjalankan ETL Spark dan BigQuery AI di tabel Iceberg yang sama persis tanpa perpindahan data. Bangun agen analisis percakapan di BigQuery yang bekerja dengan data Anda di S3.

Mengintegrasikan data Iceberg ke dalam alur kerja AI

Analisis data multimodal dan alur kerja AI yang dipercepat

Dukung analisis multimodal melalui BigQuery AI dengan menggabungkan tabel Iceberg terstruktur dengan data tidak terstruktur menggunakan BigQuery ObjectRefs untuk inferensi SQL tunggal. Latih model Platform Agen Gemini Enterprise menggunakan time-travel untuk men-debug penyimpangan data. Gabungkan katalog REST global ke dalam mesh data terpadu, analisis log skala besar dengan terjangkau, dan bangun model secara langsung di notebook yang terintegrasi untuk mempercepat alur kerja AI Anda.

Tutorial, panduan memulai, dan lab

Analisis data multimodal dan alur kerja AI yang dipercepat

Dukung analisis multimodal melalui BigQuery AI dengan menggabungkan tabel Iceberg terstruktur dengan data tidak terstruktur menggunakan BigQuery ObjectRefs untuk inferensi SQL tunggal. Latih model Platform Agen Gemini Enterprise menggunakan time-travel untuk men-debug penyimpangan data. Gabungkan katalog REST global ke dalam mesh data terpadu, analisis log skala besar dengan terjangkau, dan bangun model secara langsung di notebook yang terintegrasi untuk mempercepat alur kerja AI Anda.

Pengalaman Spark terbaik di kelasnya

Mendukung workload data science di seluruh lingkungan developer

Dapatkan pengalaman Spark yang lancar. Jalankan SQL, Spark, dan Python di satu salinan data Iceberg menggunakan IDE terpadu. Ekstensi VS Code Antigravity yang baru berfungsi sebagai partner AI untuk membuat pipeline, men-debug kode, dan mengotomatiskan CI/CD dari bahasa alami. Selain itu, Lightning Engine vektor kami mempercepat eksekusi Spark hingga 4,5 kali lipat—tanpa memerlukan perubahan kode.

Tutorial, panduan memulai, dan lab

Mendukung workload data science di seluruh lingkungan developer

Dapatkan pengalaman Spark yang lancar. Jalankan SQL, Spark, dan Python di satu salinan data Iceberg menggunakan IDE terpadu. Ekstensi VS Code Antigravity yang baru berfungsi sebagai partner AI untuk membuat pipeline, men-debug kode, dan mengotomatiskan CI/CD dari bahasa alami. Selain itu, Lightning Engine vektor kami mempercepat eksekusi Spark hingga 4,5 kali lipat—tanpa memerlukan perubahan kode.

Analisis berperforma tinggi dengan BigQuery

Pengoptimalan performa dengan BigQuery

Manfaatkan skala BigQuery sekaligus mempertahankan penyimpanan yang fleksibel. Jalankan transaksi multi-pernyataan di BigQuery untuk memperbarui beberapa tabel Iceberg sebagai satu unit atomik, sehingga memastikan konsistensi tingkat keuangan. Gunakan runtime lanjutan BigQuery dan dukungan partisi untuk Iceberg guna membuat tabel pengelompokan/yang dipartisi yang memanfaatkan pruning blok untuk eksekusi kueri berkecepatan tinggi dan hemat biaya.

Tutorial, panduan memulai, dan lab

Pengoptimalan performa dengan BigQuery

Manfaatkan skala BigQuery sekaligus mempertahankan penyimpanan yang fleksibel. Jalankan transaksi multi-pernyataan di BigQuery untuk memperbarui beberapa tabel Iceberg sebagai satu unit atomik, sehingga memastikan konsistensi tingkat keuangan. Gunakan runtime lanjutan BigQuery dan dukungan partisi untuk Iceberg guna membuat tabel pengelompokan/yang dipartisi yang memanfaatkan pruning blok untuk eksekusi kueri berkecepatan tinggi dan hemat biaya.

Kecerdasan real time

Kombinasi transaksional dan analisis untuk AI agentic

Dukung agen AI berbasis peristiwa dengan menyatukan data transaksional dan analisis Anda. Otomatiskan replikasi CDC berkelanjutan dari Spanner dan AlloyDB langsung ke tabel Lakehouse Iceberg. Selanjutnya, gunakan kueri berkelanjutan SQL untuk memantau data streaming ini, menjalankan inferensi AI secara instan, dan memicu tindakan downstream—yang memberikan kecerdasan real-time untuk workload operasional Anda yang paling penting.

Tutorial, panduan memulai, dan lab

Kombinasi transaksional dan analisis untuk AI agentic

Dukung agen AI berbasis peristiwa dengan menyatukan data transaksional dan analisis Anda. Otomatiskan replikasi CDC berkelanjutan dari Spanner dan AlloyDB langsung ke tabel Lakehouse Iceberg. Selanjutnya, gunakan kueri berkelanjutan SQL untuk memantau data streaming ini, menjalankan inferensi AI secara instan, dan memicu tindakan downstream—yang memberikan kecerdasan real-time untuk workload operasional Anda yang paling penting.

Tata kelola lakehouse end-to-end

Mengelola lakehouse Anda dengan Knowledge Catalog

Knowledge Catalog menyediakan lapisan tata kelola terpadu dengan otomatis menemukan tabel Iceberg di Cloud Storage dan mendaftarkan metadatanya langsung ke katalog runtime Lakehouse. Integrasi ini memungkinkan Anda menentukan kebijakan keamanan terpusat yang memastikan kontrol akses tingkat baris dan kolom yang konsisten di seluruh mesin pemrosesan BigQuery dan open source.

Tutorial, panduan memulai, dan lab

Mengelola lakehouse Anda dengan Knowledge Catalog

Knowledge Catalog menyediakan lapisan tata kelola terpadu dengan otomatis menemukan tabel Iceberg di Cloud Storage dan mendaftarkan metadatanya langsung ke katalog runtime Lakehouse. Integrasi ini memungkinkan Anda menentukan kebijakan keamanan terpusat yang memastikan kontrol akses tingkat baris dan kolom yang konsisten di seluruh mesin pemrosesan BigQuery dan open source.

Harga

Cara kerja penetapan harga Lakehouse (BigLake)	Harga (BigLake) Lakehouse didasarkan pada pengelolaan tabel, penyimpanan metadata, dan akses metadata
Layanan dan penggunaan	Deskripsi	Harga (USD)
Pengelolaan tabel lakehouse (sebelumnya BigLake)	Resource komputasi pengelolaan tabel Lakehouse yang digunakan untuk pengoptimalan penyimpanan tabel otomatis, termasuk ukuran file adaptif, pengelompokan otomatis, pembersihan sampah memori, dan pembuatan metadata BigQuery (CMETA).	Mulai dari $0,12 per DCU-Jam
Penyimpanan metadata Lakehouse (BigLake)	Katalog runtime Lakehouse (sebelumnya BigLake metastore) mengenakan biaya untuk metadata yang disimpan. Paket gratis mencakup penyimpanan metadata 1 GiB per bulan.	Gratis Penyimpanan metadata 1 GiB per bulan
Penyimpanan metadata Lakehouse (BigLake)	Katalog runtime Lakehouse (sebelumnya BigLake metastore) mengenakan biaya untuk metadata yang disimpan di luar paket gratis penyimpanan metadata sebesar 1 GiB per bulan.	Mulai dari $0,04 per GiB per bulan
Akses metadata Lakehouse (BigLake)	Operasi Kelas A: Biaya akses metadata BigLake untuk operasi writes, updates, list, create, dan config dengan paket gratis yang mencakup 5.000 operasi per bulan. Operasi Spesifik: Create Register List Update (termasuk menghapus baris dari tabel) setIamPolicy Saat file metadata > 1 MB Setiap MB inkremental, diperlakukan sebagai 1 operasi 1 MB = 1 operasi, 2 MB = 2 operasi, 5 MB = 5 operasi	Mulai dari $6,00 per juta operasi di atas 5.001 jumlah per bulan/akun
Akses metadata Lakehouse (BigLake)	Operasi Kelas B: Biaya akses metadata Lakehouse (BigLake) untuk operasi reads, get, dan delete dengan paket gratis yang mencakup 50.000 operasi per bulan. Operasi Spesifik: Read Delete getIamPolicy Saat file metadata > 1 MB Setiap MB inkremental, diperlakukan sebagai 1 operasi 1 MB = 1 operasi, 2 MB = 2 operasi, 5 MB = 5 operasi	Mulai dari $0,90 per juta operasi di atas 50.001
Federasi katalog lakehouse: Pembaruan metadata	Operasi refresh metadata untuk memperbarui metadata dari katalog eksternal (Misalnya: Databricks Unity Catalog) dengan paket gratis dari 0 hingga 5.001 jumlah per 1 bulan/akun. Saat file metadata > 1 MB Setiap MB inkremental, diperlakukan sebagai 1 operasi 1 MB = 1 operasi, 2 MB = 2 operasi, 5 MB = 5 operasi	Mulai dari $6,00 per juta operasi di atas 5.001 jumlah per bulan/akun

Cara kerja penetapan harga Lakehouse (BigLake)

Harga (BigLake) Lakehouse didasarkan pada pengelolaan tabel, penyimpanan metadata, dan akses metadata

Pengelolaan tabel lakehouse (sebelumnya BigLake)

Deskripsi

Resource komputasi pengelolaan tabel Lakehouse yang digunakan untuk pengoptimalan penyimpanan tabel otomatis, termasuk ukuran file adaptif, pengelompokan otomatis, pembersihan sampah memori, dan pembuatan metadata BigQuery (CMETA).

Harga (USD)

Starting at

$0,12

per DCU-Jam

Penyimpanan metadata Lakehouse (BigLake)

Deskripsi

Katalog runtime Lakehouse (sebelumnya BigLake metastore) mengenakan biaya untuk metadata yang disimpan. Paket gratis mencakup penyimpanan metadata 1 GiB per bulan.

Harga (USD)

Gratis

Penyimpanan metadata 1 GiB per bulan

Katalog runtime Lakehouse (sebelumnya BigLake metastore) mengenakan biaya untuk metadata yang disimpan di luar paket gratis penyimpanan metadata sebesar 1 GiB per bulan.

Deskripsi

Starting at

$0,04

per GiB per bulan

Akses metadata Lakehouse (BigLake)

Deskripsi

Operasi Kelas A: Biaya akses metadata BigLake untuk operasi writes, updates, list, create, dan config dengan paket gratis yang mencakup 5.000 operasi per bulan.

Operasi Spesifik:

Create
Register
List
Update (termasuk menghapus baris dari tabel)
setIamPolicy

Saat file metadata > 1 MB

Setiap MB inkremental, diperlakukan sebagai 1 operasi
1 MB = 1 operasi, 2 MB = 2 operasi, 5 MB = 5 operasi

Harga (USD)

Starting at

$6,00

per juta operasi di atas 5.001 jumlah per bulan/akun

Operasi Kelas B: Biaya akses metadata Lakehouse (BigLake) untuk operasi reads, get, dan delete dengan paket gratis yang mencakup 50.000 operasi per bulan.

Operasi Spesifik:

Read
Delete
getIamPolicy

Saat file metadata > 1 MB

Setiap MB inkremental, diperlakukan sebagai 1 operasi
1 MB = 1 operasi, 2 MB = 2 operasi, 5 MB = 5 operasi

Deskripsi

Starting at

$0,90

per juta operasi di atas 50.001

Federasi katalog lakehouse: Pembaruan metadata

Deskripsi

Operasi refresh metadata untuk memperbarui metadata dari katalog eksternal (Misalnya: Databricks Unity Catalog) dengan paket gratis dari 0 hingga 5.001 jumlah per 1 bulan/akun.

Saat file metadata > 1 MB

Setiap MB inkremental, diperlakukan sebagai 1 operasi
1 MB = 1 operasi, 2 MB = 2 operasi, 5 MB = 5 operasi

Harga (USD)

Starting at

$6,00

per juta operasi di atas 5.001 jumlah per bulan/akun

Kalkulator harga

Perkirakan biaya Lakehouse bulanan Anda, termasuk harga dan biaya yang spesifik per region.

Penawaran kustom

Hubungi tim penjualan kami untuk mendapatkan penawaran harga khusus bagi organisasi Anda.

Lakehouse untuk Apache Iceberg (sebelumnya BigLake)

Lakehouse lintas cloud yang terbuka untuk era agentic

Sorotan produk

Iceberg yang terkelola sepenuhnya dengan interoperabilitas baca/tulis

AI Google terhubung ke data Iceberg lintas cloud Anda

Akselerasi harga-performa untuk Iceberg

Perbedaan BigQuery dan Spark

Konteks dan tata kelola real-time untuk agen

Katalog Lakehouse REST berfungsi sebagai hub pusat untuk tabel Iceberg Anda. Katalog ini menyediakan akses baca/tulis universal di BigQuery, Managed Service untuk Apache Spark, mesin OSS, dan partner, yang menghubungkan data Anda secara lancar ke mesin apa pun untuk mempercepat AI.

Dasar dan modernisasi lakehouse

Melakukan modernisasi ke arsitektur lakehouse terbuka dan terpadu

Tutorial, panduan memulai, dan lab

Melakukan modernisasi ke arsitektur lakehouse terbuka dan terpadu

Interoperabilitas multi-engine

Berbagi baca/tulis yang lancar antara BigQuery dan mesin OSS

Tutorial, panduan memulai, dan lab

Berbagi baca/tulis yang lancar antara BigQuery dan mesin OSS

Mengintegrasikan data Iceberg ke dalam alur kerja AI

Analisis data multimodal dan alur kerja AI yang dipercepat

Tutorial, panduan memulai, dan lab

Analisis data multimodal dan alur kerja AI yang dipercepat

Pengalaman Spark terbaik di kelasnya

Mendukung workload data science di seluruh lingkungan developer

Tutorial, panduan memulai, dan lab

Mendukung workload data science di seluruh lingkungan developer

Analisis berperforma tinggi dengan BigQuery

Pengoptimalan performa dengan BigQuery

Tutorial, panduan memulai, dan lab

Pengoptimalan performa dengan BigQuery

Kecerdasan real time

Kombinasi transaksional dan analisis untuk AI agentic

Tutorial, panduan memulai, dan lab

Kombinasi transaksional dan analisis untuk AI agentic

Tata kelola lakehouse end-to-end

Mengelola lakehouse Anda dengan Knowledge Catalog

Tutorial, panduan memulai, dan lab

Mengelola lakehouse Anda dengan Knowledge Catalog

Kalkulator harga

Penawaran kustom

Mulai bukti konsep Anda

Mulai uji coba gratis

Punya project besar?

Tabel Apache Iceberg yang terkelola sepenuhnya

Menggunakan katalog REST Apache Iceberg

Membuat kueri data Apache Iceberg