Lakehouse untuk Apache Iceberg (sebelumnya BigLake)

Lakehouse lintas cloud yang terbuka untuk era agentic

Penyimpanan, tata kelola, dan performa perusahaan untuk membangun kasus penggunaan AI analisis, operasional, dan real-time yang skalabel di lakehouse terbuka multimodal lintas cloud yang terpadu.

Apache Iceberg adalah merek dagang dari Apache Software Foundation.



Fitur

Iceberg yang terkelola sepenuhnya dengan interoperabilitas baca/tulis

Tabel Apache Iceberg, yang dikelola menggunakan katalog Lakehouse Iceberg REST, menyediakan interoperabilitas baca dan tulis antara BigQuery dan Google Cloud Managed Service untuk Apache Spark serta mesin OSS yang kompatibel dengan Iceberg seperti Spark, Trino, dan Flink, serta kini dengan mesin pihak ketiga seperti Snowflake dan Databricks (Pratinjau). Hal ini membantu Anda menghubungkan tabel Iceberg dengan mudah langsung ke mesin seperti BigQuery dan Spark yang dikelola Google sehingga Anda dapat mempercepat workload AI.

AI Google terhubung ke data Iceberg lintas cloud Anda

Manfaatkan Cross-Cloud Interconnect dan pembuatan cache(Pratinjau) untuk mendapatkan akses cepat dan berlatensi rendah ke data S3 Iceberg. Jalankan BigQuery, Spark, dan Gemini Enterprise melalui tugas API analisis percakapan pada data AWS yang memiliki karakteristik performa harga yang sebanding dengan solusi platform data native. Selain itu, gabungan katalog runtime Lakehouse baru (Pratinjau) menyatukan ekosistem Anda dengan lancar, sehingga BigQuery dan Spark terkelola Google dapat menemukan dan menganalisis data perusahaan di Snowflake, Databricks, dan AWS Glue.

Akselerasi harga-performa untuk Iceberg

Eksekusi vektor yang ditingkatkan BigQuery kini menjadi default untuk tabel Katalog Lakehouse Iceberg REST serta tabel Iceberg dan Parquet di katalog BigQuery. Kurangi beban pemeliharaan Iceberg rutin seperti pemadatan, pengelompokan, dan pengumpulan sampah memori langsung ke Google Lakehouse. Fitur otomatis baru—termasuk pengelolaan tabel, partisi, pengelompokan, dan pengoptimalan berbasis histori (GA untuk tabel Iceberg di katalog BigQuery; Pratinjau untuk katalog REST)—mempercepat performa harga tanpa overhead manual.

Perbedaan BigQuery dan Spark

Dukung insight real-time dengan Iceberg menggunakan streaming BigQuery untuk penyerapan throughput tinggi dengan latensi baca nol. Bangun pipeline pemrosesan yang kompleks dengan transaksi multi-pernyataan dan replikasi data perubahan BigQuery ke tabel Iceberg (GA untuk katalog BigQuery; Pratinjau untuk katalog REST). Dapatkan analisis multimodal, vektor, dan grafik dengan menggabungkan data terstruktur dan tidak terstruktur menggunakan BigQueryObjectRefs. Tingkatkan workload data science Spark dengan Lightning Engine yang memiliki performa hingga 4,5 kali lebih cepat. 

Konteks dan tata kelola real-time untuk agen

Dukung agen AI dengan data transaksional real-time. Streaming data operasional dari Spanner, AlloyDB, dan Cloud SQL ke BigQuery dan tabel Iceberg terkelola untuk analisis instan, serta kirim insight analisis ini langsung kembali ke AlloyDB atau Spanner, untuk menyajikannya dengan latensi sub-milidetik dan QPS tinggi. Dapatkan tata kelola terpadu dengan silsilah, pembuatan profil, dan kualitas data melalui integrasi Knowledge Catalog (sebelumnya Dataplex). Petakan data Iceberg transaksional yang tidak terstruktur ke logika bisnis Anda, sehingga memberi agen Anda konteks mendalam yang mereka perlukan untuk memberikan hasil yang akurat, andal, dan sepenuhnya terkelola.

Cara Kerjanya

Katalog Lakehouse REST berfungsi sebagai hub pusat untuk tabel Iceberg Anda. Katalog ini menyediakan akses baca/tulis universal di BigQuery, Managed Service untuk Apache Spark, mesin OSS, dan partner, yang menghubungkan data Anda secara lancar ke mesin apa pun untuk mempercepat AI.

Penggunaan Umum

Dasar dan modernisasi lakehouse

Melakukan modernisasi ke arsitektur lakehouse terbuka dan terpadu

Modernisasi fondasi data Anda dengan Lakehouse Google. Pindahkan Hadoop lama ke Cloud Storage serverless dan satukan data lintas cloud dengan membuat kueri Iceberg dan Delta Lake langsung di BigQuery. Katalog Lakehouse Iceberg REST menghilangkan silo, dengan menawarkan runtime yang dapat dioperasikan untuk Spark, Trino, dan Flink. Dengan dukungan katalog Hive, Anda dapat dengan mudah memodernisasi workload Hadoop ke Iceberg.

    Melakukan modernisasi ke arsitektur lakehouse terbuka dan terpadu

    Modernisasi fondasi data Anda dengan Lakehouse Google. Pindahkan Hadoop lama ke Cloud Storage serverless dan satukan data lintas cloud dengan membuat kueri Iceberg dan Delta Lake langsung di BigQuery. Katalog Lakehouse Iceberg REST menghilangkan silo, dengan menawarkan runtime yang dapat dioperasikan untuk Spark, Trino, dan Flink. Dengan dukungan katalog Hive, Anda dapat dengan mudah memodernisasi workload Hadoop ke Iceberg.

      Interoperabilitas multi-engine

      Berbagi baca/tulis yang lancar antara BigQuery dan mesin OSS

      Bawa pipeline Iceberg yang ada dan baca atau tulis ke tabel tersebut dengan lancar menggunakan BigQuery atau Spark terkelola, sekaligus melakukan modernisasi dengan mudah menggunakan kapabilitas BigQuery yang canggih. Dukung data science dengan menjalankan ETL Spark dan BigQuery AI di tabel Iceberg yang sama persis tanpa perpindahan data. Bangun agen analisis percakapan di BigQuery yang bekerja dengan data Anda di S3.

        Berbagi baca/tulis yang lancar antara BigQuery dan mesin OSS

        Bawa pipeline Iceberg yang ada dan baca atau tulis ke tabel tersebut dengan lancar menggunakan BigQuery atau Spark terkelola, sekaligus melakukan modernisasi dengan mudah menggunakan kapabilitas BigQuery yang canggih. Dukung data science dengan menjalankan ETL Spark dan BigQuery AI di tabel Iceberg yang sama persis tanpa perpindahan data. Bangun agen analisis percakapan di BigQuery yang bekerja dengan data Anda di S3.

          Mengintegrasikan data Iceberg ke dalam alur kerja AI

          Analisis data multimodal dan alur kerja AI yang dipercepat

          Dukung analisis multimodal melalui BigQuery AI dengan menggabungkan tabel Iceberg terstruktur dengan data tidak terstruktur menggunakan BigQuery ObjectRefs untuk inferensi SQL tunggal. Latih model Platform Agen Gemini Enterprise menggunakan time-travel untuk men-debug penyimpangan data. Gabungkan katalog REST global ke dalam mesh data terpadu, analisis log skala besar dengan terjangkau, dan bangun model secara langsung di notebook yang terintegrasi untuk mempercepat alur kerja AI Anda.


            Analisis data multimodal dan alur kerja AI yang dipercepat

            Dukung analisis multimodal melalui BigQuery AI dengan menggabungkan tabel Iceberg terstruktur dengan data tidak terstruktur menggunakan BigQuery ObjectRefs untuk inferensi SQL tunggal. Latih model Platform Agen Gemini Enterprise menggunakan time-travel untuk men-debug penyimpangan data. Gabungkan katalog REST global ke dalam mesh data terpadu, analisis log skala besar dengan terjangkau, dan bangun model secara langsung di notebook yang terintegrasi untuk mempercepat alur kerja AI Anda.


              Pengalaman Spark terbaik di kelasnya

              Mendukung workload data science di seluruh lingkungan developer

              Dapatkan pengalaman Spark yang lancar. Jalankan SQL, Spark, dan Python di satu salinan data Iceberg menggunakan IDE terpadu. Ekstensi VS Code Antigravity yang baru berfungsi sebagai partner AI untuk membuat pipeline, men-debug kode, dan mengotomatiskan CI/CD dari bahasa alami. Selain itu, Lightning Engine vektor kami mempercepat eksekusi Spark hingga 4,5 kali lipat—tanpa memerlukan perubahan kode.

                Mendukung workload data science di seluruh lingkungan developer

                Dapatkan pengalaman Spark yang lancar. Jalankan SQL, Spark, dan Python di satu salinan data Iceberg menggunakan IDE terpadu. Ekstensi VS Code Antigravity yang baru berfungsi sebagai partner AI untuk membuat pipeline, men-debug kode, dan mengotomatiskan CI/CD dari bahasa alami. Selain itu, Lightning Engine vektor kami mempercepat eksekusi Spark hingga 4,5 kali lipat—tanpa memerlukan perubahan kode.

                  Analisis berperforma tinggi dengan BigQuery

                  Pengoptimalan performa dengan BigQuery

                  Manfaatkan skala BigQuery sekaligus mempertahankan penyimpanan yang fleksibel. Jalankan transaksi multi-pernyataan di BigQuery untuk memperbarui beberapa tabel Iceberg sebagai satu unit atomik, sehingga memastikan konsistensi tingkat keuangan. Gunakan runtime lanjutan BigQuery dan dukungan partisi untuk Iceberg guna membuat tabel pengelompokan/yang dipartisi yang memanfaatkan pruning blok untuk eksekusi kueri berkecepatan tinggi dan hemat biaya.

                    Pengoptimalan performa dengan BigQuery

                    Manfaatkan skala BigQuery sekaligus mempertahankan penyimpanan yang fleksibel. Jalankan transaksi multi-pernyataan di BigQuery untuk memperbarui beberapa tabel Iceberg sebagai satu unit atomik, sehingga memastikan konsistensi tingkat keuangan. Gunakan runtime lanjutan BigQuery dan dukungan partisi untuk Iceberg guna membuat tabel pengelompokan/yang dipartisi yang memanfaatkan pruning blok untuk eksekusi kueri berkecepatan tinggi dan hemat biaya.

                      Kecerdasan real time

                      Kombinasi transaksional dan analisis untuk AI agentic

                      Dukung agen AI berbasis peristiwa dengan menyatukan data transaksional dan analisis Anda. Otomatiskan replikasi CDC berkelanjutan dari Spanner dan AlloyDB langsung ke tabel Lakehouse Iceberg. Selanjutnya, gunakan kueri berkelanjutan SQL untuk memantau data streaming ini, menjalankan inferensi AI secara instan, dan memicu tindakan downstream—yang memberikan kecerdasan real-time untuk workload operasional Anda yang paling penting.

                        Kombinasi transaksional dan analisis untuk AI agentic

                        Dukung agen AI berbasis peristiwa dengan menyatukan data transaksional dan analisis Anda. Otomatiskan replikasi CDC berkelanjutan dari Spanner dan AlloyDB langsung ke tabel Lakehouse Iceberg. Selanjutnya, gunakan kueri berkelanjutan SQL untuk memantau data streaming ini, menjalankan inferensi AI secara instan, dan memicu tindakan downstream—yang memberikan kecerdasan real-time untuk workload operasional Anda yang paling penting.

                          Tata kelola lakehouse end-to-end

                          Mengelola lakehouse Anda dengan Knowledge Catalog

                          Knowledge Catalog menyediakan lapisan tata kelola terpadu dengan otomatis menemukan tabel Iceberg di Cloud Storage dan mendaftarkan metadatanya langsung ke katalog runtime Lakehouse. Integrasi ini memungkinkan Anda menentukan kebijakan keamanan terpusat yang memastikan kontrol akses tingkat baris dan kolom yang konsisten di seluruh mesin pemrosesan BigQuery dan open source.

                            Mengelola lakehouse Anda dengan Knowledge Catalog

                            Knowledge Catalog menyediakan lapisan tata kelola terpadu dengan otomatis menemukan tabel Iceberg di Cloud Storage dan mendaftarkan metadatanya langsung ke katalog runtime Lakehouse. Integrasi ini memungkinkan Anda menentukan kebijakan keamanan terpusat yang memastikan kontrol akses tingkat baris dan kolom yang konsisten di seluruh mesin pemrosesan BigQuery dan open source.

                              Harga

                              Cara kerja penetapan harga Lakehouse (BigLake)Harga (BigLake) Lakehouse didasarkan pada pengelolaan tabel, penyimpanan metadata, dan akses metadata
                              Layanan dan penggunaanDeskripsiHarga (USD)

                              Pengelolaan tabel Lakehouse (BigLake)

                              Resource komputasi pengelolaan tabel Lakehouse (BigLake) yang digunakan untuk pengoptimalan penyimpanan tabel otomatis.

                              Mulai dari

                              $0,12

                              per DCU-Jam

                              Penyimpanan metadata Lakehouse (BigLake)

                              Metastore Lakehouse untuk Apache Iceberg (katalog runtime Lakehouse) mengenakan biaya untuk metadata yang disimpan. Paket gratis mencakup penyimpanan metadata 1 GiB per bulan.

                              Mulai dari

                              $0,04

                              per GiB per bulan

                              Akses metadata Lakehouse (BigLake)

                              Operasi Kelas A: Biaya akses metadata Lakehouse (BigLake) untuk operasi writes, updates, list, create, dan config dengan paket gratis yang mencakup 5.000 operasi per bulan.

                              Mulai dari

                              $6,00

                              per juta operasi

                              Operasi Kelas B: Biaya akses metadata Lakehouse (BigLake) untuk operasi reads, get, dan delete dengan paket gratis yang mencakup 50.000 operasi per bulan.

                              Mulai dari

                              $0,90

                              per juta operasi

                              Cara kerja penetapan harga Lakehouse (BigLake)

                              Harga (BigLake) Lakehouse didasarkan pada pengelolaan tabel, penyimpanan metadata, dan akses metadata

                              Pengelolaan tabel Lakehouse (BigLake)

                              Deskripsi

                              Resource komputasi pengelolaan tabel Lakehouse (BigLake) yang digunakan untuk pengoptimalan penyimpanan tabel otomatis.

                              Harga (USD)

                              Starting at

                              $0,12

                              per DCU-Jam

                              Penyimpanan metadata Lakehouse (BigLake)

                              Deskripsi

                              Metastore Lakehouse untuk Apache Iceberg (katalog runtime Lakehouse) mengenakan biaya untuk metadata yang disimpan. Paket gratis mencakup penyimpanan metadata 1 GiB per bulan.

                              Harga (USD)

                              Starting at

                              $0,04

                              per GiB per bulan

                              Akses metadata Lakehouse (BigLake)

                              Deskripsi

                              Operasi Kelas A: Biaya akses metadata Lakehouse (BigLake) untuk operasi writes, updates, list, create, dan config dengan paket gratis yang mencakup 5.000 operasi per bulan.

                              Harga (USD)

                              Starting at

                              $6,00

                              per juta operasi

                              Operasi Kelas B: Biaya akses metadata Lakehouse (BigLake) untuk operasi reads, get, dan delete dengan paket gratis yang mencakup 50.000 operasi per bulan.

                              Deskripsi

                              Starting at

                              $0,90

                              per juta operasi

                              Kalkulator harga

                              Perkirakan biaya Lakehouse bulanan Anda, termasuk harga dan biaya yang spesifik per region.

                              Penawaran kustom

                              Hubungi tim penjualan kami untuk mendapatkan penawaran harga khusus bagi organisasi Anda.

                              Mulai bukti konsep Anda

                              Mulai uji coba gratis

                              Punya project besar?

                              Tabel Apache Iceberg yang terkelola sepenuhnya

                              Menggunakan katalog REST Apache Iceberg

                              Membuat kueri data Apache Iceberg

                              Google Cloud