Google Cloud Next Tokyo:7/30、31 東京ビッグサイトにて開催!

Lakehouse for Apache Iceberg(旧 BigLake)

エージェントの時代に向けたオープンなクロスクラウド レイクハウス

統合されたクロスクラウドのマルチモーダルなオープン レイクハウスで、スケーラブルな分析、運用、リアルタイム AI のユースケースを構築するためのエンタープライズ ストレージ、ガバナンス、パフォーマンス。

Apache Iceberg は Apache Software Foundation の商標です。



機能

読み取り / 書き込みの相互運用が可能なフルマネージド Iceberg

Lakehouse Iceberg REST Catalog を使用して管理される Apache Iceberg テーブルは、BigQuery と Google Cloud Managed Service for Apache Spark、および Spark、Trino、Flink などの Iceberg 互換 OSS エンジンとの間で読み書きの相互運用を実現します。また、Snowflake や Databricks などのサードパーティ製エンジンとの相互運用も可能になりました(プレビュー版)。これにより、Iceberg テーブルを BigQuery や Google マネージド Spark などのエンジンに直接簡単に接続できるため、AI ワークロードを高速化できます。

Google の AI をクロスクラウドの Iceberg データに接続

クロスクラウド相互接続とキャッシュ保存 (プレビュー版)を活用して、S3 Iceberg データに高速かつ低レイテンシでアクセスできます。AWS データで会話型分析 API ジョブを通じて BigQuery、Spark、Gemini Enterprise を実行し、ネイティブ データ プラットフォーム ソリューションと同等の費用対効果を実現します。さらに、新しいレイクハウス ランタイム カタログ フェデレーション(プレビュー)により、エコシステムがシームレスに統合され、BigQuery と Google マネージド Spark で Snowflake、Databricks、AWS Glue 全体のエンタープライズ データを検出して分析できるようになります。

Iceberg のコスト パフォーマンスの向上

BigQuery の強化されたベクトル化実行が、Lakehouse Iceberg REST Catalog テーブルと、BigQuery カタログの Iceberg テーブルおよび Parquet テーブルでデフォルトになりました。コンパクション、クラスタリング、ガベージ コレクションなどのルーチン Iceberg メンテナンスを Google Lakehouse に直接オフロードします。テーブル管理、パーティショニング、クラスタリング、履歴ベースの最適化(BigQuery カタログの Iceberg テーブルでは一般提供、REST カタログではプレビュー)などの新しい自動化機能により、手動オーバーヘッドなしで価格パフォーマンスが向上します。

BigQuery と Spark の差別化

BigQuery ストリーミングを使用して Iceberg でリアルタイムの分析情報を活用し、高スループットの取り込みと実質ゼロの読み取りレイテンシを実現します。マルチステートメント トランザクションと BigQuery の変更データ レプリケーションを Iceberg テーブルに適用して、複雑な処理パイプラインを構築します(BigQuery カタログは一般提供、REST カタログはプレビュー版)。BigQueryObjectRefs を使用して構造化データと非構造化データを統合することで、マルチモーダル、ベクトル、グラフの分析が可能になります。Lightning Engine により、Spark データ サイエンス ワークロードを最大 4.5 倍高速化します。

エージェント向けのリアルタイムのコンテキストとガバナンス

リアルタイムのトランザクション データで AI エージェントを強化します。Spanner、AlloyDB、Cloud SQL から BigQuery とマネージド Iceberg テーブルに運用データをストリーミングして即座に分析し、これらの分析情報を AlloyDB または Spanner に直接プッシュして、ミリ秒未満のレイテンシと高い QPS で提供します。Knowledge Catalog(旧 Dataplex)の統合により、リネージ、プロファイリング、データ品質による統合ガバナンスを実現します。トランザクション データ、非構造化データ、Iceberg データをビジネス ロジックにマッピングし、エージェントが正確で信頼性が高く、完全に管理された結果を提供するために必要な詳細なコンテキストを提供します。

仕組み

レイクハウス REST カタログは、Iceberg テーブルの一元的なハブとして機能します。BigQuery、Managed Service for Apache Spark、OSS エンジン、パートナーにわたるユニバーサルな読み取り/書き込みアクセスを提供し、データを任意のエンジンにシームレスに接続して AI を加速します。

一般的な使用例

レイクハウスの基盤とモダナイゼーション

オープンで統合されたレイクハウス アーキテクチャにモダナイズ

Google のレイクハウスでデータ基盤をモダナイズしましょう。従来の Hadoop をサーバーレスの Cloud Storage に移行し、BigQuery で Iceberg と Delta Lake を直接クエリして、クラウド間のデータを統合します。Lakehouse Iceberg REST カタログはサイロを排除し、Spark、Trino、Flink の相互運用可能なランタイムを提供します。Hive カタログのサポートにより、Hadoop ワークロードを Iceberg に簡単にモダナイズできます。

    オープンで統合されたレイクハウス アーキテクチャにモダナイズ

    Google のレイクハウスでデータ基盤をモダナイズしましょう。従来の Hadoop をサーバーレスの Cloud Storage に移行し、BigQuery で Iceberg と Delta Lake を直接クエリして、クラウド間のデータを統合します。Lakehouse Iceberg REST カタログはサイロを排除し、Spark、Trino、Flink の相互運用可能なランタイムを提供します。Hive カタログのサポートにより、Hadoop ワークロードを Iceberg に簡単にモダナイズできます。

      マルチエンジンの相互運用性

      BigQuery と OSS エンジン間のシームレスな読み取り / 書き込み共有

      既存の Iceberg パイプラインを移行し、BigQuery またはマネージド Spark を使用してそれらのテーブルにシームレスに読み書きしながら、BigQuery の高度な機能で簡単にモダナイズできます。Spark ETL と BigQuery AI をまったく同じ Iceberg テーブルで実行することで、データ移動なしでデータ サイエンスを強化できます。S3 のデータを使用する会話型分析エージェントを BigQuery で構築する。

        BigQuery と OSS エンジン間のシームレスな読み取り / 書き込み共有

        既存の Iceberg パイプラインを移行し、BigQuery またはマネージド Spark を使用してそれらのテーブルにシームレスに読み書きしながら、BigQuery の高度な機能で簡単にモダナイズできます。Spark ETL と BigQuery AI をまったく同じ Iceberg テーブルで実行することで、データ移動なしでデータ サイエンスを強化できます。S3 のデータを使用する会話型分析エージェントを BigQuery で構築する。

          Iceberg データを AI ワークフローに組み込む

          マルチモーダル データ分析と AI ワークフローの高速化

          BigQuery AI を使用して、構造化された Iceberg テーブルと非構造化データを BigQuery ObjectRefs で組み合わせて、単一の SQL 推論でマルチモーダル分析を強化します。タイムトラベルを使用して Gemini Enterprise エージェント プラットフォーム モデルをトレーニングし、データドリフトをデバッグします。グローバルな REST カタログを統合データメッシュに統合し、大規模なログを手頃な価格で分析するとともに、統合されたノートブックで直接モデルを構築して、AI ワークフローを加速します。


            マルチモーダル データ分析と AI ワークフローの高速化

            BigQuery AI を使用して、構造化された Iceberg テーブルと非構造化データを BigQuery ObjectRefs で組み合わせて、単一の SQL 推論でマルチモーダル分析を強化します。タイムトラベルを使用して Gemini Enterprise エージェント プラットフォーム モデルをトレーニングし、データドリフトをデバッグします。グローバルな REST カタログを統合データメッシュに統合し、大規模なログを手頃な価格で分析するとともに、統合されたノートブックで直接モデルを構築して、AI ワークフローを加速します。


              最高水準の Spark エクスペリエンス

              開発者環境全体でデータ サイエンス ワークロードを強化

              スムーズな Spark エクスペリエンスを実現しましょう。統合された IDE を使用して、Iceberg データの単一コピーで SQL、Spark、Python を実行します。新しい Antigravity VS Code 拡張機能は、パイプラインの生成、コードのデバッグ、自然言語からの CI/CD の自動化を行う AI パートナーとして機能します。さらに、ベクトル化された Lightning Engine は、コードを変更することなく Spark の実行を最大 4.5 倍高速化します。

                開発者環境全体でデータ サイエンス ワークロードを強化

                スムーズな Spark エクスペリエンスを実現しましょう。統合された IDE を使用して、Iceberg データの単一コピーで SQL、Spark、Python を実行します。新しい Antigravity VS Code 拡張機能は、パイプラインの生成、コードのデバッグ、自然言語からの CI/CD の自動化を行う AI パートナーとして機能します。さらに、ベクトル化された Lightning Engine は、コードを変更することなく Spark の実行を最大 4.5 倍高速化します。

                  BigQuery による高パフォーマンスの分析

                  BigQuery によるパフォーマンスの最適化

                  柔軟なストレージを維持しながら、BigQuery のスケールを活用できます。BigQuery でマルチステートメント トランザクションを実行して、複数の Iceberg テーブルを単一のアトミック ユニットとして更新し、財務グレードの整合性を確保します。BigQuery の高度なランタイムと Iceberg のパーティショニング サポートを使用して、ブロック プルーニングを活用するパーティション分割テーブルやクラスタ化テーブルを作成し、高速で費用対効果の高いクエリを実行できます。

                    BigQuery によるパフォーマンスの最適化

                    柔軟なストレージを維持しながら、BigQuery のスケールを活用できます。BigQuery でマルチステートメント トランザクションを実行して、複数の Iceberg テーブルを単一のアトミック ユニットとして更新し、財務グレードの整合性を確保します。BigQuery の高度なランタイムと Iceberg のパーティショニング サポートを使用して、ブロック プルーニングを活用するパーティション分割テーブルやクラスタ化テーブルを作成し、高速で費用対効果の高いクエリを実行できます。

                      リアルタイム インテリジェンス

                      エージェント型 AI のためにトランザクションと分析を組み合わせる

                      トランザクション データと分析データを統合することで、イベント ドリブンな AI エージェントを強化します。Spanner と AlloyDB から Lakehouse Iceberg テーブルへの直接かつ継続的な CDC レプリケーションを自動化します。次に、SQL 継続的クエリを使用してこのストリーミング データをモニタリングし、AI 推論を即座に実行して、ダウンストリーム アクションをトリガーします。これにより、最も重要な運用ワークロードにリアルタイムの分析情報を付与します。

                        エージェント型 AI のためにトランザクションと分析を組み合わせる

                        トランザクション データと分析データを統合することで、イベント ドリブンな AI エージェントを強化します。Spanner と AlloyDB から Lakehouse Iceberg テーブルへの直接かつ継続的な CDC レプリケーションを自動化します。次に、SQL 継続的クエリを使用してこのストリーミング データをモニタリングし、AI 推論を即座に実行して、ダウンストリーム アクションをトリガーします。これにより、最も重要な運用ワークロードにリアルタイムの分析情報を付与します。

                          エンドツーエンドのレイクハウス ガバナンス

                          Knowledge Catalog でレイクハウスを管理する

                          Knowledge Catalog は、Cloud Storage 内の Iceberg テーブルを自動的に検出し、そのメタデータをレイクハウス ランタイム カタログに直接登録することで、統合されたガバナンス レイヤを提供します。この統合により、一元化されたセキュリティ ポリシーを定義して、BigQuery とオープンソースの処理エンジンの両方で一貫した行レベルと列レベルのアクセス制御を確保できます。

                            Knowledge Catalog でレイクハウスを管理する

                            Knowledge Catalog は、Cloud Storage 内の Iceberg テーブルを自動的に検出し、そのメタデータをレイクハウス ランタイム カタログに直接登録することで、統合されたガバナンス レイヤを提供します。この統合により、一元化されたセキュリティ ポリシーを定義して、BigQuery とオープンソースの処理エンジンの両方で一貫した行レベルと列レベルのアクセス制御を確保できます。

                              料金

                              レイクハウス(BigLake)の料金の仕組みLakehouse(BigLake)の料金は、テーブル管理、メタデータ ストレージ、メタデータ アクセスに基づいています。
                              サービスと用途説明料金(米ドル)

                              レイクハウス(BigLake)テーブル管理

                              テーブル ストレージの自動最適化に使用されるレイクハウス(BigLake)テーブル管理コンピューティング リソース。

                              目安

                              $0.12

                              DCU 時間あたり

                              レイクハウス(BigLake)のメタデータ ストレージ

                              Lakehouse for Apache Iceberg metastore(レイクハウス ランタイム カタログ)では、保存されているメタデータに対して課金されます。無料枠には、1 か月あたり 1 GiB のメタデータ ストレージが含まれます。

                              目安

                              $0.04

                              1 GiB あたりの月額

                              レイクハウス(BigLake)メタデータへのアクセス

                              クラス A オペレーション: 書き込み、更新、一覧参照、作成、構成オペレーションに対するレイクハウス(BigLake)メタデータ アクセス料金。1 か月あたり 5,000 オペレーションの無料枠が含まれます。

                              目安

                              $6.00

                              100 万件のオペレーションあたり

                              クラス B オペレーション: 読み取り、取得、削除オペレーションに対するレイクハウス(BigLake)メタデータ アクセス料金。1 か月あたり 50,000 オペレーションの無料枠が含まれます。

                              目安

                              $0.90

                              100 万件のオペレーションあたり

                              レイクハウス(BigLake)の料金の仕組み

                              Lakehouse(BigLake)の料金は、テーブル管理、メタデータ ストレージ、メタデータ アクセスに基づいています。

                              レイクハウス(BigLake)テーブル管理

                              説明

                              テーブル ストレージの自動最適化に使用されるレイクハウス(BigLake)テーブル管理コンピューティング リソース。

                              料金(米ドル)

                              Starting at

                              $0.12

                              DCU 時間あたり

                              レイクハウス(BigLake)のメタデータ ストレージ

                              説明

                              Lakehouse for Apache Iceberg metastore(レイクハウス ランタイム カタログ)では、保存されているメタデータに対して課金されます。無料枠には、1 か月あたり 1 GiB のメタデータ ストレージが含まれます。

                              料金(米ドル)

                              Starting at

                              $0.04

                              1 GiB あたりの月額

                              レイクハウス(BigLake)メタデータへのアクセス

                              説明

                              クラス A オペレーション: 書き込み、更新、一覧参照、作成、構成オペレーションに対するレイクハウス(BigLake)メタデータ アクセス料金。1 か月あたり 5,000 オペレーションの無料枠が含まれます。

                              料金(米ドル)

                              Starting at

                              $6.00

                              100 万件のオペレーションあたり

                              クラス B オペレーション: 読み取り、取得、削除オペレーションに対するレイクハウス(BigLake)メタデータ アクセス料金。1 か月あたり 50,000 オペレーションの無料枠が含まれます。

                              説明

                              Starting at

                              $0.90

                              100 万件のオペレーションあたり

                              料金計算ツール

                              リージョン固有の料金と手数料を含む、Lakehouse の毎月の費用を試算できます。

                              カスタムの見積もり

                              カスタム見積もりをご希望の場合は、Google のセールスチームにお問い合わせください。

                              概念実証を開始する

                              無料トライアルを開始する

                              大規模なプロジェクトを計画していますか?

                              フルマネージドの Apache Iceberg テーブル

                              Apache Iceberg REST カタログを使用する

                              Apache Iceberg データにクエリを実行する

                              • Google Cloud プロダクト
                              • 100 種類を超えるプロダクトをご用意しています。新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。また、すべてのお客様に 25 以上のプロダクトを無料でご利用いただけます(毎月の使用量上限があります)。
                              Google Cloud