データレイクハウスの未来: エージェント主導の時代に向けたオープンで相互運用可能なデータレイクハウス。ブログを読む。

Lakehouse for Apache Iceberg（旧 BigLake）

エージェントの時代に向けたオープンなクロスクラウドレイクハウス

統合されたクロスクラウドのマルチモーダルなオープンレイクハウスで、スケーラブルな分析、運用、リアルタイム AI のユースケースを構築するためのエンタープライズストレージ、ガバナンス、パフォーマンス。

Apache Iceberg は Apache Software Foundation の商標です。

機能

読み取り / 書き込みの相互運用が可能なフルマネージド Iceberg

Lakehouse Iceberg REST Catalog を使用して管理される Apache Iceberg テーブルは、BigQuery と Google Cloud Managed Service for Apache Spark、および Spark、Trino、Flink などの Iceberg 互換 OSS エンジンとの間で読み書きの相互運用を実現します。また、Snowflake や Databricks などのサードパーティ製エンジンとの相互運用も可能になりました（プレビュー版）。これにより、Iceberg テーブルを BigQuery や Google マネージド Spark などのエンジンに直接簡単に接続できるため、AI ワークロードを高速化できます。

Google の AI をクロスクラウドの Iceberg データに接続

クロスクラウド相互接続とキャッシュ保存 （プレビュー版）を活用して、S3 Iceberg データに高速かつ低レイテンシでアクセスできます。AWS データで会話型分析 API ジョブを通じて BigQuery、Spark、Gemini Enterprise を実行し、ネイティブデータプラットフォームソリューションと同等の費用対効果を実現します。さらに、新しいレイクハウスランタイムカタログフェデレーション（プレビュー）により、エコシステムがシームレスに統合され、BigQuery と Google マネージド Spark で Snowflake、Databricks、AWS Glue 全体のエンタープライズデータを検出して分析できるようになります。

Iceberg のコストパフォーマンスの向上

BigQuery の強化されたベクトル化実行が、Lakehouse Iceberg REST Catalog テーブルと、BigQuery カタログの Iceberg テーブルおよび Parquet テーブルでデフォルトになりました。コンパクション、クラスタリング、ガベージコレクションなどのルーチン Iceberg メンテナンスを Google Lakehouse に直接オフロードします。テーブル管理、パーティショニング、クラスタリング、履歴ベースの最適化（BigQuery カタログの Iceberg テーブルでは一般提供、REST カタログではプレビュー）などの新しい自動化機能により、手動オーバーヘッドなしで価格パフォーマンスが向上します。

BigQuery と Spark の差別化

BigQuery ストリーミングを使用して Iceberg でリアルタイムの分析情報を活用し、高スループットの取り込みと実質ゼロの読み取りレイテンシを実現します。マルチステートメントトランザクションと BigQuery の変更データレプリケーションを Iceberg テーブルに適用して、複雑な処理パイプラインを構築します（BigQuery カタログは一般提供、REST カタログはプレビュー版）。BigQueryObjectRefs を使用して構造化データと非構造化データを統合することで、マルチモーダル、ベクトル、グラフの分析が可能になります。Lightning Engine により、Spark データサイエンスワークロードを最大 4.5 倍高速化します。

エージェント向けのリアルタイムのコンテキストとガバナンス

リアルタイムのトランザクションデータで AI エージェントを強化します。Spanner、AlloyDB、Cloud SQL から BigQuery とマネージド Iceberg テーブルに運用データをストリーミングして即座に分析し、これらの分析情報を AlloyDB や Spanner に直接 push して、ミリ秒未満の低レイテンシと高い QPS で提供します。Knowledge Catalog（旧称 Dataplex）の統合により、リネージ、プロファイリング、データ品質による統合ガバナンスを実現します。トランザクションデータ、非構造化データ、Iceberg データをビジネスロジックにマッピングし、エージェントが正確で信頼性が高く、完全に管理された結果を提供するために必要な詳細なコンテキストを提供します。すぐに使用できるデータクラウドエージェントを使用することも、Data Agent Kit を使用して独自の IDE から直接ワークフローを効率化することもできます。

仕組み

レイクハウス REST カタログは、Iceberg テーブルの一元的なハブとして機能します。BigQuery、Managed Service for Apache Spark、OSS エンジン、パートナーにわたるユニバーサルな読み取り/書き込みアクセスを提供し、データを任意のエンジンにシームレスに接続して AI を加速します。

一般的な使用例

レイクハウスの基盤とモダナイゼーション

オープンで統合されたレイクハウスアーキテクチャにモダナイズ

Google のレイクハウスでデータ基盤をモダナイズしましょう。従来の Hadoop をサーバーレスの Cloud Storage に移行し、BigQuery で Iceberg と Delta Lake を直接クエリして、クラウド間のデータを統合します。Lakehouse Iceberg REST カタログはサイロを排除し、Spark、Trino、Flink の相互運用可能なランタイムを提供します。Hive カタログのサポートにより、Hadoop ワークロードを Iceberg に簡単にモダナイズできます。

チュートリアル、クイックスタート、ラボ

オープンで統合されたレイクハウスアーキテクチャにモダナイズ

Google のレイクハウスでデータ基盤をモダナイズしましょう。従来の Hadoop をサーバーレスの Cloud Storage に移行し、BigQuery で Iceberg と Delta Lake を直接クエリして、クラウド間のデータを統合します。Lakehouse Iceberg REST カタログはサイロを排除し、Spark、Trino、Flink の相互運用可能なランタイムを提供します。Hive カタログのサポートにより、Hadoop ワークロードを Iceberg に簡単にモダナイズできます。

マルチエンジンの相互運用性

BigQuery と OSS エンジン間のシームレスな読み取り / 書き込み共有

既存の Iceberg パイプラインを移行し、BigQuery またはマネージド Spark を使用してそれらのテーブルにシームレスに読み書きしながら、BigQuery の高度な機能で簡単にモダナイズできます。Spark ETL と BigQuery AI をまったく同じ Iceberg テーブルで実行することで、データ移動なしでデータサイエンスを強化できます。S3 のデータを使用する会話型分析エージェントを BigQuery で構築する。

チュートリアル、クイックスタート、ラボ

BigQuery と OSS エンジン間のシームレスな読み取り / 書き込み共有

既存の Iceberg パイプラインを移行し、BigQuery またはマネージド Spark を使用してそれらのテーブルにシームレスに読み書きしながら、BigQuery の高度な機能で簡単にモダナイズできます。Spark ETL と BigQuery AI をまったく同じ Iceberg テーブルで実行することで、データ移動なしでデータサイエンスを強化できます。S3 のデータを使用する会話型分析エージェントを BigQuery で構築する。

Iceberg データを AI ワークフローに組み込む

マルチモーダルデータ分析と AI ワークフローの高速化

BigQuery AI を使用して、構造化された Iceberg テーブルと非構造化データを BigQuery ObjectRefs で組み合わせて、単一の SQL 推論でマルチモーダル分析を強化します。タイムトラベルを使用して Gemini Enterprise エージェントプラットフォームモデルをトレーニングし、データドリフトをデバッグします。グローバルな REST カタログを統合データメッシュに統合し、大規模なログを手頃な価格で分析するとともに、統合されたノートブックで直接モデルを構築して、AI ワークフローを加速します。

チュートリアル、クイックスタート、ラボ

マルチモーダルデータ分析と AI ワークフローの高速化

BigQuery AI を使用して、構造化された Iceberg テーブルと非構造化データを BigQuery ObjectRefs で組み合わせて、単一の SQL 推論でマルチモーダル分析を強化します。タイムトラベルを使用して Gemini Enterprise エージェントプラットフォームモデルをトレーニングし、データドリフトをデバッグします。グローバルな REST カタログを統合データメッシュに統合し、大規模なログを手頃な価格で分析するとともに、統合されたノートブックで直接モデルを構築して、AI ワークフローを加速します。

最高水準の Spark エクスペリエンス

開発者環境全体でデータサイエンスワークロードを強化

スムーズな Spark エクスペリエンスを実現しましょう。統合された IDE を使用して、Iceberg データの単一コピーで SQL、Spark、Python を実行します。新しい Antigravity VS Code 拡張機能は、パイプラインの生成、コードのデバッグ、自然言語からの CI/CD の自動化を行う AI パートナーとして機能します。さらに、ベクトル化された Lightning Engine は、コードを変更することなく Spark の実行を最大 4.5 倍高速化します。

チュートリアル、クイックスタート、ラボ

開発者環境全体でデータサイエンスワークロードを強化

スムーズな Spark エクスペリエンスを実現しましょう。統合された IDE を使用して、Iceberg データの単一コピーで SQL、Spark、Python を実行します。新しい Antigravity VS Code 拡張機能は、パイプラインの生成、コードのデバッグ、自然言語からの CI/CD の自動化を行う AI パートナーとして機能します。さらに、ベクトル化された Lightning Engine は、コードを変更することなく Spark の実行を最大 4.5 倍高速化します。

BigQuery による高パフォーマンスの分析

BigQuery によるパフォーマンスの最適化

柔軟なストレージを維持しながら、BigQuery のスケールを活用できます。BigQuery でマルチステートメントトランザクションを実行して、複数の Iceberg テーブルを単一のアトミックユニットとして更新し、財務グレードの整合性を確保します。BigQuery の高度なランタイムと Iceberg のパーティショニングサポートを使用して、ブロックプルーニングを活用するパーティション分割テーブルやクラスタ化テーブルを作成し、高速で費用対効果の高いクエリを実行できます。

チュートリアル、クイックスタート、ラボ

BigQuery によるパフォーマンスの最適化

柔軟なストレージを維持しながら、BigQuery のスケールを活用できます。BigQuery でマルチステートメントトランザクションを実行して、複数の Iceberg テーブルを単一のアトミックユニットとして更新し、財務グレードの整合性を確保します。BigQuery の高度なランタイムと Iceberg のパーティショニングサポートを使用して、ブロックプルーニングを活用するパーティション分割テーブルやクラスタ化テーブルを作成し、高速で費用対効果の高いクエリを実行できます。

リアルタイムインテリジェンス

エージェント型 AI のためにトランザクションと分析を組み合わせる

トランザクションデータと分析データを統合することで、イベントドリブンな AI エージェントを強化します。Spanner と AlloyDB から Lakehouse Iceberg テーブルへの直接かつ継続的な CDC レプリケーションを自動化します。次に、SQL 継続的クエリを使用してこのストリーミングデータをモニタリングし、AI 推論を即座に実行して、ダウンストリームアクションをトリガーします。これにより、最も重要な運用ワークロードにリアルタイムの分析情報を付与します。

チュートリアル、クイックスタート、ラボ

エージェント型 AI のためにトランザクションと分析を組み合わせる

トランザクションデータと分析データを統合することで、イベントドリブンな AI エージェントを強化します。Spanner と AlloyDB から Lakehouse Iceberg テーブルへの直接かつ継続的な CDC レプリケーションを自動化します。次に、SQL 継続的クエリを使用してこのストリーミングデータをモニタリングし、AI 推論を即座に実行して、ダウンストリームアクションをトリガーします。これにより、最も重要な運用ワークロードにリアルタイムの分析情報を付与します。

エンドツーエンドのレイクハウスガバナンス

Knowledge Catalog でレイクハウスを管理する

Knowledge Catalog は、Cloud Storage 内の Iceberg テーブルを自動的に検出し、そのメタデータをレイクハウスランタイムカタログに直接登録することで、統合されたガバナンスレイヤを提供します。この統合により、一元化されたセキュリティポリシーを定義して、BigQuery とオープンソースの処理エンジンの両方で一貫した行レベルと列レベルのアクセス制御を確保できます。

チュートリアル、クイックスタート、ラボ

Knowledge Catalog でレイクハウスを管理する

Knowledge Catalog は、Cloud Storage 内の Iceberg テーブルを自動的に検出し、そのメタデータをレイクハウスランタイムカタログに直接登録することで、統合されたガバナンスレイヤを提供します。この統合により、一元化されたセキュリティポリシーを定義して、BigQuery とオープンソースの処理エンジンの両方で一貫した行レベルと列レベルのアクセス制御を確保できます。

料金

レイクハウス（BigLake）の料金の仕組み	Lakehouse（BigLake）の料金は、テーブル管理、メタデータストレージ、メタデータアクセスに基づいています。
サービスと用途	説明	料金（米ドル）
レイクハウステーブル管理（旧称: BigLake）	状況適応型のファイルサイジング、自動クラスタリング、ガベージコレクション、BigQuery メタデータ（CMETA）の生成など、テーブルストレージの自動最適化に使用されるレイクハウステーブル管理コンピューティングリソース。	目安 $0.12 DCU 時間あたり
レイクハウス（BigLake）のメタデータストレージ	レイクハウスランタイムカタログ（旧称 BigLake metastore）では、保存されているメタデータに対して課金されます。無料枠には、1 か月あたり 1 GiB のメタデータストレージが含まれます。	無料 1 か月あたり 1 GiB のメタデータストレージ
レイクハウス（BigLake）のメタデータストレージ	レイクハウスランタイムカタログ（旧称 BigLake metastore）では、1 か月あたり 1 GiB のメタデータストレージの無料枠を超えて保存されたメタデータに対して課金されます。	目安 $0.04 1 GiB あたりの月額
レイクハウス（BigLake）メタデータへのアクセス	クラス A オペレーション: 書き込み、更新、一覧参照、作成、構成オペレーションに対するレイクハウスメタデータアクセス料金。1 か月あたり 5,000 オペレーションの無料枠が含まれます。具体的なオペレーション: 作成登録一覧参照更新（テーブルからの行の削除を含む） setIamPolicy メタデータファイルが 1 MB を超える場合 1 MB ごとに 1 オペレーションとして処理 1 MB = 1 オペレーション、2 MB = 2 オペレーション、5 MB = 5 オペレーション	目安 $6.00 5,001 件を超えるオペレーション 100 万件あたり（1 か月あたり / アカウントあたり）
レイクハウス（BigLake）メタデータへのアクセス	クラス B オペレーション: 読み取り、取得、削除オペレーションに対するレイクハウス（BigLake）メタデータアクセス料金。1 か月あたり 50,000 オペレーションの無料枠が含まれます。具体的なオペレーション: 読み取り削除 getIamPolicy メタデータファイルが 1 MB を超える場合 1 MB ごとに 1 オペレーションとして処理 1 MB = 1 オペレーション、2 MB = 2 オペレーション、5 MB = 5 オペレーション	目安 $0.90 50,001 件を超える 100 万件のオペレーションあたり
レイクハウスカタログの連携: メタデータの更新	外部カタログ（Databricks Unity Catalog など）からメタデータを更新するメタデータ更新オペレーション。1 か月あたり / アカウントあたり 0～5,001 件の無料枠があります。メタデータファイルが 1 MB を超える場合 1 MB ごとに 1 オペレーションとして処理 1 MB = 1 オペレーション、2 MB = 2 オペレーション、5 MB = 5 オペレーション	目安 $6.00 5,001 件を超えるオペレーション 100 万件あたり（1 か月あたり / アカウントあたり）

レイクハウス（BigLake）の料金の仕組み

Lakehouse（BigLake）の料金は、テーブル管理、メタデータストレージ、メタデータアクセスに基づいています。

レイクハウステーブル管理（旧称: BigLake）

説明

状況適応型のファイルサイジング、自動クラスタリング、ガベージコレクション、BigQuery メタデータ（CMETA）の生成など、テーブルストレージの自動最適化に使用されるレイクハウステーブル管理コンピューティングリソース。

料金（米ドル）

Starting at

$0.12

DCU 時間あたり

レイクハウス（BigLake）のメタデータストレージ

説明

レイクハウスランタイムカタログ（旧称 BigLake metastore）では、保存されているメタデータに対して課金されます。無料枠には、1 か月あたり 1 GiB のメタデータストレージが含まれます。

料金（米ドル）

無料

1 か月あたり 1 GiB のメタデータストレージ

レイクハウスランタイムカタログ（旧称 BigLake metastore）では、1 か月あたり 1 GiB のメタデータストレージの無料枠を超えて保存されたメタデータに対して課金されます。

説明

Starting at

$0.04

1 GiB あたりの月額

レイクハウス（BigLake）メタデータへのアクセス

説明

クラス A オペレーション: 書き込み、更新、一覧参照、作成、構成オペレーションに対するレイクハウスメタデータアクセス料金。1 か月あたり 5,000 オペレーションの無料枠が含まれます。

具体的なオペレーション:

作成
登録
一覧参照
更新（テーブルからの行の削除を含む）
setIamPolicy

メタデータファイルが 1 MB を超える場合

1 MB ごとに 1 オペレーションとして処理
1 MB = 1 オペレーション、2 MB = 2 オペレーション、5 MB = 5 オペレーション

料金（米ドル）

Starting at

$6.00

5,001 件を超えるオペレーション 100 万件あたり（1 か月あたり / アカウントあたり）

クラス B オペレーション: 読み取り、取得、削除オペレーションに対するレイクハウス（BigLake）メタデータアクセス料金。1 か月あたり 50,000 オペレーションの無料枠が含まれます。

具体的なオペレーション:

読み取り
削除
getIamPolicy

メタデータファイルが 1 MB を超える場合

1 MB ごとに 1 オペレーションとして処理
1 MB = 1 オペレーション、2 MB = 2 オペレーション、5 MB = 5 オペレーション

説明

Starting at

$0.90

50,001 件を超える 100 万件のオペレーションあたり

レイクハウスカタログの連携: メタデータの更新

説明

外部カタログ（Databricks Unity Catalog など）からメタデータを更新するメタデータ更新オペレーション。1 か月あたり / アカウントあたり 0～5,001 件の無料枠があります。

メタデータファイルが 1 MB を超える場合

1 MB ごとに 1 オペレーションとして処理
1 MB = 1 オペレーション、2 MB = 2 オペレーション、5 MB = 5 オペレーション

料金（米ドル）

Starting at

$6.00

5,001 件を超えるオペレーション 100 万件あたり（1 か月あたり / アカウントあたり）

料金計算ツール

リージョン固有の料金と手数料を含む、Lakehouse の毎月の費用を試算できます。

カスタムの見積もり

カスタム見積もりをご希望の場合は、Google のセールスチームにお問い合わせください。

Lakehouse for Apache Iceberg（旧 BigLake）

エージェントの時代に向けたオープンなクロスクラウド レイクハウス

商品に関する情報

読み取り / 書き込みの相互運用が可能なフルマネージド Iceberg

Google の AI をクロスクラウドの Iceberg データに接続

Iceberg のコスト パフォーマンスの向上

BigQuery と Spark の差別化

エージェント向けのリアルタイムのコンテキストとガバナンス

レイクハウスの基盤とモダナイゼーション

オープンで統合されたレイクハウス アーキテクチャにモダナイズ

チュートリアル、クイックスタート、ラボ

オープンで統合されたレイクハウス アーキテクチャにモダナイズ

マルチエンジンの相互運用性

BigQuery と OSS エンジン間のシームレスな読み取り / 書き込み共有

チュートリアル、クイックスタート、ラボ

BigQuery と OSS エンジン間のシームレスな読み取り / 書き込み共有

Iceberg データを AI ワークフローに組み込む

マルチモーダル データ分析と AI ワークフローの高速化

チュートリアル、クイックスタート、ラボ

マルチモーダル データ分析と AI ワークフローの高速化

最高水準の Spark エクスペリエンス

開発者環境全体でデータ サイエンス ワークロードを強化

チュートリアル、クイックスタート、ラボ

開発者環境全体でデータ サイエンス ワークロードを強化

BigQuery による高パフォーマンスの分析

BigQuery によるパフォーマンスの最適化

チュートリアル、クイックスタート、ラボ

BigQuery によるパフォーマンスの最適化

リアルタイム インテリジェンス

エージェント型 AI のためにトランザクションと分析を組み合わせる

チュートリアル、クイックスタート、ラボ

エージェント型 AI のためにトランザクションと分析を組み合わせる

エンドツーエンドのレイクハウス ガバナンス

Knowledge Catalog でレイクハウスを管理する

チュートリアル、クイックスタート、ラボ

Knowledge Catalog でレイクハウスを管理する

料金計算ツール

カスタムの見積もり

概念実証を開始する

無料トライアルを開始する

大規模なプロジェクトを計画していますか？

フルマネージドの Apache Iceberg テーブル

Apache Iceberg REST カタログを使用する

Apache Iceberg データにクエリを実行する

エージェントの時代に向けたオープンなクロスクラウドレイクハウス

Iceberg のコストパフォーマンスの向上

オープンで統合されたレイクハウスアーキテクチャにモダナイズ

オープンで統合されたレイクハウスアーキテクチャにモダナイズ

マルチモーダルデータ分析と AI ワークフローの高速化

マルチモーダルデータ分析と AI ワークフローの高速化

開発者環境全体でデータサイエンスワークロードを強化

開発者環境全体でデータサイエンスワークロードを強化

リアルタイムインテリジェンス

エンドツーエンドのレイクハウスガバナンス