「The Forrester Wave™: Data Lakehouses Q2 2024」レポートで Google がリーダーに選出されました。

BigLake

BigLake は、分析エンジンと AI エンジンでマルチフォーマット、マルチクラウド、マルチモーダルのデータを安全かつ管理されたパフォーマンスの高い方法でクエリするための統合インターフェースを提供するストレージエンジンです。カスタムデータインフラストラクチャの管理と必要性を削減するように設計された単一コピーの AI レイクハウスを構築できます。

無料で開始お問い合わせ

2024 年の SIGMOD イベントでは、新しい調査 BigQuery's Evolution toward a Multi-Cloud Lakehouse（BigQuery のマルチクラウドレイクハウスに向けた進化）などの継続的なイノベーションについて発表する予定です。
データレイクとデータウェアハウスを統合して、構造化データと非構造化データの両方を保存、処理、分析できる Google 推奨のソリューションをデプロイしましょう
分析と AI を使用して、構造化データと非構造化データとクエリの単一コピーを保存
分散データに対するきめ細かいアクセス制御とマルチクラウドガバナンス。
オープン形式のレイクハウスの自動データ管理によるフルマネージドエクスペリエンス

動画

BigLake がどのようにクラウド、データ形式全体で、データレイク、データウェアハウスを統合しているかを確認する

2:00

利点

選択の自由

データの保存場所や方法に関係なく、分散データの分析が可能になります。また、データのコピーの 1 つを基にして、最適な分析ツール、オープンソース、またはクラウドネイティブを選択できます。

安全で高性能なデータレイク

Apache Spark、Presto、Trino などのオープンソースエンジンや Parquet などのオープンフォーマットをカバーするきめ細かなアクセス制御。BigQuery を利用したデータレイクで効率の良いクエリを行います。

大規模なガバナンスと管理の統合

Dataplex と統合して、論理データ編成、ポリシーとメタデータの一元管理、品質とライフサイクル管理などの大規模な管理を行い、分散データ間の整合性を確保します。

主な機能

きめ細かいセキュリティ管理

BigLake を使用すると、エンドユーザーにファイルレベルのアクセス権を付与する必要がなくなります。既存の BigQuery テーブルと同様のオブジェクトストアテーブルに、テーブル、行、列レベルのセキュリティポリシーを適用します。

マルチコンピューティング分析

構造化データと非構造化データの単一のコピーを維持し、BigLake コネクタを使用して、Google Cloud と BigQuery、Vertex AI、Dataflow、Spark、Presto、Trino、Hive などのオープンソースエンジンで統一的にデータにアクセスできるようにします。セキュリティポリシーを 1 か所で一元管理し、コネクタに組み込まれた API インターフェースでクエリエンジン全体に一貫したセキュリティポリシーを適用します。

マルチクラウドガバナンス

Amazon S3、Azure データレイク Gen 2 で定義したものも含め、すべての BigLake テーブルを Data Catalog で探します。 BigQuery Omni を使用してクエリを実行する場合、きめ細かいアクセス制御を構成して、クラウド全体で適用させます。

人工知能（AI）向けに構築

オブジェクトテーブルを使用すると、管理された AI ワークロードにマルチモーダルなデータを使用できます。BigQuery SQL とその Vertex AI インテグレーションを使用して、AI ユースケースを簡単に構築できます。

オープンフォーマット上に構築

Parquet、Avro、ORC、CSV、JSON などのオープンソースのテーブル形式とファイル形式をサポート。この API は、Apache Arrow で複数のコンピューティングエンジンに対応します。テーブル形式は、マニフェストを介して Apache Iceberg、Delta、Hudi をネイティブにサポートしています。