オープンで、マネージドで、インテリジェントなデータ レイクハウスを Google Cloud に構築します

Google の業界をリードする AI と統合された高パフォーマンスのデータ レイクハウスにより、マルチモーダル データを統合して管理します。Apache Iceberg と業界初の自動スケーリングに対応したサーバーレス Spark を最大限に活用して、データ処理、分析、AI イニシアチブを簡素化します。

Google のパワーをオープン データ レイクハウスに活用

オープン データ形式の新しいイノベーション、インテリジェント データから AI へのガバナンス、データ処理の高速化、高度な AI 支援開発ツールがすべて組み合わさることで、データ管理が効率化され、イノベーションが加速します。

BigLake

エンタープライズ グレードのストレージ管理で Apache Iceberg のオープン性を実現

BigLake は、Cloud Storage の相互運用性を実現するネイティブの Iceberg ストレージ エンジンを提供し、統合されたランタイム メタデータ管理を実現します。また、高度な分析とデータ サイエンスを可能にし、組み込みのガバナンス機能による自動データ管理を提供します。Iceberg と互換性のあるエンジンであれば、BigLake の自動テーブル管理を活用して、クエリのパフォーマンスを向上させ、費用を削減できます。


“Google Cloud とのパートナーシップは、Snap の次世代オープン レイクハウスを構築し、デベロッパー コミュニティで Spark と Iceberg の普及を推進する取り組みにおいて非常に重要な役割を果たしてきました。”

Snap、シニア マネージャー、ソフトウェア エンジニア、Zhengyi Liu 氏

BigLake

エンタープライズ グレードのストレージ管理で Apache Iceberg のオープン性を実現

BigLake は、Cloud Storage の相互運用性を実現するネイティブの Iceberg ストレージ エンジンを提供し、統合されたランタイム メタデータ管理を実現します。また、高度な分析とデータ サイエンスを可能にし、組み込みのガバナンス機能による自動データ管理を提供します。Iceberg と互換性のあるエンジンであれば、BigLake の自動テーブル管理を活用して、クエリのパフォーマンスを向上させ、費用を削減できます。


“Google Cloud とのパートナーシップは、Snap の次世代オープン レイクハウスを構築し、デベロッパー コミュニティで Spark と Iceberg の普及を推進する取り組みにおいて非常に重要な役割を果たしてきました。”

Snap、シニア マネージャー、ソフトウェア エンジニア、Zhengyi Liu 氏

Apache Spark 用 Google Cloud Serverless

サーバーレス Spark は、クラスタ管理を必要とせず、高いパフォーマンスと超高速処理を実現

Google Cloud Serverless for Apache Spark でレイクハウスを変革します。新しい Lightning Engine で、Spark ワークロードのパフォーマンスを向上させながら、迅速な起動とゼロ運用のオーバーヘッドを実現できます。この Gemini との強力な組み合わせにより、生産性を向上させ、TCO を最大 60% 削減できます。


“私たちは、SQL と Spark を、データにアクセスして変換する 2 つの補完的な方法と考えています。Spark は、ニッチであるものの、ビジネスにとって非常に重要な複雑なビジネス ロジックを必要とするユースケースで特に役立ちます。SQL、Spark、AI の統合プラットフォームとノートブックでの開発エクスペリエンスがあれば、これらの重要なユースケースを大幅に簡素化できます。”

trivago、コンテンツ エンジニアリング担当責任者、Andrés Sopeña Pérez 氏

Dataplex Universal Catalog

データ レイクハウスにおけるデータの検出、理解、信頼性を簡素化

Dataplex ユニバーサル カタログは、Google Cloud 向けの統合データから AI へのガバナンス ソリューションです。この AI を活用したカタログは、Google Cloud 全体のビジネス、技術、運用のメタデータを一元化し、AI による分析情報を提供します。Apache Iceberg などのオープン形式をサポートしており、レイクハウス全体で統合されたガバナンスを実現します。


“Dataplex は、当社のデータ プラットフォームを安全で効率的、かつスケーラブルなデータ エコシステムに変革する上で重要な役割を果たしてきました。当社は、データ ガバナンス、検出、オブザーバビリティ、セキュリティ コンプライアンスに注力し、デジタル時代におけるデータ マネジメントの課題に対応するためのツールを手に入れました。Dataplex のおかげで、データの潜在能力を最大限に引き出し、Box.Inc の成長とイノベーションを継続することができています。”

Box.Inc、シニア プロダクト マネージャー Asmita Kulkarni 氏

BigQuery Studio と IDE 拡張機能

開発と運用の強化によりレイクハウス アーキテクチャ内の高度なデータ サイエンスおよび AI/ML ワークロード向け Apache Spark を強化

Dataproc は、GPU ドライバと一般的な ML ライブラリを備えた ML ランタイムの新しいイノベーションにより、レイクハウス上の AI / ML 向け Spark を進化させています。BigQuery Studio とサードパーティ IDE の Colab Enterprise ノートブックは、Vertex AI との統合 MLOps と合理化された本番環境パイプラインを提供し、データ サイエンスを加速します。


“「Shopify は、データ サイエンスやデータ エンジニアリングのトレンドの最先端に立ち続けるため、幅広いスキルセットを持つ人材の採用に投資してきました。BigQuery Studio の早期テストで、私たちは、ユーザーごとに異なるツールをシンプルに接続できる Google の能力がとても気に入りました。これは、BigQuery に期待しているスケールを犠牲にすることなくチーム内における非効率性を低減する良い機会だと考えています。」”

Shopify、データ エンジニアリング マネージャー Zac Roberts 氏

データ レイクハウスのツアーを今すぐ開始

レガシー システムの移行でも、Iceberg ファーストのレイクハウスの設計でも、Google Cloud には、オープンでマネージドの AI 対応のレイクハウスを構築するのに役立つテクノロジーがあります。


  • Google Cloud プロダクト
  • 100 種類を超えるプロダクトをご用意しています。新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。また、すべてのお客様に 25 以上のプロダクトを無料でご利用いただけます(毎月の使用量上限があります)。
Google Cloud