新しいレベルの Spark パフォーマンス: Google Cloud 上の Spark を支えるベクトル化エンジン Lightning Engine により、Spark のパフォーマンスが 4.3 倍以上高速化します。

Google Cloud 上の Apache Spark

Spark をより簡単に、よりスマートに、より速く。

Google Cloud で Apache Spark ワークロードを実行すると、運用オーバーヘッドが減り、AI による支援が増え、費用対効果が向上します。クラスタ管理の時間を削減し、コーディングに集中しましょう。

Google Cloud は、他のクラウドベースの Apache Spark 代替ソリューションと比較して、18～60% の費用削減を実現できます

ESG レポートを入手

利点

Google Cloud 上の Apache Spark のエクスペリエンスを向上

簡単 - Spark の運用負荷を解消

ゼロオペレーションの Google Cloud Serverless for Apache Spark とマネージド Dataproc クラスタのどちらかを選択できます。どちらもインフラストラクチャの複雑さを自動化し、開発ライフサイクルを加速させます。

両方のオプションを比較

よりスマートに - AI を活用した Spark 開発

Dataproc と Google Cloud Serverless for Apache Spark で Gemini を活用して、ワークフロー全体を加速させましょう。Gemini を活用したアシスタンスによるコードの生成とデバッグ、失敗したジョブのトラブルシューティングが可能になります。

Gemini Code Assist について

高速 - Spark のパフォーマンスを加速

業界屈指の費用対効果を自動的に実現します。最も要求の厳しいジョブでも、Lightning Engine により 4.3 倍以上の高速化を実現し、TCO の削減とインサイト取得までの時間短縮を支援します。

Lightning Engine を詳しく見る

主な機能

ワークロードに最適な Spark の選択

ゼロオペレーションのシンプルさを実現する Serverless for Apache Spark と、詳細なカスタマイズが可能なマネージドクラスタを実現する Dataproc から選択できます。

意思決定ガイドを見る

Apache Spark 向けの Google Cloud サーバーレス

コードに集中して開発を加速できます。費用対効果の高いバッチ処理と高性能 AI / ML の両方に対応できる階層を備え、新規の Apache Spark パイプライン、インタラクティブ分析、需要が予測できない「NoOps」モデルが適したワークロードに最適です。

最適な用途: データサイエンティストと ML エンジニア、アドホッククエリ、新規アプリケーション、デベロッパーの生産性向上。

Serverless Spark を詳しく見る

Dataproc

クラスタ環境を最大限に制御できます。既存の Apache Hadoop / Spark ワークロードの移行、長期間稼働する永続クラスタの運用、多様なオープンソースエコシステムの利用に最適です。

最適な用途: エンタープライズエンジニアリングと運用、オンプレミスからの移行、長時間実行されるジョブ、詳細なカスタマイズ。

Dataproc を試す

導入事例

実績のあるビジネス成果の実現

Video

New Way Now: Dun & Bradstreet がデータワークフローを数分に短縮し、プロダクトの応答時間を 60% 短縮

2:46

Video

trivago、BigQuery で Spark の力を引き出す

45:00

パートナー

推奨パートナー

ドキュメント

Tutorial

最初のサーバーレス Spark ジョブを実行する

このクイックスタートに沿って、サーバーレス Spark のスピードとシンプルさを体験してください。Google Cloud CLI を使用して PySpark バッチジョブを送信する方法を学びます。

Tutorial

マネージド Dataproc クラスタを作成する

このチュートリアルでは、Google Cloud コンソールを使用して Dataproc クラスタを作成する手順を説明します。Spark のワークロードと Hadoop のワークロード用にマネージド環境を構成、プロビジョニングする方法を紹介します。

Best Practice

分析を統合: 1 つのデータコピーで SQL と Spark を活用

SQL のパワーと Spark の柔軟性の片方を選ぶ必要はもうありません。BigLake を使用すると、同じ管理対象データに対して両方のエンジンを使用できます。あらゆる作業に最適なツールを使用できる、統合されたエクスペリエンスを提供します。

Best Practice

AI と ML のライフサイクル全体を加速

データの準備からモデルのトレーニングと推論までをより迅速に実行できます。Google のプレミアムティアは AI / ML 向けに設計されており、NVIDIA RAPIDS などの GPU サポートが組み込まれた事前構成済みの ML ランタイムを使用できるため、複雑な設定が不要です。

お探しのものが見つからない場合

Google Cloud の Spark の最新情報を入手

Blog post

Spark データパイプラインを Gemini に接続ブログを読む

Blog post

データサイエンスエージェントと Sparkブログを読む

Blog post

Dataproc マルチテナントクラスタブログを読む

Apache は Apache Software Foundation の商標です。

** クエリは TPC-DS 標準と TPC-H 標準から派生したものであり、TPC-DS 標準と TPC-H 標準の仕様のすべての要件に準拠していないため、公開されている TPC-DS 標準と TPC-H 標準の結果と比較することはできません。

次のステップ

問題点をお知らせください。Google Cloud のエキスパートが、最適なソリューションを見つけるお手伝いをいたします。

構築を開始
インタラクティブなチュートリアルを試す
今すぐ Google Cloud を使用開始
300 ドル分のクレジットを獲得
技術的な詳細を掘り下げる
ドキュメントを見る

Google Cloud 上の Apache Spark

Google Cloud 上の Apache Spark のエクスペリエンスを向上

簡単 - Spark の運用負荷を解消

よりスマートに - AI を活用した Spark 開発

高速 - Spark のパフォーマンスを加速

ワークロードに最適な Spark の選択

Apache Spark 向けの Google Cloud サーバーレス

Dataproc

実績のあるビジネス成果の実現

推奨パートナー

オープンクラウド データ レイクハウスを支えるエンジン

ドキュメント

最初のサーバーレス Spark ジョブを実行する

マネージド Dataproc クラスタを作成する

分析を統合: 1 つのデータコピーで SQL と Spark を活用

AI と ML のライフサイクル全体を加速

お探しのものが見つからない場合

Google Cloud の Spark の最新情報を入手

次のステップ

構築を開始

今すぐ Google Cloud を使用開始

技術的な詳細を掘り下げる

オープンクラウドデータレイクハウスを支えるエンジン