Google Cloud 上の Apache Spark

Spark をより簡単に、よりスマートに、より速く。

Google Cloud で Apache Spark ワークロードを実行すると、運用オーバーヘッドが減り、AI による支援が増え、費用対効果が向上します。クラスタ管理の時間を削減し、コーディングに集中しましょう。


利点

Google Cloud 上の Apache Spark のエクスペリエンスを向上

簡単 - Spark の運用負荷を解消

ゼロオペレーションの Google Cloud Serverless for Apache Spark とマネージド Dataproc クラスタのどちらかを選択できます。どちらもインフラストラクチャの複雑さを自動化し、開発ライフサイクルを加速させます。

両方のオプションを比較

よりスマートに - AI を活用した Spark 開発

DataprocGoogle Cloud Serverless for Apache Spark で Gemini を活用して、ワークフロー全体を加速させましょう。Gemini を活用したアシスタンスによるコードの生成とデバッグ、失敗したジョブのトラブルシューティングが可能になります。

Gemini Code Assist について

高速 - Spark のパフォーマンスを加速

業界屈指の費用対効果を自動的に実現します。最も要求の厳しいジョブでも、Lightning Engine により 4.3 倍以上の高速化を実現し、TCO の削減とインサイト取得までの時間短縮を支援します。

Lightning Engine を詳しく見る

主な機能

ワークロードに最適な Spark の選択

ゼロオペレーションのシンプルさを実現する Serverless for Apache Spark と、詳細なカスタマイズが可能なマネージド クラスタを実現する Dataproc から選択できます。

意思決定ガイドを見る

Apache Spark 向けの Google Cloud サーバーレス

コードに集中して開発を加速できます。費用対効果の高いバッチ処理と高性能 AI / ML の両方に対応できる階層を備え、新規の Apache Spark パイプライン、インタラクティブ分析、需要が予測できない「NoOps」モデルが適したワークロードに最適です。

最適な用途: データ サイエンティストと ML エンジニア、アドホック クエリ、新規アプリケーション、デベロッパーの生産性向上。

Serverless Spark を詳しく見る

Dataproc

クラスタ環境を最大限に制御できます。既存の Apache Hadoop / Spark ワークロードの移行、長期間稼働する永続クラスタの運用、多様なオープンソース エコシステムの利用に最適です。

最適な用途: エンタープライズ エンジニアリングと運用、オンプレミスからの移行、長時間実行されるジョブ、詳細なカスタマイズ。

Dataproc を試す

ドキュメント

ドキュメント

Tutorial

最初のサーバーレス Spark ジョブを実行する

このクイックスタートに沿って、サーバーレス Spark のスピードとシンプルさを体験してください。Google Cloud CLI を使用して PySpark バッチジョブを送信する方法を学びます。

Tutorial

マネージド Dataproc クラスタを作成する

このチュートリアルでは、Google Cloud コンソールを使用して Dataproc クラスタを作成する手順を説明します。Spark のワークロードと Hadoop のワークロード用にマネージド環境を構成、プロビジョニングする方法を紹介します。

Best Practice

分析を統合: 1 つのデータコピーで SQL と Spark を活用

SQL のパワーと Spark の柔軟性の片方を選ぶ必要はもうありません。BigLake を使用すると、同じ管理対象データに対して両方のエンジンを使用できます。あらゆる作業に最適なツールを使用できる、統合されたエクスペリエンスを提供します。

Best Practice

AI と ML のライフサイクル全体を加速

データの準備からモデルのトレーニングと推論までをより迅速に実行できます。Google のプレミアム ティアは AI / ML 向けに設計されており、NVIDIA RAPIDS などの GPU サポートが組み込まれた事前構成済みの ML ランタイムを使用できるため、複雑な設定が不要です。

お探しのものが見つからない場合


Apache は Apache Software Foundation の商標です。

** クエリは TPC-DS 標準TPC-H 標準から派生したものであり、TPC-DS 標準TPC-H 標準の仕様のすべての要件に準拠していないため、公開されている TPC-DS 標準TPC-H 標準の結果と比較することはできません。

次のステップ

問題点をお知らせください。Google Cloud のエキスパートが、最適なソリューションを見つけるお手伝いをいたします。

  • Google Cloud プロダクト
  • 100 種類を超えるプロダクトをご用意しています。新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。また、すべてのお客様に 25 以上のプロダクトを無料でご利用いただけます(毎月の使用量上限があります)。
Google Cloud