Spark をより簡単に、よりスマートに、より速く。
Google Cloud で Apache Spark ワークロードを実行すると、運用オーバーヘッドが減り、AI による支援が増え、費用対効果が向上します。クラスタ管理の時間を削減し、コーディングに集中しましょう。
利点
簡単 - Spark の運用負荷を解消
ゼロオペレーションの Google Cloud Serverless for Apache Spark とマネージド Dataproc クラスタのどちらかを選択できます。どちらもインフラストラクチャの複雑さを自動化し、開発ライフサイクルを加速させます。
よりスマートに - AI を活用した Spark 開発
Dataproc と Google Cloud Serverless for Apache Spark で Gemini を活用して、ワークフロー全体を加速させましょう。Gemini を活用したアシスタンスによるコードの生成とデバッグ、失敗したジョブのトラブルシューティングが可能になります。
高速 - Spark のパフォーマンスを加速
業界屈指の費用対効果を自動的に実現します。最も要求の厳しいジョブでも、Lightning Engine により 4.3 倍以上の高速化を実現し、TCO の削減とインサイト取得までの時間短縮を支援します。
主な機能
ゼロオペレーションのシンプルさを実現する Serverless for Apache Spark と、詳細なカスタマイズが可能なマネージド クラスタを実現する Dataproc から選択できます。
コードに集中して開発を加速できます。費用対効果の高いバッチ処理と高性能 AI / ML の両方に対応できる階層を備え、新規の Apache Spark パイプライン、インタラクティブ分析、需要が予測できない「NoOps」モデルが適したワークロードに最適です。
最適な用途: データ サイエンティストと ML エンジニア、アドホック クエリ、新規アプリケーション、デベロッパーの生産性向上。
クラスタ環境を最大限に制御できます。既存の Apache Hadoop / Spark ワークロードの移行、長期間稼働する永続クラスタの運用、多様なオープンソース エコシステムの利用に最適です。
最適な用途: エンタープライズ エンジニアリングと運用、オンプレミスからの移行、長時間実行されるジョブ、詳細なカスタマイズ。
ドキュメント
SQL のパワーと Spark の柔軟性の片方を選ぶ必要はもうありません。BigLake を使用すると、同じ管理対象データに対して両方のエンジンを使用できます。あらゆる作業に最適なツールを使用できる、統合されたエクスペリエンスを提供します。
データの準備からモデルのトレーニングと推論までをより迅速に実行できます。Google のプレミアム ティアは AI / ML 向けに設計されており、NVIDIA RAPIDS などの GPU サポートが組み込まれた事前構成済みの ML ランタイムを使用できるため、複雑な設定が不要です。
最新情報