Lightning Engine

Lightning Engine

Apache Spark のパフォーマンスを加速

Google のベクトル化エンジンは、4.3 倍以上高速な Spark パフォーマンス*を実現するスマートなエンジンで Spark をより簡単に最適化して、コンピューティング費用を削減します。

*クエリは TPC-DS 標準TPC-H 標準から派生したものであり、TPC-DS 標準TPC-H 標準のすべての要件を満たしていないため、公開されている TPC-DS 標準TPC-H 標準の結果と比較することはできません。

Apache Spark は Apache Software Foundation の商標です。

機能

ジョブのランタイムを短縮し、費用を削減

Spark の実行を高速化。大規模な ETL、データ サイエンス、SQL ワークロードの実行を、オープンソースの Apache Spark と比較して 4.3 倍以上高速化します。ジョブの実行時間が大幅に短縮されることで、コンピューティング時間が短縮され、Spark ワークロードの総所有コストが削減されます。

Spark のパフォーマンスを加速

パフォーマンスを簡単に向上させる方法をご紹介します。Spark の最適化に貴重なエンジニアリング サイクルを費やすのを減らします。

インテリジェントなデータアクセスとキャッシュ保存

よりスマートなアーキテクチャを活用しましょう。Lightning Engine は、ホットデータを自動的にメモリにキャッシュし、Cloud Storage と BigQuery 向けに最適化された高スループットのコネクタを利用することで、大規模な Spark データ処理の I/O レイテンシとスループットを大幅に改善します。


コアテクノロジー: ベクトル化された実行

Lightning Engine は、ネイティブの C++ ベクトル化実行エンジンを活用してデータをバッチで処理し、従来の行ごとの処理よりも CPU 効率を大幅に向上させます。これは、Spark の画期的なパフォーマンスのコア コンポーネントです。


対象

対象Lightning Engine は、最も要求の厳しい Spark ワークロード向けです。Dataproc と Serverless Apache Spark のプレミアム ティアでご利用いただけます。
プロダクト可用性アクセス

一般提供

Google Compute Engine 上の Dataproc

プレビュー版

近日提供予定

対象

Lightning Engine は、最も要求の厳しい Spark ワークロード向けです。Dataproc と Serverless Apache Spark のプレミアム ティアでご利用いただけます。

可用性

一般提供

アクセス

Google Compute Engine 上の Dataproc

可用性

プレビュー版

アクセス

近日提供予定

仕組み

Lightning Engine は、ネイティブの C++ ベクトル化エンジン、インテリジェント キャッシング、最適化された I/O により、Spark のデータ処理を高速化します。CPU 効率を最大化するためにデータをバッチ処理し、ジョブの実行時間とコンピューティング費用を削減します。この最適化スイートにより、Spark のパフォーマンスが飛躍的に向上します。

一般的な使用例

最も要求の厳しいジョブに最適

大規模 ETL

最も複雑な Spark データ処理および変換パイプラインのランタイムを大幅に短縮します。つまり、より厳格なデータの更新速度 SLA を満たし、夜間のバッチ処理時間を短縮し、最もリソースを必要とするデータ パイプラインの TCO を大幅に削減できます。

スライドの読み上げ: オープンソースの Apache Spark と比較してパフォーマンスが 4.3 倍向上

    大規模 ETL

    最も複雑な Spark データ処理および変換パイプラインのランタイムを大幅に短縮します。つまり、より厳格なデータの更新速度 SLA を満たし、夜間のバッチ処理時間を短縮し、最もリソースを必要とするデータ パイプラインの TCO を大幅に削減できます。

    スライドの読み上げ: オープンソースの Apache Spark と比較してパフォーマンスが 4.3 倍向上

      AI/ML データの準備

      ML ライフサイクルに不可欠な特徴量エンジニアリングとデータ準備のステップを加速します。ML ワークフローで最も時間のかかる部分を高速化することで、データ サイエンティストはより多くのテストを実行し、モデルのイテレーションを迅速に行い、価値の高い AI アプリケーションをより早く本番環境に導入できます。

      ML ワークフローの最適化

        AI/ML データの準備

        ML ライフサイクルに不可欠な特徴量エンジニアリングとデータ準備のステップを加速します。ML ワークフローで最も時間のかかる部分を高速化することで、データ サイエンティストはより多くのテストを実行し、モデルのイテレーションを迅速に行い、価値の高い AI アプリケーションをより早く本番環境に導入できます。

        ML ワークフローの最適化

          インタラクティブな分析

          データレイクで高速なインタラクティブ SQL クエリを直接実行して、アドホック分析とビジネス インテリジェンスを実現します。データ アナリストは、クエリの応答時間が短縮されることで思考の流れを維持しやすくなり、結果としてデータ探索が迅速化され、より効果的な分析情報が得られます。

          Google Cloud の次世代 AI 搭載オープン レイクハウス

            インタラクティブな分析

            データレイクで高速なインタラクティブ SQL クエリを直接実行して、アドホック分析とビジネス インテリジェンスを実現します。データ アナリストは、クエリの応答時間が短縮されることで思考の流れを維持しやすくなり、結果としてデータ探索が迅速化され、より効果的な分析情報が得られます。

            Google Cloud の次世代 AI 搭載オープン レイクハウス

              料金

              Spark の高速化を、思いどおりにLightning Engine は、Dataproc と Apache Spark 向け Google Cloud Serverless のプレミアム ティアの機能です。
              プロダクト料金

              プレビュー版近日提供開始予定。

              Spark の高速化を、思いどおりに

              Lightning Engine は、Dataproc と Apache Spark 向け Google Cloud Serverless のプレミアム ティアの機能です。

              料金

              プレビュー版近日提供開始予定。

              料金計算ツール

              リージョン固有の料金と手数料を含む、毎月の費用を試算できます。

              カスタムの見積もり

              カスタム見積もりをご希望の場合は、Google のセールスチームにお問い合わせください。

              Spark 処理を加速

              Spark ジョブを高速化

              大規模なプロジェクトがある場合は、

              Apache Spark 向け Serverless の使用を開始する

              Apache Spark 向け Lightning Engine を使用するタイミング

              Dataproc と Apache Spark 向け Serverless の比較

              • Google Cloud プロダクト
              • 100 種類を超えるプロダクトをご用意しています。新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。また、すべてのお客様に 25 以上のプロダクトを無料でご利用いただけます(毎月の使用量上限があります)。
              Google Cloud