業界初の自動スケーリング可能なサーバーレス Spark を厳選された Google ネイティブのオープンソース ツールと統合します。Spark は、ETL、データ サイエンス、データ探索など、あらゆるユースケースにわたり必要な場所で開発、実行できます。
利点
サーバーレスの Spark によって運用がシンプルに
インフラストラクチャの手動プロビジョニングや調整なしで自動スケーリングできる Spark アプリケーションとパイプラインを作成できます。
用途に柔軟に対応
画一的なアプローチは通用しません。Spark アプリケーションでは、サーバーレス、Kubernetes クラスタとコンピューティング クラスタの中から選択できます。
主な機能
SQL と Spark が統合されたエクスペリエンス: BigQuery から直接 Python で記述された Apache Spark コードを作成して実行できます。 その後、SQL ストアド プロシージャの実行と同様に、Google 標準 SQL クエリを使用して BigQuery でこれらのストアド プロシージャを実行してスケジュールできます。
デベロッパーは、コードとロジックにすべての時間を費やすことができ、選択したインターフェースを使用して、自動プロビジョニングと自動スケーリングを行う Spark ジョブを送信できます。サーバーレス Spark のドキュメントをご覧ください。
Spark でのデータ サイエンスをワンクリックで実現: データ サイエンティストは、組み込みセキュリティを使用して、Vertex AI Workbench からシームレスに開発に Spark を使用できます。Spark は、Vertex AI の MLOps 機能と統合されています。ユーザーは、Vertex AI Pipelines と統合されたノートブック エグゼキュータを使用して Spark のコードを実行できます。
Spark SQL、Notebooks、または PySpark にワンクリックでアクセスできる単一のインターフェースから、Google Cloud 全体のデータに対して Spark の自動スケーリングを実行できます。また、ノートブックとスクリプトをデータとともに保存、共有、検索できる機能を備えた使いやすいコラボレーション ツールに加え、データレイク全体のガバナンスも備えています。
NoOps デプロイ用のサーバーレス Spark に加え、インフラストラクチャ管理のために Kubernetes を標準化しているお客様は、Google Kubernetes Engine(一般提供)上で Spark を実行して、リソース使用状況を改善し、インフラストラクチャ管理を簡素化できます。Hadoop スタイルのインフラストラクチャ管理を必要とするお客様は、Compute Engine(一般提供)上で Spark を実行できます。
準備ができたらお問い合わせ
最新情報
Google Cloud 上の Spark の新しいソリューションへの早期アクセスをリクエストするには、こちらから関心事項をご登録ください。
Spark は Apache Software Foundation の商標です。