ジャンプ先

Google Cloud での Spark

業界初の自動スケーリング可能なサーバーレス Spark を厳選された Google ネイティブのオープンソース ツールと統合します。Spark は、ETL、データ サイエンス、データ探索など、あらゆるユースケースにわたり必要な場所で開発、実行できます。

利点

デベロッパーの生産性を高め、より高速なデータ分析情報を実現

サーバーレスの Spark によって運用がシンプルに

インフラストラクチャの手動プロビジョニングや調整なしで自動スケーリングできる Spark アプリケーションとパイプラインを作成できます。

すべてのデータ ユーザー向けのシームレスな Spark

Spark は BigQueryVertex AIDataplex と統合されているため、ETL、データ探索、分析、ML の場合、これらのインターフェースから 2 クリックのみで書き込みと実行が可能で、カスタム統合は不要です。

用途に柔軟に対応

画一的なアプローチは通用しません。Spark アプリケーションでは、サーバーレス、Kubernetes クラスタとコンピューティング クラスタの中から選択できます。

主な機能

選択したインターフェースから自動スケーリングする Spark ジョブを 2 クリックで実行

サーバーレス Spark(一般提供)

デベロッパーは、コードとロジックにすべての時間を費やすことができ、選択したインターフェースを使用して、自動プロビジョニングと自動スケーリングを行う Spark ジョブを送信できます。詳しくはこちらをご覧ください。

Apache Spark の BigQuery 外部プロシージャ(限定公開 プレビュー)

SQL と Spark が統合されたエクスペリエンス: BigQuery から直接 Python で記述された Apache Spark コードを作成して実行できます。 その後、SQL ストアド プロシージャの実行と同様に、Google 標準 SQL クエリを使用して BigQuery でこれらのストアド プロシージャを実行してスケジュールできます。 今すぐプレビューにご登録ください。

Vertex AI での Spark(非公開プレビュー)

Spark でのデータ サイエンスをワンクリックで実現: データ サイエンティストは、組み込みセキュリティを使用して、Vertex AI Workbench からシームレスに開発に Spark を使用できます。Spark は、Vertex AI の MLOps 機能と統合されています。ユーザーは、Vertex AI Pipelines と統合されたノートブック エグゼキュータを使用して Spark のコードを実行できます。

Dataplex を介した Spark

Spark SQL、Notebooks、または PySpark にワンクリックでアクセスできる単一のインターフェースから、Google Cloud 全体のデータに対して Spark の自動スケーリングを実行できます。また、ノートブックとスクリプトをデータとともに保存、共有、検索できる機能を備えた使いやすいコラボレーション ツールに加え、データレイク全体のガバナンスも備えています。

柔軟な消費オプション

NoOps デプロイ用のサーバーレス Spark に加え、インフラストラクチャ管理のために Kubernetes を標準化しているお客様は、Google Kubernetes Engine(一般提供)上で Spark を実行して、リソース使用状況を改善し、インフラストラクチャ管理を簡素化できます。Hadoop スタイルのインフラストラクチャ管理を必要とするお客様は、Compute Engine(一般提供)上で Spark を実行できます。


ご関心をお持ちの場合は、お問い合わせください

パートナー

関連サービス

最新情報

Google Cloud のニュース、ブログ、イベントで Spark の最新情報を取得

Google Cloud 上の Spark の新しいソリューションへの早期アクセスをリクエストするには、こちらから関心事項をご登録ください。