SQL に加えて Apache Spark が BigQuery でネイティブにサポートされています。詳細
業界初の自動スケーリング可能なサーバーレス Spark を厳選された Google ネイティブのオープンソース ツールと統合します。Spark は、ETL、データ サイエンス、データ探索など、あらゆるユースケースにわたり必要な場所で開発、実行できます。
利点
サーバーレスの Spark によって運用がシンプルに
インフラストラクチャの手動プロビジョニングや調整なしで自動スケーリングできる Spark アプリケーションとパイプラインを作成できます。
用途に柔軟に対応
画一的なアプローチは通用しません。Spark アプリケーションでは、サーバーレス、Kubernetes クラスタとコンピューティング クラスタの中から選択できます。
主な機能
Google Cloud のサーバーレス Spark は、インフラストラクチャを自動化することでデータ サイエンスを加速します。クラスタ管理ではなくコードに集中でき、自動スケーリングと BigQuery および Vertex AI とのシームレスな統合によりワークフローが効率化され、反復処理とモデル開発を迅速に行えます。サーバーレス Spark の最新のライブラリをチェックし、ユーザーによる構成が少ないユースケースをさらに増やしましょう。Apache Spark、XGBoost、Hugging Face Transformers ライブラリを使用した顧客離れを予測するためのパイプラインの構築など、データ サイエンティスト向けの最新のコードサンプルをご覧ください。
Spark でのデータ サイエンスをワンクリックで実現: データ サイエンティストは、組み込みセキュリティを使用して、Vertex AI Workbench からシームレスに開発に Spark を使用できます。Spark は、Vertex AI の MLOps 機能と統合されています。ユーザーは、Vertex AI Pipelines と統合されたノートブック エグゼキュータを使用して Spark のコードを実行できます。
SQL と Spark が統合されたエクスペリエンス: BigQuery から直接 Python で記述された Apache Spark コードを作成して実行できます。 その後、SQL ストアド プロシージャの実行と同様に、Google 標準 SQL クエリを使用して BigQuery でこれらのストアド プロシージャを実行してスケジュールできます。
デベロッパーは、コードとロジックにすべての時間を費やすことができ、選択したインターフェースを使用して、自動プロビジョニングと自動スケーリングを行う Spark ジョブを送信できます。サーバーレス Spark のドキュメントをご覧ください。
Spark SQL、Notebooks、または PySpark にワンクリックでアクセスできる単一のインターフェースから、Google Cloud 全体のデータに対して Spark の自動スケーリングを実行できます。また、ノートブックとスクリプトをデータとともに保存、共有、検索できる機能を備えた使いやすいコラボレーション ツールに加え、データレイク全体のガバナンスも備えています。
準備ができたらお問い合わせ
Spark は Apache Software Foundation の商標です。