Dataproc on GKE 總覽
透過集合功能整理內容
你可以依據偏好儲存及分類內容。
您可以在 GKE 叢集上使用 Dataproc jobs
API,透過 Dataproc on GKE 執行大數據應用程式。使用 Google Cloud 主控台、Google Cloud CLI 或 Dataproc API (HTTP 要求或 Cloud 用戶端程式庫),建立 Dataproc on GKE 虛擬叢集,然後將 Spark、PySpark、SparkR 或 Spark-SQL 工作提交至 Dataproc 服務。
Dataproc on GKE 支援 Spark 3.5 版本。
Dataproc on GKE 的運作方式
Dataproc on GKE 會在 GKE 叢集上部署 Dataproc 虛擬叢集。與 Compute Engine 叢集上的 Dataproc 不同,GKE 虛擬叢集上的 Dataproc 不包含個別的主要和工作站 VM。不過,當您建立 Dataproc on GKE 虛擬叢集時,Dataproc on GKE 會在 GKE 叢集中建立節點集區。Dataproc on GKE 工作會以 Pod 的形式在這些節點集區上執行。節點集區和節點集區中 Pod 的排程由 GKE 管理。
除非另有註明,否則本頁面中的內容是採用創用 CC 姓名標示 4.0 授權,程式碼範例則為阿帕契 2.0 授權。詳情請參閱《Google Developers 網站政策》。Java 是 Oracle 和/或其關聯企業的註冊商標。
上次更新時間:2025-09-11 (世界標準時間)。
[[["容易理解","easyToUnderstand","thumb-up"],["確實解決了我的問題","solvedMyProblem","thumb-up"],["其他","otherUp","thumb-up"]],[["難以理解","hardToUnderstand","thumb-down"],["資訊或程式碼範例有誤","incorrectInformationOrSampleCode","thumb-down"],["缺少我需要的資訊/範例","missingTheInformationSamplesINeed","thumb-down"],["翻譯問題","translationIssue","thumb-down"],["其他","otherDown","thumb-down"]],["上次更新時間:2025-09-11 (世界標準時間)。"],[],[],null,[]]