核心任务和常见任务
-
向 Dataproc 进行身份验证
了解如何向 Dataproc 进行身份验证。
-
创建集群
使用 Google Cloud 控制台或 Google Cloud CLI 创建集群。
-
创建部分集群
创建主要工作器数量最少的部分集群。
-
创建自定义映像
了解如何创建自定义映像并将其安装到 Dataproc 集群上。
-
创建和管理标签
创建和管理 Dataproc 用户标签。
-
管理 Spark 的 Java 和 Scala 依赖项
了解如何管理 Java 和 Scala 依赖项并解决 Apache Spark 应用的冲突。
-
管理集群
更新或关闭集群。
-
在 Dataproc 集群上运行 Vertex AI Workbench 笔记本
在 Dataproc 集群上运行代管式实例的笔记本文件。
-
设置项目
设置新项目以使用 Dataproc。
-
启动和停止集群
启动和停止 Dataproc 集群。
-
提交作业
提交不同类型的作业:使用 Google Cloud 控制台或 Google Cloud CLI,或通过 SSH 连接到集群实例。
GKE 上的 Dataproc
-
Dataproc on GKE 概览
Dataproc on GKE 概览。
-
快速入门:在 Dataproc on GKE 上运行 Spark 作业
创建 Dataproc on GKE 虚拟集群,然后在虚拟集群上运行 Spark 作业。
-
重新创建和更新 Dataproc on GKE 虚拟集群
重新创建和更新 Dataproc on GKE 虚拟集群。
-
删除 Dataproc on GKE 虚拟集群
删除 Dataproc on GKE 虚拟集群。
-
自定义 Dataproc on GKE 容器映像
如何创建 Dataproc on GKE 容器映像。
-
诊断 Dataproc on GKE 集群
如何诊断 Dataproc on GKE 集群。
-
Dataproc on GKE IAM 角色和身份
Dataproc on GKE IAM 权限。
-
Dataproc on GKE 日志记录
查看 Dataproc on GKE 日志。
-
Dataproc on GKE 节点池
管理 Dataproc on GKE 节点池。
-
Dataproc on GKE 发布版本
Dataproc on GKE 发布版本信息。
-
扩缩 Dataproc on GKE 集群
如何扩缩 Dataproc on GKE 集群。
Dataproc 中心
Dataproc 节点组
Dataproc 模板
-
Dataproc 模板
使用 Dataproc 模板设置并运行 Dataproc 工作负载和作业。