Dataproc 文档

Dataproc | Serverless for Apache Spark | Dataproc Metastore

Cloud Dataproc 是一项托管式 Apache Spark 和 Apache Hadoop 服务，借助该服务，您可以充分利用开源数据工具来执行批处理、查询、流式传输和机器学习。Dataproc 自动化功能可帮助您快速创建集群并轻松管理，以及在不需要集群时将其关闭以节省费用。由于在管理上花费的时间和费用更少，您可以将精力集中在作业和数据上。了解详情

免费开始使用

获享 $300 免费赠金开始概念验证

体验 Gemini 2.0 Flash Thinking
免费使用热门产品（包括 AI API 和 BigQuery）的每月用量
不会自动收费，无需承诺

查看免费产品优惠

继续探索 20 多种提供“始终免费”用量的产品

使用适用于常见应用场景（包括 AI API、虚拟机、数据仓库等）的 20 多种免费产品。

文档资源

查找快速入门和指南，查看重要参考文档，并获取有关常见问题的帮助。

Dataproc 文档

获享 $300 免费赠金开始概念验证

继续探索 20 多种提供“始终免费”用量的产品

文档资源

指南

参考信息

资源

在 Google Kubernetes Engine 上运行 Spark 作业

Cloud Dataproc 简介：Google Cloud 上的 Hadoop 和 Spark

使用 Dataproc 上的 Spark 进行机器学习

工作流安排解决方案

将 HDFS 数据从本地迁移到 Google Cloud

管理 Apache Spark 的 Java 和 Scala 依赖项

Python API 示例

Java API 示例

Node.js API 示例

Go API 示例

相关视频