Spark on Google Cloud
业内首个自动扩缩的无服务器 Spark,与出色的 Google 原生和开源工具集成。根据需要跨所有使用场景(包括 ETL、数据科学和数据探索)开发和运行 Spark。
主要特性
只需点击两下,即可从所选界面运行可自动扩缩的 Spark 作业
无服务器 Spark(正式版)
开发者可以将全部时间用于代码和逻辑,并使用所选界面提交可以自动预配和自动扩缩的 Spark 作业。如需了解更多详情,请点击此处。
通过 Vertex AI 运行 Spark(非公开预览版)
一键式将 Spark 用于数据科学:数据科学家可以从 Vertex AI Workbench 无缝使用 Spark 进行开发,还内置了安全防护功能。Spark 与 Vertex AI 的 MLOps 功能集成,用户可以通过与 Vertex AI 流水线集成的笔记本执行程序执行 Spark 代码。注册即可立即预览。
通过 Dataplex 运行 Spark
通过统一界面对 Google Cloud 中的数据运行自动扩缩 Spark 作业。用户可以通过该界面一键访问 SparkSQL、Notebooks 或 PySpark,还可以轻松保存、共享、搜索笔记本和脚本以及数据,还内置了跨数据湖的治理功能。
灵活的使用选项
除了用于实现免运维部署的无服务器 Spark 外,标准化 Kubernetes 以管理基础架构的客户还可以在 Google Kubernetes Engine上运行 Spark(正式版),以提高资源利用率并简化基础架构管理。希望使用 Hadoop 式基础架构管理的客户可以在 Compute Engine 上运行 Spark(正式版)。
相关服务
各种 Google Cloud 服务广泛使用 Spark
Spark 是 Apache Software Foundation 的商标。