全新方式,让 Spark 更轻松、更智能、更快速。
在 Google Cloud 上运行 Apache Spark 工作负载,以更少的运维开销、更多 AI 赋能的帮助以及更高的性价比完成任务。专注于代码,而不是集群管理。
优势
更轻松 - 消除 Spark 的运维负担
您可以选择零运维的 Google Cloud Serverless for Apache Spark,也可以选择托管式 Dataproc 集群。两者都能自动消除基础设施的复杂性,帮助您加快开发生命周期。
更智能 - AI 辅助的 Spark 开发
借助 Gemini in Dataproc 和 Google Cloud Serverless for Apache Spark,加速整个工作流。获取由 Gemini 赋能的帮助,用于生成和调试代码,并排查失败的作业。
更快 - 提升 Spark 性能
自动获得业界领先的性价比。对于要求最严苛的作业,使用 Lightning Engine 可将性能提升 4.3 倍以上。这有助于降低总拥有成本,并缩短获得分析洞见所需的时间。
主要特性
您可以选择 Serverless for Apache Spark,享受零运维的简便性;也可以选择 Dataproc,使用支持深度自定义的托管式集群。
只需专注于代码,即可加快开发速度。它提供经济实惠的批处理层和高性能 AI/机器学习层,非常适合新的 Apache Spark 流水线、交互式分析,以及需求不可预测且更适合采用“NoOps”模型的工作负载。
最适合:数据科学家和机器学习工程师、临时查询、新应用以及提升开发效率。
最大限度地掌控集群环境。非常适合迁移现有的 Apache Hadoop/Spark 工作负载、运行长期运行的持久集群,或利用多样化的开源生态系统。
最适合:企业工程与运维、本地环境迁移、长时间运行的作业以及深度自定义。
文档
不必再在 SQL 的强大功能和 Spark 的灵活性之间做出选择。BigLake 可让您在同一份受治理的数据之上使用这两种引擎。它提供统一的体验,让您能够针对每个任务使用最合适的工具。
从数据准备到模型训练和推理,全流程都能更快完成。我们的高级层级专为 AI/机器学习而设计,让您可以使用预配置的机器学习运行时(内置 GPU 支持,例如 NVIDIA RAPIDS),从而免去复杂的设置。
最新资讯