全新推出 Lightning Engine，新一代 Apache Spark 性能。阅读博客。

Lightning Engine

Lightning Engine

加快 Apache Spark 的性能

我们的向量化引擎是一种更简单的 Spark 优化方式，使用更智能的引擎，将 Spark 性能加快 4.3 倍以上*，降低了计算成本。

*这些查询源自 TPC-DS 标准和 TPC-H 标准，因此无法与已发布的 TPC-DS 标准和 TPC-H 标准结果进行比较，因为这些运行不符合 TPC-DS 标准和 TPC-H 标准规范的所有要求。

Apache Spark 是 Apache Software Foundation 的商标。

功能

缩短作业运行时并降低成本

体验更快速的 Spark 运行方式。加快大规模 ETL、数据科学和 SQL 工作负载的运行速度，比开源 Apache Spark 快 4.3 倍以上。作业运行时的大幅缩短减少了计算时间，从而降低了 Spark 工作负载的总拥有成本。

加快 Spark 性能

探索更轻松的性能提升方式。减少在优化 Spark 上花费宝贵的工程周期。

智能数据访问和缓存

利用更智能的架构。Lightning Engine 会自动将热数据缓存在内存中，并利用针对 Cloud Storage 和 BigQuery 进行了优化的高吞吐量连接器，显著缩短了大规模 Spark 数据处理的 I/O 延迟时间并提高了吞吐量。

核心技术：向量化执行

Lightning Engine 利用原生 C++ 向量化执行引擎来批量处理数据，与传统的逐行处理相比，可显著提高 CPU 效率。这是其突破性 Spark 性能的核心组成部分。

可用情况

可用情况	Lightning Engine 适用于要求最严苛的 Spark 工作负载。您可以通过 Dataproc 和 Serverless Apache Spark 的高级层级获取
产品	发布情况	访问途径
Google Cloud Serverless for Apache Spark - 高级层级	已全面推出	点击此处开始
Dataproc on Google Compute Engine	预览版	即将推出

Dataproc 和 Google Cloud Serverless for Apache Spark 的决策指南

可用情况

Lightning Engine 适用于要求最严苛的 Spark 工作负载。您可以通过 Dataproc 和 Serverless Apache Spark 的高级层级获取

Google Cloud Serverless for Apache Spark - 高级层级

发布情况

已全面推出

访问途径

点击此处开始

Dataproc on Google Compute Engine

发布情况

预览版

访问途径

即将推出

Dataproc 和 Google Cloud Serverless for Apache Spark 的决策指南

工作方式

Lightning Engine 采用原生 C++ 向量化引擎、智能缓存和优化的 I/O，加速 Spark 数据处理。它会批量处理数据以最大限度提高 CPU 效率，从而缩短作业运行时并降低计算成本。这一套优化措施带来了突破性的 Spark 性能。

常见用途

非常适合要求最严苛的作业

大规模 ETL

大幅缩短最复杂的 Spark 数据处理和转换流水线的运行时。这意味着您可以满足更严格的数据新鲜度 SLA，缩短夜间批处理窗口，并显著降低资源密集程度最高的数据流水线的总拥有成本。

幻灯片内容：与开源 Apache Spark 相比，性能提升 4.3 倍

学习资源

大规模 ETL

大幅缩短最复杂的 Spark 数据处理和转换流水线的运行时。这意味着您可以满足更严格的数据新鲜度 SLA，缩短夜间批处理窗口，并显著降低资源密集程度最高的数据流水线的总拥有成本。

幻灯片内容：与开源 Apache Spark 相比，性能提升 4.3 倍

AI/机器学习数据准备

加快对机器学习生命周期至关重要的特征工程和数据准备步骤。通过加快机器学习工作流中最耗时的部分，数据科学家可以运行更多实验、更快地迭代模型，并更快地将有价值的 AI 应用投入生产。

机器学习工作流优化

学习资源

AI/机器学习数据准备

加快对机器学习生命周期至关重要的特征工程和数据准备步骤。通过加快机器学习工作流中最耗时的部分，数据科学家可以运行更多实验、更快地迭代模型，并更快地将有价值的 AI 应用投入生产。

机器学习工作流优化

交互式分析

支持直接在数据湖中进行交互式快速 SQL 查询，以进行临时分析和实现商业智能。提供更快的查询响应，助力数据分析师保持思路连贯，从而更快地探索数据并获得更有效的分析洞见。

Google Cloud 的依托 AI 技术的新一代开放式湖仓一体

学习资源

交互式分析

支持直接在数据湖中进行交互式快速 SQL 查询，以进行临时分析和实现商业智能。提供更快的查询响应，助力数据分析师保持思路连贯，从而更快地探索数据并获得更有效的分析洞见。

Google Cloud 的依托 AI 技术的新一代开放式湖仓一体

价格

加速 Spark，随心所用	Lightning Engine 是 Dataproc 和 Google Cloud Serverless for Apache Spark 的高级层级的一项功能。
产品	价格
Google Cloud Serverless for Apache Spark	价格详情
Dataproc	即将推出预览版。

加速 Spark，随心所用

Lightning Engine 是 Dataproc 和 Google Cloud Serverless for Apache Spark 的高级层级的一项功能。

Google Cloud Serverless for Apache Spark

价格

价格

即将推出预览版。

价格计算器

估算您的每月费用，包括特定于区域的价格和费用。

定制报价

请与我们的销售团队联系，获取为贵组织量身定制的报价。

加速 Spark

为您的 Spark 作业注入强劲动力

有一个大型项目？

开始使用 Serverless for Apache Spark

何时使用适用于 Apache Spark 的 Lightning Engine

比较 Dataproc 和 Serverless for Apache Spark

加快数字化转型的速度
在数字化转型之旅中，无论您的企业是处于早期阶段还是已初见成效，Google Cloud 都可以帮助解决最棘手的难题。
了解详情

行业解决方案
降低费用、提高运营敏捷性并抓住新的市场机遇。
查看所有行业解决方案

Google Cloud 产品
浏览超过 100 种产品。新客户还可获享 $300 赠金，用于运行、测试和部署工作负载。只要每月用量不超过限额，所有客户都可以免费使用超过 25 种产品。
查看所有产品（100 多款）

利用我们透明的定价方法节省资金
Google Cloud 的随用随付价格方案会根据预付费资源的每月用量和折扣费率自动为您节省费用。请立即联系我们，获取报价。
请求报价