什么是数据云?

数据云提供 AI 就绪型数据基础设施,可将您的数据、AI 模型和运营数据库统一到单个行动系统中,实现企业数据的可用性、集成和安全性,从而为智能体体验提供支持。

与传统孤岛系统不同,现代 Data Cloud 将数据库、分析和机器学习统一到一个 AI 驱动型数据平台中。这让组织能够自动处理整个数据生命周期(从注入到 AI 驱动型数据洞见),从而加快数字创新者实现价值的速度。对于希望弥合传统分析与生成式 AI 之间差距的组织,Data Cloud 可作为构建 AI 数据分析解决方案和智能体的基础。通过消除数据碎片化,团队可以专注于高价值数据科学工作,而不是管理旧版基础设施。

数据云的工作原理是什么?

现代数据云基于几个关键组件构建,可提供灵活性和可伸缩性:

  1. 开放式湖仓一体:利用 Apache Iceberg 等格式(通过 Google Cloud Lakehouse),数据云可在 BigQuery 和 Spark 等开源引擎之间提供互操作性,确保开放而灵活的数据存储,而不会受制于供应商。
  2. 自主数据平台BigQuery 等自主平台可自动完成注入、扩缩和处理,充当无服务器“数据到 AI”平台。
  3. 统一的数据治理Knowledge Catalog 等工具可为 AI 提供目录,为智能体提供语义,确保跨多云和混合环境进行数据和 AI 治理。
  4. 内置 AI 和机器学习:通过与 Gemini Enterprise Agent Platform 等平台集成,组织可以将 AI/机器学习嵌入业务流程,使数据“AI 就绪”,以便进行智能体和预测性分析。
  5. 事务型数据库:作为事实来源,捕获客户购买、库存变化或个人资料更新等实时事件。虽然这些数据库(通常是基于 SQL 的数据库,如 PostgreSQL 或 MySQL)经过优化,可以快速更新单个行,但数据云将它们集成到一个更大的生态系统中,以进行高级分析。

为数据科学家提供独特价值

Google Cloud 的数据云专为提高数据科学团队的工作效率而设计:

一个统一的工作区,供数据工程师和数据科学家使用 SQL、Python、Spark 或自然语言(通过 Gemini)开展协作。

只需一个命令即可提交 Spark 作业,无需管理集群,让数据科学家能够专注于代码和模型。

在笔记本和 BigQuery 中利用 Gemini 进行编码辅助,以加速预测性分析和预测。

数据云用途和示例

组织中常见的数据云用途包括:

  • 实时处理数据并获取洞见,以促进产品和服务创新并提升员工和客户体验
  • 整个数据生命周期管理过程中的数据保护与治理
  • 自助式分析报告、信息中心和可视化
  • AI 驱动的分析和自动化功能(包括数据和机器学习模型),以简化流程、提高效率并提供更高的生产力
  • 自动优化数据质量以提高数据一致性,无需移动或复制数据

总体而言,数据云的用途很广泛,并且可以在各行各业中取得出色的成效。零售品牌能够更好地了解库存情况并帮助员工在实体店内找到商品。医疗保健组织使用 AI 更快地分析样本,并将非结构化临床记录转换为结构化格式,从而提升患者治疗效果。物流公司通过更高效的路线减少燃料消耗,而金融服务机构和银行则可以提高处理速度。

数据云应用场景和示例

各行各业的组织都在使用数据云将非结构化数据转化为富有实用价值的分析洞见:

使用 AI 将非结构化临床记录转换为结构化格式,以便更快地进行分析并改善患者治疗效果。

实时了解库存情况,帮助员工找到商品并提升客户体验。

通过实时路线规划和数据驱动的物流,减少燃料消耗并提高运营效率。

现代数据云的核心优势

现代数据云超越了旧版基础设施,为技术团队提供了特定的运营优势:

自主可伸缩性

无服务器平台会根据工作负载需求自动预配资源,确保数据密集型迭代的性能,而无需手动管理集群。

AI 就绪型治理

集中式目录提供统一的事实来源,确保用于生成式 AI 和智能体的数据受到治理、安全且准确。

灵活集成

如果您的数据云基于开放协议构建并使用标准接口,则不管数据架构组件是由内部开发还是由第三方供应商开发,您可以更轻松地集成这些组件。开放式平台还可以确保可移植性和可扩展性,从而避免受制于特定供应商。

迭代更快

数据云不仅可以提高可预测工作负载的生产率,还能为团队提供资源和弹性,更快地针对不可预测和需要大量数据的工作负载进行迭代。

快速预配

数据云使数据工程师可以根据需要为开发者和企业用户快速预配新的数据管理资源。

改善业务成果

数据云的优势远不止于加速和简化数据工作。数据云已被证明能够改善许多其他方面,包括盈利能力、成本节省、弹性和风险管理等。

3 步操作指南,助您构建首个 AI 就绪型数据流水线

数据云的价值只有在实际应用中才能真正体现出来。下面介绍数据科学家如何利用 Google Cloud 免费试用服务,在几分钟内将原始存储数据转化为 AI 驱动型分析洞见。

场景:根据非结构化反馈预测零售需求

第 1 步:与 Google Cloud Lakehouse 统一

无需移动 PB 级数据,使用 Lakehouse 即可创建存储在 Apache Iceberg 中的客户日志的统一视图。这使得 BigQuery 和开源引擎之间能够立即实现互操作性,而不会受制于供应商。

第 2 步:使用 BigQuery Studio 和 Gemini 进行探索

打开 BigQuery Studio 笔记本,并使用 Gemini 根据自然语言提示生成 SQL 或 Python 代码。例如:“分析过去 30 天内顾客评价的情绪,并将其与库存水平相关联。”

第 3 步:使用 Managed Service for Apache Spark 进行扩缩

准备好将模型投入生产环境了吗?只需一个命令即可提交无服务器 Spark 作业。数据云负责自动扩缩和集群管理,让您能够专注于模型逻辑。

利用 Google Cloud 解决业务难题

新客户可获得 $300 赠金,用于抵扣 Google Cloud 的费用。
与 Google Cloud 销售专员联系,详细讨论您面临的独特挑战。

迈出下一步

获享 $300 赠金以及 20 多种提供“始终免费”用量的产品,开始在 Google Cloud 上构建项目。