现代数据云基于几个关键组件构建,可提供灵活性和可伸缩性:
Google Cloud 的数据云专为提高数据科学团队的工作效率而设计:
一个统一的工作区,供数据工程师和数据科学家使用 SQL、Python、Spark 或自然语言(通过 Gemini)开展协作。
只需一个命令即可提交 Spark 作业,无需管理集群,让数据科学家能够专注于代码和模型。
在笔记本和 BigQuery 中利用 Gemini 进行编码辅助,以加速预测性分析和预测。
总体而言,数据云的用途很广泛,并且可以在各行各业中取得出色的成效。零售品牌能够更好地了解库存情况并帮助员工在实体店内找到商品。医疗保健组织使用 AI 更快地分析样本,并将非结构化临床记录转换为结构化格式,从而提升患者治疗效果。物流公司通过更高效的路线减少燃料消耗,而金融服务机构和银行则可以提高处理速度。
各行各业的组织都在使用数据云将非结构化数据转化为富有实用价值的分析洞见:
使用 AI 将非结构化临床记录转换为结构化格式,以便更快地进行分析并改善患者治疗效果。
实时了解库存情况,帮助员工找到商品并提升客户体验。
通过实时路线规划和数据驱动的物流,减少燃料消耗并提高运营效率。
现代数据云超越了旧版基础设施,为技术团队提供了特定的运营优势:
自主可伸缩性
无服务器平台会根据工作负载需求自动预配资源,确保数据密集型迭代的性能,而无需手动管理集群。
AI 就绪型治理
集中式目录提供统一的事实来源,确保用于生成式 AI 和智能体的数据受到治理、安全且准确。
灵活集成
如果您的数据云基于开放协议构建并使用标准接口,则不管数据架构组件是由内部开发还是由第三方供应商开发,您可以更轻松地集成这些组件。开放式平台还可以确保可移植性和可扩展性,从而避免受制于特定供应商。
迭代更快
数据云不仅可以提高可预测工作负载的生产率,还能为团队提供资源和弹性,更快地针对不可预测和需要大量数据的工作负载进行迭代。
快速预配
数据云使数据工程师可以根据需要为开发者和企业用户快速预配新的数据管理资源。
改善业务成果
数据云的优势远不止于加速和简化数据工作。数据云已被证明能够改善许多其他方面,包括盈利能力、成本节省、弹性和风险管理等。
数据云的价值只有在实际应用中才能真正体现出来。下面介绍数据科学家如何利用 Google Cloud 免费试用服务,在几分钟内将原始存储数据转化为 AI 驱动型分析洞见。
第 1 步:与 Google Cloud Lakehouse 统一
无需移动 PB 级数据,使用 Lakehouse 即可创建存储在 Apache Iceberg 中的客户日志的统一视图。这使得 BigQuery 和开源引擎之间能够立即实现互操作性,而不会受制于供应商。
第 2 步:使用 BigQuery Studio 和 Gemini 进行探索
打开 BigQuery Studio 笔记本,并使用 Gemini 根据自然语言提示生成 SQL 或 Python 代码。例如:“分析过去 30 天内顾客评价的情绪,并将其与库存水平相关联。”
第 3 步:使用 Managed Service for Apache Spark 进行扩缩
准备好将模型投入生产环境了吗?只需一个命令即可提交无服务器 Spark 作业。数据云负责自动扩缩和集群管理,让您能够专注于模型逻辑。