在《数据科学与机器学习平台魔力象限™》报告中，Gartner® 将 Google 评为业界领导者。

数据科学解决方案

统一的数据、分析和机器学习平台，助力 AI 工作流

将复杂性转移到统一的数据和 AI 平台上，减轻数据团队的负担。Google Cloud 提供全面的托管式服务套件和集成式工作流，让您可以轻松构建、管理和扩缩数据科学解决方案。

概览

什么是数据科学解决方案？

数据科学解决方案是一种全面的技术驱动型方法，利用机器学习、AI 和统计建模来解决复杂的业务难题并提高运营效率。这使得关注点从基本数据分析转向全生命周期企业执行，强调数据工程、预测建模和 MLOps 的核心流程，将原始数据转化为自动化的战略优势。

为什么选择 Google Cloud 进行数据科学工作？

提高业务速度与敏捷性，创造短期和长期价值。传统方法通常需要将 5-7 种单独的工具拼接在一起，而 Google Cloud 的数据科学平台基于单一多模态数据基础，可涵盖从数据注入到模型部署的整个生命周期，并确保统一治理。

适用于各种业务挑战的数据科学解决方案

无论您的目标是提高收入、降低成本还是管理风险，Google Cloud 都能提供相应的工具来将数据模型工业化，并让您将重心从局部实验转移到实际的 MLOps 流水线。

工作方式

个性化和决策加速：利用实时 AI/机器学习技术提升客户体验
全栈企业集成：在生产环境中部署开源 AI，并实现稳健的全生命周期执行
可伸缩的数据处理：基于一个统一的数据副本，利用 BigQuery SQL 和 Spark 等多个引擎进行处理

本指南可帮助您开始在 Google Cloud 上使用数据科学工作流

常见用途

面向端到端数据科学工作流的统一平台

基于多模态数据基础构建，为整个数据科学和机器学习生命周期提供统一的解决方案，并确保统一治理

借助 BigQuery SQL 和 Apache Spark 等强大的分析引擎，然后使用 BigQuery ML 或 Gemini Enterprise Agent Platform 构建模型。借助 AI 优先的 Colab Enterprise 笔记本和强大的 MLOps，在行业领先 AI 技术的支持下简化开发流程。

方法指南

基于多模态数据基础构建，为整个数据科学和机器学习生命周期提供统一的解决方案，并确保统一治理

以 AI 优先的笔记本为核心的集中式工作区

从一系列企业数据科学笔记本解决方案中进行选择

Colab Enterprise 提供安全、受管理的集成环境，可与 Gemini Enterprise Agent Platform 和 BigQuery 集成。Workbench 提供可自定义的 JupyterLab 实例，而 Cloud Workstations 支持完整的 IDE。扩展程序还可以将自托管工具直接连接到 Google Cloud 服务。

6:00

Gemini Enterprise Agent Platform 上的 Colab Enterprise 简介

方法指南

从一系列企业数据科学笔记本解决方案中进行选择

6:00

Gemini Enterprise Agent Platform 上的 Colab Enterprise 简介

集成式数据科学代理

借助智能体能力，加速数据科学开发，促进数据探索、转换与机器学习建模

先用通俗英文给出高层目标，随后数据科学智能体将生成详尽计划，涵盖数据科学建模的各个环节：数据加载、探索、清理、可视化、特征工程、数据拆分、模型训练/优化与评估。

方法指南

借助智能体能力，加速数据科学开发，促进数据探索、转换与机器学习建模

AI 辅助的数据准备，消除数据孤岛

利用统一的数据基础，通过 SQL 管理结构化和非结构化数据（图片、文档等）进行分析，并借助 AI 功能进行处理

AI 辅助数据准备功能可提供数据清理和转换建议。数据工程智能体通过自然语言指令自动执行数据工程任务，包括数据导入和流水线创建。

方法指南

利用统一的数据基础，通过 SQL 管理结构化和非结构化数据（图片、文档等）进行分析，并借助 AI 功能进行处理

AI 辅助数据准备功能可提供数据清理和转换建议。数据工程智能体通过自然语言指令自动执行数据工程任务，包括数据导入和流水线创建。

使用多个引擎灵活处理数据

统一的数据副本

可任选处理引擎（无论是 BigQuery 的 SQL 引擎，还是 Apache Spark 等开源框架），直接在单一且统一的数据副本上进行操作。由此无需为不同系统维护多份独立数据副本。

方法指南

统一的数据副本

借助适用于 Python 的 BigQuery DataFrames 扩展数据科学工作

偏好 Python 原生库吗？

BigQuery DataFrames 提供类 pandas 的 API，可将 Python 代码转换为优化后的 SQL，并在 BigQuery 引擎上执行。因此，您可灵活选用合适的工具来完成对应的作业（无论是 SQL、PySpark，还是 pandas 风格的 DataFrame），同时始终基于相同的底层数据进行操作

39:26

借助适用于 Python 的 BigQuery DataFrames 扩展数据科学工作

方法指南

偏好 Python 原生库吗？

39:26

借助适用于 Python 的 BigQuery DataFrames 扩展数据科学工作

构建、训练、调优和运行机器学习模型

使用 SQL 借助 BigQuery ML 构建、训练、评估并部署模型，无需移动数据

利用内置预训练模型，或通过 SQL 函数调用 Gemini，完成数据分析/丰富。对于自定义模型，Agent Platform 支持 PyTorch、TensorFlow 及其他机器学习库。无缝集成使您可在 BigQuery 中完成特征工程、在 Agent Platform 中进行自定义模型训练，并通过 SQL 回到 BigQuery 完成推理。

方法指南

使用 SQL 借助 BigQuery ML 构建、训练、评估并部署模型，无需移动数据

生成嵌入并启用向量搜索

生成并使用多模态嵌入来执行向量搜索，从而实现多模态数据的语义理解和相似度检索。这样，您就可以构建复杂的语义搜索、推荐或细分系统，而无需管理单独的专用向量数据库。

方法指南

借助集成式 MLOps，让模型快速走向生产。

BigQuery 与 Gemini Enterprise Agent Platform 深度集成，简化 MLOps

将特征集中管理于 Gemini Enterprise Agent Platform Feature Store，避免训练-应用偏差与重复工作。使用 AutoML 自动构建表格数据模型。所有模型（无论来自 BigQuery ML 还是 Gemini Enterprise Agent Platform），都会自动注册到该平台的 Model Registry。之后，您可轻松完成版本管理、评估与部署，在单一平台上构建无缝的端到端生命周期。