数据科学解决方案

统一的数据、分析和机器学习平台,助力 AI 工作流

将复杂性转移到统一的数据和 AI 平台上,减轻数据团队的负担。Google Cloud 提供全面的托管式服务套件和集成式工作流,让您可以轻松构建、管理和扩缩数据科学解决方案。

概览

什么是数据科学解决方案?

数据科学解决方案是一种全面的技术驱动型方法,利用机器学习、AI 和统计建模来解决复杂的业务难题并提高运营效率。这使得关注点从基本数据分析转向全生命周期企业执行,强调数据工程、预测建模和 MLOps 的核心流程,将原始数据转化为自动化的战略优势。

为什么选择 Google Cloud 进行数据科学工作?

提高业务速度与敏捷性,创造短期和长期价值。传统方法通常需要将 5-7 种单独的工具拼接在一起,而 Google Cloud 的数据科学平台基于单一多模态数据基础,可涵盖从数据注入到模型部署的整个生命周期,并确保统一治理。

适用于各种业务挑战的数据科学解决方案

无论您的目标是提高收入、降低成本还是管理风险,Google Cloud 都能提供相应的工具来将数据模型工业化,并让您将重心从局部实验转移到实际的 MLOps 流水线。

工作方式

  • 个性化和决策加速:利用实时 AI/机器学习技术提升客户体验
  • 全栈企业集成:在生产环境中部署开源 AI,并实现稳健的全生命周期执行
  • 可伸缩的数据处理:基于一个统一的数据副本,利用 BigQuery SQL 和 Spark 等多个引擎进行处理

数据科学实用指南
本指南可帮助您开始在 Google Cloud 上使用数据科学工作流
常见用途

面向端到端数据科学工作流的统一平台

基于多模态数据基础构建,为整个数据科学和机器学习生命周期提供统一的解决方案,并确保统一治理

借助 BigQuery SQL 和 Apache Spark 等强大的分析引擎,然后使用 BigQuery ML 或 Gemini Enterprise Agent Platform 构建模型。借助 AI 优先的 Colab Enterprise 笔记本和强大的 MLOps,在行业领先 AI 技术的支持下简化开发流程。

数据科学集成工具
    基于多模态数据基础构建,为整个数据科学和机器学习生命周期提供统一的解决方案,并确保统一治理

    借助 BigQuery SQL 和 Apache Spark 等强大的分析引擎,然后使用 BigQuery ML 或 Gemini Enterprise Agent Platform 构建模型。借助 AI 优先的 Colab Enterprise 笔记本和强大的 MLOps,在行业领先 AI 技术的支持下简化开发流程。

    数据科学集成工具

      以 AI 优先的笔记本为核心的集中式工作区

      从一系列企业数据科学笔记本解决方案中进行选择

      Colab Enterprise 提供安全、受管理的集成环境,可与 Gemini Enterprise Agent Platform 和 BigQuery 集成。Workbench 提供可自定义的 JupyterLab 实例,而 Cloud Workstations 支持完整的 IDE。扩展程序还可以将自托管工具直接连接到 Google Cloud 服务。

      Gemini Enterprise Agent Platform 上的 Colab Enterprise 简介
        从一系列企业数据科学笔记本解决方案中进行选择

        Colab Enterprise 提供安全、受管理的集成环境,可与 Gemini Enterprise Agent Platform 和 BigQuery 集成。Workbench 提供可自定义的 JupyterLab 实例,而 Cloud Workstations 支持完整的 IDE。扩展程序还可以将自托管工具直接连接到 Google Cloud 服务。

        Gemini Enterprise Agent Platform 上的 Colab Enterprise 简介

          集成式数据科学代理

          借助智能体能力,加速数据科学开发,促进数据探索、转换与机器学习建模

          先用通俗英文给出高层目标,随后数据科学智能体将生成详尽计划,涵盖数据科学建模的各个环节:数据加载、探索、清理、可视化、特征工程、数据拆分、模型训练/优化与评估。

          数据科学代理
            借助智能体能力,加速数据科学开发,促进数据探索、转换与机器学习建模

            先用通俗英文给出高层目标,随后数据科学智能体将生成详尽计划,涵盖数据科学建模的各个环节:数据加载、探索、清理、可视化、特征工程、数据拆分、模型训练/优化与评估。

            数据科学代理

              AI 辅助的数据准备,消除数据孤岛

              利用统一的数据基础,通过 SQL 管理结构化和非结构化数据(图片、文档等)进行分析,并借助 AI 功能进行处理

              AI 辅助数据准备功能可提供数据清理和转换建议。数据工程智能体通过自然语言指令自动执行数据工程任务,包括数据导入和流水线创建。

              数据工程智能体
                利用统一的数据基础,通过 SQL 管理结构化和非结构化数据(图片、文档等)进行分析,并借助 AI 功能进行处理

                AI 辅助数据准备功能可提供数据清理和转换建议。数据工程智能体通过自然语言指令自动执行数据工程任务,包括数据导入和流水线创建。

                数据工程智能体

                  使用多个引擎灵活处理数据

                  统一的数据副本

                  可任选处理引擎(无论是 BigQuery 的 SQL 引擎,还是 Apache Spark 等开源框架),直接在单一且统一的数据副本上进行操作。由此无需为不同系统维护多份独立数据副本。

                  托管式 Dataproc 和无服务器 Spark
                    统一的数据副本

                    可任选处理引擎(无论是 BigQuery 的 SQL 引擎,还是 Apache Spark 等开源框架),直接在单一且统一的数据副本上进行操作。由此无需为不同系统维护多份独立数据副本。

                    托管式 Dataproc 和无服务器 Spark

                      借助适用于 Python 的 BigQuery DataFrames 扩展数据科学工作

                      偏好 Python 原生库吗?

                      BigQuery DataFrames 提供类 pandas 的 API,可将 Python 代码转换为优化后的 SQL,并在 BigQuery 引擎上执行。因此,您可灵活选用合适的工具来完成对应的作业(无论是 SQL、PySpark,还是 pandas 风格的 DataFrame),同时始终基于相同的底层数据进行操作

                      借助适用于 Python 的 BigQuery DataFrames 扩展数据科学工作
                        偏好 Python 原生库吗?

                        BigQuery DataFrames 提供类 pandas 的 API,可将 Python 代码转换为优化后的 SQL,并在 BigQuery 引擎上执行。因此,您可灵活选用合适的工具来完成对应的作业(无论是 SQL、PySpark,还是 pandas 风格的 DataFrame),同时始终基于相同的底层数据进行操作

                        借助适用于 Python 的 BigQuery DataFrames 扩展数据科学工作

                          构建、训练、调优和运行机器学习模型

                          使用 SQL 借助 BigQuery ML 构建、训练、评估并部署模型,无需移动数据

                          利用内置预训练模型,或通过 SQL 函数调用 Gemini,完成数据分析/丰富。对于自定义模型,Agent Platform 支持 PyTorch、TensorFlow 及其他机器学习库。无缝集成使您可在 BigQuery 中完成特征工程、在 Agent Platform 中进行自定义模型训练,并通过 SQL 回到 BigQuery 完成推理。

                          BQML
                            使用 SQL 借助 BigQuery ML 构建、训练、评估并部署模型,无需移动数据

                            利用内置预训练模型,或通过 SQL 函数调用 Gemini,完成数据分析/丰富。对于自定义模型,Agent Platform 支持 PyTorch、TensorFlow 及其他机器学习库。无缝集成使您可在 BigQuery 中完成特征工程、在 Agent Platform 中进行自定义模型训练,并通过 SQL 回到 BigQuery 完成推理。

                            BQML

                              借助集成式 MLOps,让模型快速走向生产。

                              BigQuery 与 Gemini Enterprise Agent Platform 深度集成,简化 MLOps

                              将特征集中管理于 Gemini Enterprise Agent Platform Feature Store,避免训练-应用偏差与重复工作。使用 AutoML 自动构建表格数据模型。所有模型(无论来自 BigQuery ML 还是 Gemini Enterprise Agent Platform),都会自动注册到该平台的 Model Registry。之后,您可轻松完成版本管理、评估与部署,在单一平台上构建无缝的端到端生命周期。

                              使用 MLOps 的端到端工作流
                                BigQuery 与 Gemini Enterprise Agent Platform 深度集成,简化 MLOps

                                将特征集中管理于 Gemini Enterprise Agent Platform Feature Store,避免训练-应用偏差与重复工作。使用 AutoML 自动构建表格数据模型。所有模型(无论来自 BigQuery ML 还是 Gemini Enterprise Agent Platform),都会自动注册到该平台的 Model Registry。之后,您可轻松完成版本管理、评估与部署,在单一平台上构建无缝的端到端生命周期。

                                使用 MLOps 的端到端工作流

                                  借助 Google Cloud 更进一步

                                  获享 $300 赠金以及 20 多种提供“始终免费”用量的产品,开始在 Google Cloud 上构建项目。

                                  不知从何入手,需要一点帮助?

                                  探索 Google Cloud 上的数据科学资源,覆盖从数据探索到 MLOps 的全流程。

                                  了解如何在整个机器学习工作流中开发自定义训练的模型。

                                  通过分步演示、教程和实操编码开始试用 Google Cloud

                                  业务用例

                                  以成效为导向的成功


                                  查看更多

                                  从传统到云端:Deutsche Telekom 如何从 PySpark 迁移至 BigQuery DataFrames

                                  了解详情

                                  “从数月到数分钟:借助 AI 将 2000 多万条消费者评价转化为分析洞见。”

                                  了解详情

                                  实现实时 AI/机器学习,打造个性化客户体验并提升运营效率

                                  立即观看

                                  • Deutsche Telekom 徽标
                                  • Mattel 徽标
                                  • Flipkart 徽标
                                  • Snap 徽标
                                  • Wayfair 徽标
                                  行业角色

                                  专为数据科学团队中的每个角色打造

                                  行业角色

                                  常见问题解答

                                  面向数据科学家和机器学习工程师

                                  重点介绍 Colab Enterprise 笔记本的开发者体验、对 PyTorch 和 TensorFlow 等框架的支持,以及 BigQuery DataFrames。团队可以在项目之间共享笔记本、数据连接和计算资源,使 Google Cloud 成为真正的协作式数据科学平台。

                                  最大限度地提高投资回报率和治理水平。统一的平台可减少工具泛滥和供应商成本,并内置治理功能。无需单独的 MLOps 团队模型即可从笔记本用于生产用途,直接支持 3 倍/4 倍/10 倍的性能统计数据。

                                  集成和灵活性可带来优势。支持开源兼容性(Apache Spark、Airflow 和 Kafka)和基于一个数据副本进行多引擎处理,确保框架不会受制于特定供应商。