Gartner® 在《Magic Quadrant™ for Data Science and Machine Learning Platforms》(數據資料學與機器學習平台 Magic Quadrant™) 報告中，將 Google 評選為領導品牌

資料科學解決方案

適用於 AI 工作流程的整合式資料、分析與機器學習平台

將複雜作業交給統合資料與 AI 平台，減輕資料團隊的負擔。Google Cloud 的全方位代管服務套件和整合式工作流程，可助您輕鬆建構、管理及擴充資料科學解決方案。

總覽

什麼是資料科學解決方案？

資料科學解決方案是全方位的技術導向做法，運用機器學習、AI 和統計模型來解決複雜的業務難題，並提升營運效率。這項做法可將重心從基本資料分析轉移至企業執行作業的完整生命週期，著重於資料工程、預測模型和 MLOps 的核心程序，將原始資料轉化為自動化且具策略價值的成果。

選用 Google Cloud 資料科學解決方案的優點

提升業務的速度和靈活性，創造短期和長期價值。傳統做法往往需要整合 5 到 7 種不同工具，而 Google Cloud 的資料科學平台以單一多模態資料為基礎，涵蓋從資料擷取到模型部署的完整生命週期，確保統一管理。

適用於各種業務難題的資料科學解決方案

無論您的目標是提高收益、降低成本或管理風險，Google Cloud 都能提供工具，協助您將資料模型產業化，並將重心從個別實驗轉移至實際的 MLOps 管道。

運作方式

個人化與加速決策：運用即時 AI/機器學習技術提升客戶體驗
全端企業整合：在正式環境中部署開放原始碼 AI，並透過健全的全生命週期執行作業
可擴充的資料處理能力：在單一統合式資料副本上，運用 BigQuery SQL 和 Spark 等多種引擎

本指南將協助您開始在 Google Cloud 執行資料科學工作流程

常見用途

統合式平台，採用端對端資料科學工作流程

以多模態資料為基礎，打造整合式解決方案，涵蓋整個資料科學與機器學習生命週期，確保統一管理

您可以先運用 BigQuery SQL 和 Apache Spark 等強大的分析引擎，再用 BigQuery ML 或 Gemini Enterprise Agent Platform 建立模型。結合由業界頂尖 AI 驅動的 AI 優先 Colab Enterprise 筆記本和穩健的 MLOps，簡化開發流程。

操作說明

以多模態資料為基礎，打造整合式解決方案，涵蓋整個資料科學與機器學習生命週期，確保統一管理

採用集中工作區並提供 AI 優先筆記本

從一系列筆記本解決方案中，選擇適合企業資料科學的產品

Colab Enterprise 提供安全的代管環境，並整合 Gemini Enterprise Agent Platform 和 BigQuery。Workbenches 提供可自訂的 JupyterLab 執行個體，而 Cloud Workstations 則支援完整的 IDE。擴充功能還能將自行託管的工具直接連至 Google Cloud 服務。

6:00

Gemini Enterprise Agent Platform 上的 Colab Enterprise 簡介

操作說明

從一系列筆記本解決方案中，選擇適合企業資料科學的產品

6:00

Gemini Enterprise Agent Platform 上的 Colab Enterprise 簡介

整合式資料科學代理

運用代理能力探索及轉換資料，並建立機器學習模型，加快資料科學開發速度

只要用簡單的英文設定概略目標，資料科學代理就會生成詳細計畫，涵蓋資料科學模型的所有層面，包括載入、探索、清理、視覺化、特徵工程、資料分割、模型訓練/最佳化和評估。

操作說明

運用代理能力探索及轉換資料，並建立機器學習模型，加快資料科學開發速度

由 AI 協助準備，打破資料孤島

運用統一的資料基礎，使用 SQL 管理結構化和非結構化資料 (圖片、文件等)，藉此分析並使用 AI 函式處理資料

AI 輔助資料準備功能會提供資料清理和轉換建議。資料工程代理可透過自然語言指令，自動執行資料工程工作，包括擷取資料和建立管道。

操作說明

運用統一的資料基礎，使用 SQL 管理結構化和非結構化資料 (圖片、文件等)，藉此分析並使用 AI 函式處理資料

AI 輔助資料準備功能會提供資料清理和轉換建議。資料工程代理可透過自然語言指令，自動執行資料工程工作，包括擷取資料和建立管道。

使用多個引擎，靈活處理資料

統一的資料副本

無論是 BigQuery 的 SQL 引擎，還是 Apache Spark 等開放原始碼架構，都能直接處理單一統合式資料副本。不用為不同系統個別維護資料。

操作說明

統一的資料副本

無論是 BigQuery 的 SQL 引擎，還是 Apache Spark 等開放原始碼架構，都能直接處理單一統合式資料副本。不用為不同系統個別維護資料。

使用支援 Python 的 BigQuery DataFrames 擴充資料科學作業規模

偏好使用 Python 原生資料庫嗎？

BigQuery DataFrames 提供類似 pandas 的 API，可將 Python 程式碼轉譯為適合在 BigQuery 引擎上執行的 SQL。無論是 SQL、PySpark 或適用於 pandas 的 DataFrame，您都能使用相同的基礎資料，並靈活運用合適的工具完成所需工作

39:26

使用支援 Python 的 BigQuery DataFrames 擴充資料科學作業規模

操作說明

偏好使用 Python 原生資料庫嗎？

39:26

使用支援 Python 的 BigQuery DataFrames 擴充資料科學作業規模

建構、訓練、調整及執行機器學習模型

透過 SQL 使用 BigQuery ML 建構、訓練、評估及部署模型，不必移動資料

運用內建的預先訓練模型，或藉由 SQL 函式呼叫 Gemini 進行資料分析/enrichment。Agent Platform 支援 PyTorch、TensorFlow 和其他機器學習程式庫，供您建立自訂模型。您可以在 BigQuery 進行特徵工程、在 Agent Platform 自訂模型訓練工作，並透過 SQL 在 BigQuery 執行推論，一切都完美整合。

操作說明

透過 SQL 使用 BigQuery ML 建構、訓練、評估及部署模型，不必移動資料

生成嵌入項目並啟用向量搜尋

生成並使用多模態嵌入執行向量搜尋，進而瞭解語意並根據相似度檢索多模態資料。您不必管理個別的專用向量資料庫，就能建構精密的語意搜尋、建議或區隔系統。

操作說明

透過整合式 MLOps，完成模型開發到正式環境部署的所有流程

BigQuery 和 Gemini Enterprise Agent Platform 整合後，可簡化 MLOps 流程

在 Gemini Enterprise Agent Platform 特徵儲存庫中集中管理特徵，避免訓練/應用偏差和重複作業。AutoML 可自動建構表格型資料的模型。無論模型來自 BigQuery ML 或 Gemini Enterprise Agent Platform，都會自動在平台 Model Registry 註冊，方便您在單一平台上輕鬆管理版本、評估及部署模型，打造流暢的端對端生命週期。