Google Cloud 的資料科學解決方案

整合式平台,提供資料管理、分析和機器學習工具,加速「從資料到 AI」工作流程。

Google Cloud 資料科學實用指南

選用 Google Cloud 資料科學解決方案的優點

Google Cloud 統合式資料與 AI 平台

提升業務的速度和靈活性,創造短期和長期價值。

3 倍


將資料移動程度降到最低,提高成本效益

4 倍


模型訓練、微調及部署速度加快 4 倍

10 倍


AI 成本降低 10 倍,更容易達成投資報酬率目標

整合式資料科學工具

統合式平台,採用端對端資料科學工作流程

以多模態資料為基礎,打造整合式解決方案,涵蓋整個資料科學與機器學習生命週期,確保統一管理。您可以先運用 BigQuery SQL 和 Spark 等強大的分析引擎,再用 BigQuery ML 或 Vertex AI 建立模型。結合由業界頂尖 AI 驅動的 AI 優先 Colab Enterprise 筆記本和穩健的 MLOps,簡化開發流程。

採用集中工作區並提供 AI 優先筆記本

從一系列筆記本解決方案中選擇,滿足企業資料科學需求。Colab Enterprise 提供安全的代管環境,並與 Vertex AI 和 BigQuery 整合。Vertex AI Workbench 提供可自訂的 JupyterLab 執行個體,而 Cloud Workstations 則支援完整的 IDE。擴充功能還能將自行託管的工具直接連至 Google Cloud 服務。

資料科學代理

整合式資料科學代理

運用代理能力探索及轉換資料,並建立機器學習模型,加快資料科學開發速度。只要用簡單的英文設定概略目標,資料科學代理就會生成詳細計畫,涵蓋資料科學模型的所有層面,包括載入、探索、清理、視覺化、特徵工程、資料分割、模型訓練/最佳化和評估。

由 AI 協助準備,打破資料孤島

運用統一的資料基礎,使用 SQL 管理結構化和非結構化資料 (圖片、文件等),藉此分析並使用 AI 函式處理資料。AI 輔助的資料準備功能會提供資料清理和轉換建議。資料工程代理可透過自然語言指令,自動執行資料工程工作,包括擷取資料和建立管道。

Data Engineering Agent
代管 Dataproc 和無伺服器 Spark

使用多個引擎,靈活處理資料

無論是 BigQuery 的 SQL 引擎,還是 Apache Spark 等開放原始碼架構,都能直接處理單一統合式資料副本。這樣一來,就不必為不同系統維護個別的資料副本。

使用支援 Python 的 BigQuery DataFrames 擴充資料科學作業規模

偏好使用 Python 原生程式庫嗎?BigQuery DataFrames 提供類似 pandas 的 API,可將 Python 程式碼轉譯為適合在 BigQuery 引擎上執行的 SQL。無論是 SQL、PySpark 或 pandas 風格的 DataFrame,都能使用合適的工具處理相同基礎資料,靈活度極高。

BigQuery DataFrames 影片
BQML

建構、訓練、調整及執行機器學習模型

透過 SQL 使用 BigQuery ML 建構、訓練、評估及部署模型,不必移動資料。運用內建的預先訓練模型,或藉由 SQL 函式呼叫 Gemini 進行資料分析/enrichment。Vertex AI 支援 PyTorch、TensorFlow 和其他機器學習程式庫,供您建立自訂模型。您可以在 BigQuery 進行特徵工程、在 Vertex AI 自訂模型訓練工作,並透過 SQL 在 BigQuery 執行推論,一切都完美整合。

生成嵌入並啟用向量搜尋功能

生成並使用多模態嵌入執行向量搜尋,進而瞭解語意並根據相似度檢索多模態資料。您不必管理個別的專用向量資料庫,就能建構精密的語意搜尋、建議或區隔系統。

嵌入和向量搜尋

透過整合式 MLOps,完成模型開發到正式環境部署的所有流程

BigQuery 和 Vertex AI 整合後,可簡化 MLOps 的「最後一哩路」。Vertex AI 特徵儲存庫可集中存放特徵,避免訓練/應用偏差和重複作業。Vertex AI AutoML 可自動建構表格型資料的模型。無論模型來自 BigQuery ML 或 Vertex AI,都會自動在 Vertex AI Model Registry 註冊,方便您在單一平台上輕鬆管理版本、評估及部署模型,打造流暢的端對端生命週期。