什麼是資料湖泊?

資料湖泊是集中式、可擴充且安全的存放區,能以原生格式儲存、處理及分析大量結構化、半結構化和非結構化資料。與傳統儲存空間不同,資料湖泊可讓企業以任意速度和數量擷取資料,提供「完整不失真」的背景資訊,供進階分析和人工智慧 (AI) 作業使用。

資料湖泊簡介:即時與 AI 作業所需的擴充性

資料湖泊提供可擴充且安全的平台,讓企業能從地端部署、雲端或邊緣的任何來源擷取資料,且不受預先定義的結構定義限制。

對於資料導向的機構,資料湖泊的價值在於支援:

  • 無伺服器資料處理: 提交工作時,不必建立、設定或管理叢集
  • 完整不失真的儲存空間:以原始格式儲存任何資料量,確保資料科學家擁有複雜實驗所需的原始背景資訊
  • 即時擷取:大規模處理串流資料,為即時分析和互動性更佳的 AI 應用程式提供支援

資料湖泊與資料倉儲:從舊系統進化為開放式湖倉

資料湖泊和資料倉儲過去被視為互補的技術,但 Google Cloud 的開放式湖倉架構正消弭兩者之間的落差。

傳統資料倉儲專為重複的業務報表和結構化 SQL 分析而最佳化。相較之下,資料湖泊擅長處理機器學習所需的各種原始資料。

Google Cloud 透過 AI 原生跨雲端 Lakehouse,實現「開放式湖倉」做法。您可以使用 Apache Iceberg 等開放格式,在資料湖泊和資料倉儲中執行數據分析和 AI,兼具資料倉儲的效能和資料湖泊的彈性。

專為資料科學家打造:加速「從資料到 AI」的生命週期

對資料科學家而言,資料湖泊不僅是儲存空間,更是實驗場域。Google Cloud 將資料湖泊直接整合至「從資料到 AI」生命週期,創造獨一無二的價值:

  • 互動式開發:使用 BigQuery Studio 筆記本,以慣用的工具和語言 (例如 Python、R 或 SQL) 開發 Apache Spark 應用程式。
  • 統一治理:透過 Knowledge Catalog 治理資料、AI 模型和代理,從結構化、非結構化和 SaaS 資料資產為代理提供脈絡。
  • 脈絡工程:運用資料湖泊中儲存的原始脈絡資訊,提升生成式 AI 模型和自主資料代理的準確率

透過 Google Cloud 解決業務難題

新客戶可以獲得價值 $300 美元的免費抵免額,盡情試用各項 Google Cloud 功能。
訂閱 Google Cloud 電子報,即時掌握產品動態、活動資訊和特價優惠等最新消息。

資料湖泊的策略性用途

資料湖泊奠定了數據分析和人工智慧的基礎,可協助各行各業的企業更快將資料轉化為行動。

媒體娛樂

分析大量原始使用者互動資料,改善推薦系統,進而提高參與度和廣告收益

金融服務

運用即時市場資料,為機器學習模型提供強大支援,在市場狀況變動時立即管理投資組合風險。

企業 AI 和代理

讓 AI 代理存取統一的語意層和受管理的資料資產目錄,藉此建構及控管 AI 代理

後續行動

運用價值 $300 美元的免費抵免額和 20 多項一律免費的產品,開始在 Google Cloud 建構產品與服務。

Google Cloud