資料湖泊是集中式、可擴充且安全的存放區,能以原生格式儲存、處理及分析大量結構化、半結構化和非結構化資料。與傳統儲存空間不同,資料湖泊可讓企業以任意速度和數量擷取資料,提供「完整不失真」的背景資訊,供進階分析和人工智慧 (AI) 作業使用。
資料湖泊提供可擴充且安全的平台,讓企業能從地端部署、雲端或邊緣的任何來源擷取資料,且不受預先定義的結構定義限制。
對於資料導向的機構,資料湖泊的價值在於支援:
資料湖泊和資料倉儲過去被視為互補的技術,但 Google Cloud 的開放式湖倉架構正消弭兩者之間的落差。
傳統資料倉儲專為重複的業務報表和結構化 SQL 分析而最佳化。相較之下,資料湖泊擅長處理機器學習所需的各種原始資料。
Google Cloud 透過 AI 原生跨雲端 Lakehouse,實現「開放式湖倉」做法。您可以使用 Apache Iceberg 等開放格式,在資料湖泊和資料倉儲中執行數據分析和 AI,兼具資料倉儲的效能和資料湖泊的彈性。
對資料科學家而言,資料湖泊不僅是儲存空間,更是實驗場域。Google Cloud 將資料湖泊直接整合至「從資料到 AI」生命週期,創造獨一無二的價值:
資料湖泊奠定了數據分析和人工智慧的基礎,可協助各行各業的企業更快將資料轉化為行動。
媒體娛樂
分析大量原始使用者互動資料,改善推薦系統,進而提高參與度和廣告收益
金融服務
運用即時市場資料,為機器學習模型提供強大支援,在市場狀況變動時立即管理投資組合風險。
企業 AI 和代理
讓 AI 代理存取統一的語意層和受管理的資料資產目錄,藉此建構及控管 AI 代理