觀看《Google 資料雲端高峰會》這部隨選影片,瞭解數據分析、AI、商業智慧和資料庫領域的最新創新成果。

Dataprep by Trifacta

您可以在這項智慧型雲端資料服務中,透過圖表探索、清理及準備資料,以便用於數據分析和機器學習作業。

查看這項產品的說明文件

Dataprep 圖示位於打開的筆電前方,右側有一疊網頁,左側為標示 Trifacta 標誌的試算表,後方的雲朵中則有長條圖

智慧型資料準備服務

Dataprep by Trifacta 是一項智慧型資料服務,您可以透過圖表探索、清理及準備結構化與非結構化資料,以便用於數據分析、報表製作和機器學習作業。Dataprep 採用無伺服器架構,並能處理任何規模的資料,因此您不必部署或管理任何基礎架構。只要在使用者介面中輸入內容,Dataprep 就會建議及預測接下來最合適的資料轉換作業,省去您編寫程式碼的麻煩。

最新資訊

顯示許多資料的電腦螢幕

無伺服器的簡便設計

Dataprep 是由 Trifacta 營運的整合式合作夥伴服務,原型為該公司領先業界的資料準備解決方案。Google 與 Trifacta 密切合作,攜手提供流暢的使用者體驗,使用者無需預先安裝軟體、另外支付授權費用,也不必持續處理日常營運作業。Dataprep 是一項能隨需調度資源的全代管服務,可滿足企業日漸增加的資料準備需求,幫助您專心分析資料。

別具風格的圖形,左下角有碼錶圖示

快速探索與異常偵測

資料分布情形一目了然,幫助您迅速看懂並探索資料。Dataprep 會自動偵測結構定義、資料類型、可能的彙整和異常狀況 (例如缺少的值、離群值和重複值),讓您省去耗時的資料品質評估工作,直接進行探索與分析。

打開的紙箱中冒出一個含有文字的頁面,右側空白處有藍色勾號。圖片左側是 Dataprep 圖示。

簡單而強大的資料準備功能

每當您在使用者介面中執行操作時,Dataprep 都會自動建議及預測接下來最合適的資料轉換作業。轉換順序設定完畢後,Dataprep 會在背景中使用 Dataflow 或 BigQuery。您只要點點滑鼠就能處理各種規模的結構化或非結構化資料集,完全無需編寫程式碼。

Dataprep 的功能與特色

有 Starter、Professional 和 Enterprise 版可供選擇。

可預測的轉換作業

Dataprep 會運用專屬的推論演算法,根據使用者選取的資料解讀其資料轉換意圖,據此自動產生一組經過排序的建議和模式。

多樣化的轉換作業

運用數百項函式將資料轉換為所需資產。只需按一下滑鼠,就能套用匯總、透視、解除透視、彙整、聯集、擷取、計算、比較、條件、合併和規則運算式等。

最佳化處理量

Dataprep 會自動選取最合適的基礎 Google Cloud 處理引擎,協助您盡快轉換資料。這項服務會根據資料位置和資料量,利用 BigQuery (原地 ELT 轉換)、Dataflow 或 Dataprep 記憶體內引擎 (適用於少量資料) 來準備資料。

動態剖析

透過互動式圖表呈現資料分布情況,方便您查看及探索資料,進而輕鬆發掘、清理及轉換資料。Dataprep 創新的剖析技術會將關鍵統計資訊視覺化,並以容易理解的動態方式呈現,協助您解讀大量資料。

資料品質規則

資料品質規則會提供資料品質指標建議,幫助您監控和修正有關資料準確性、完整性、一致性、有效性和重複性的問題,確保您完整掌握資料的乾淨度。

協同合作

在團隊合作環境中,若能讓多位使用者處理相同資產,或是建立優良成品的副本做為範本供他人使用,將可收事半功倍之效。Dataprep 可讓使用者即時協同處理相同的流程物件,或是建立可供他人用於其他獨立工作的副本。

完善的連線支援

除了 BigQuery、Cloud Storage、Microsoft Excel 和 Google 試算表標準連線外,您還能從 Salesforce、Oracle、Microsoft SQL Server、MySQL、PostgreSQL 等上百個來源輸入資料,使自助式數據分析更加完善。

協調資料管道

按照序列和條件順序串連資料準備工作,藉此安排工作時間表並進行自動化處理。系統會提醒使用者操作成功或失敗,並觸發外部工作 (例如 Cloud Functions)。另外,您可透過全方位的 API,將 Dataprep 整合至企業的端對端解決方案。

企業規模的作業模式

採取持續部署做法,使用跨版本的方案匯入/匯出功能、流程參數、Dataflow 或 BigQuery 自訂設定、效能微調功能和進階 API,自動處理軟體開發生命週期和監控作業。

常見的資料類型

無論資料集是否經過結構化處理,也不論內容是以 CSV、JSON 或關聯資料表格式儲存,甚至是 MB 或 PB 等任何規模的軟體式服務 (SaaS) 應用程式資料,您都能以簡便的方式加以轉換。

模式比對

您可以運用資料欄模式比對功能來識別所需的資料模式,並在介面中顯示這類模式,以便建立方案。另外,您可以在方案步驟中套用規則運算式或 Dataprep 模式,在資料集內搜尋所需模式並轉換相符資料。

標準化

系統會識別拼字或不受語言影響的發音,並依據相似程度將資料值分組,建立具有一致資料值的標準化叢集。

取樣

為發揮最佳效能,Dataprep 會自動產生一或多個可在用戶端應用程式中顯示及操作的資料樣本。不過,您仍可輕鬆變更樣本的大小、範圍及建立方法。

進階安全性

使用 Google IAM 角色搭配 BigQuery、Cloud Storage 和 Google 試算表存取權來決定存取權限,提供個別資料存取權控管機制,以拓展現有的安全性標準。

Dataprep ELT 管道架構

左側的「擷取」資料欄列出原始資料的來源,包括 BigQuery、Cloud Storage、Google 試算表、Microsoft Excel、資料庫、應用程式和上傳的檔案。箭頭向右連接至「準備與儲存」資料欄,當中包含 Cloud Dataprep 和 Dataflow。在這個階段,BigQuery 和 Cloud Storage 中的資料會經過修正。這個資料欄的下方是「管理與自動化」,當中包含 Data Catalog、Cloud Functions 和 Cloud Composer。箭頭繼續延伸至右側的「數據分析與機器學習」資料欄,下方列有 BigQuery/BigQuery ML、Looker、Google 數據分析、合作夥伴商業智慧 (BI) 服務 (此處顯示 Qlik 標誌) 和 Cloud AI 平台。
Merkle 標誌

「Dataprep 幫助我們迅速探索新的資料集,而且這項服務富有彈性,能滿足各種資料轉換需求。Merkle 的資料準備工作現在僅需幾分鐘就能完成,不必耗費數小時或數日,資料準備速度加快了 90%。」

Merkle IT 架構師 Henry Culver

閱讀案例

我們的客戶

定價

查看 Google Cloud Marketplace 的定價頁面。

後續行動

運用價值 $300 美元的免費抵免額和超過 20 項一律免費的產品,開始在 Google Cloud 中建構產品與服務。

需要入門協助嗎?
與值得信賴的夥伴合作
繼續瀏覽

後續行動

展開下一項專案、探索互動式教學課程及管理帳戶。

需要入門協助嗎?
與值得信賴的夥伴合作
查看提示和最佳做法