Dataprep by Trifacta

透過這項智慧型雲端資料服務中的視覺化介面,輕鬆探索、清理及準備資料,以便用於資料分析和機器學習作業。

查看這項產品的說明文件

智慧型資料準備服務

智慧型資料準備服務

Cloud Dataprep by Trifacta 是一套智慧型資料服務,能讓您透過當中的視覺化介面來探索、清理及準備相關資料 (包括結構化資料與非結構化資料),以便用於分析、報表和機器學習作業。Cloud Dataprep 採用無伺服器技術,並能處理任何規模的資料,因此您不必部署或管理任何基礎架構。只要操作使用者介面,Cloud Dataprep 就會建議和預測接下來最合適的資料轉換作業,為您省去編寫程式碼的麻煩。

最新資訊

無伺服器的簡便設計

Cloud Dataprep 是由 Trifacta 負責營運的整合式合作夥伴服務,其設計原型為 Trifacta 領先業界的資料準備解決方案。Google 與 Trifacta 密切合作,攜手提供流暢的使用者體驗,使用者不必預先安裝軟體、另行支付授權費用,也不必持續負擔營運成本。Cloud Dataprep 是一項可以視情況進行擴充的全代管服務,能協助您滿足日漸增加的資料準備需求,讓您持續專注於資料分析工作。

快速探索與異常偵測功能

資料分布情形一目了然,幫助您迅速看懂與探索資料。Cloud Dataprep 會自動偵測結構定義、資料類型、可能的彙整作業和異常情況 (例如缺少的值、離群值和重複值),讓您省去曠日廢時的資料品質評估工作,直接進行探索與分析。

簡單而強大的資料準備功能

每當您在使用者介面中執行操作項目時,Cloud Dataprep 都會自動建議及預測最合適的下一項資料轉換作業。轉換順序定義完畢之後,Cloud Dataprep 會在背景中使用 Cloud Dataflow。您只要輕鬆按幾下滑鼠,就能處理各種規模的結構化或非結構化資料集,完全不需要編寫程式碼。

功能與特色

可預測的轉換作業

Cloud Dataprep 會透過專屬的推論演算法解讀使用者資料選取項目的資料轉換意圖,然後自動產生一組經過排序的建議和模式,方便您調整所選項目設定。

多樣化的轉換作業

運用數百項函式將資料轉換為所需資產。您只需要按一下滑鼠,即可套用匯總、透視、解除透視、彙整、聯集、擷取、計算、比較、條件、合併和規則運算式等。

參數化

您可以將變數參數化來取代檔案路徑中每次經過重新整理都會變更的部分,以便在相同資料集的多個執行個體中執行方案。您可以在工作執行階段中視需求修改這類變數。

協同合作

在團隊合作的環境中,如有多位使用者同時處理同一項資產,或是為優質成品建立副本來當做可供他人參考的範本,您就能更輕鬆地執行作業。Cloud Dataprep 可讓使用者即時協同處理相同的流程物件,或是建立可供他人用於其他獨立工作的副本。

模式比對

您可以運用資料欄模式比對功能來識別所需的資料模式,並在介面中顯示這類模式,以便建立方案。另外,您可以在方案步驟中套用規則運算式或 Cloud Dataprep 模式,在資料集裡搜尋所需模式及轉換相符的資料。

標準化

依據拼字或無關語言的發音的相似性將資料值分組,藉此建立含有一致資料值的標準化叢集。

動態剖析

透過互動式圖表呈現資料分布情況,方便您查看及探索資料,進而輕鬆發掘、清理及轉換資料。Cloud Dataprep 創新的剖析技術會將關鍵統計資訊視覺化,並以動態、易於理解的方式呈現,協助您解讀大量資料。

取樣

為提高效能,Cloud Dataprep 會自動產生一或多個可在用戶端應用程式中顯示及操控的資料樣本。不過,您可以輕鬆變更樣本大小和範圍,以及建立樣本時使用的方法。

排程

您可以在流程中定期或視需求執行方案。已排定的工作執行完畢之後,您就能在指定的輸出位置收集已疊加的輸出內容,該輸出內容會以您指定的發布形式呈現。

快速指定目標

您可以使用已匯入或已建立的資料集設定目標結構定義,然後指派給現有的方案,藉此建立更有系統且快速的疊加作業。目標會顯示在轉換工具頁面中,您可以針對要疊加的整個資料集或當中的特定資料欄套用目標。

常見的資料類型

無論資料集是否經過結構化處理,內容儲存於 CSV、JSON 或關聯式資料表,資料規模為何 (包含 MB 和 PB 規模),您都能以同樣簡便的方式加以轉換。

與 Google Cloud Platform 相互整合

您可以處理儲存在 Cloud Storage、BigQuery 或本機電腦中的資料,然後將經過修正的資料匯出至 BigQuery 或 Cloud Storage,以便進行儲存、分析、視覺化處理和機器學習作業。另外,您也能利用 Cloud Identity and Access Management 順暢管理使用者的存取權和資料的安全防護機制。

Cloud Dataprep 架構

Cloud Dataprep 架構

Cloud Dataprep 讓我們能迅速探索新的資料集,其使用彈性則滿足了我們的各種資料轉換需求。Merkle 的資料準備工作現在僅需幾分鐘即可完成,不必耗費數小時或數日,我們的資料準備作業速度因此加快了 90%。

Merkle IT 架構師 Henry Culver

我們的客戶

資源

定價

Cloud Dataprep 是一個互動式網頁應用程式,使用者可以與自己的資料樣本互動來定義資料準備規則。如果要對完整的資料集執行相關流程,可以在 Google Cloud Dataflow 中將該項流程當做 Cloud Dataprep 工作來執行。如要瞭解詳情及查看完整資訊,請參閱定價指南

後續行動

運用 $300 美元的免費抵免額和 20 項以上的一律免費產品,開始在 Google Cloud 中建構內容。

需要入門協助嗎?
與值得信賴的夥伴合作
繼續瀏覽