Cloud Dataprep by Trifacta

這是一套智慧型資料服務,能讓您透過圖形介面來瀏覽、清理及準備相關資料,便進行分析與機器學習作業。

查看這項產品的說明文件

智慧型資料準備服務

智慧型資料準備服務

Cloud Dataprep by Trifacta 是一套智慧型資料服務,能讓您透過圖形介面來瀏覽、清理及準備相關資料 (包括結構化資料與非結構化資料),以便進行分析、產生報表並執行機器學習作業。Cloud Dataprep 採用無伺服器技術,而且可以處理任何規模的資料,因此您無須部署或管理任何基礎架構。只要操作使用者介面,Cloud Dataprep 就會建議和預測接下來最合適的資料轉換作業,為您省去編寫程式碼的麻煩。

採用無伺服器架構的簡易設計

Cloud Dataprep 是由 Trifacta 負責營運的整合式合作夥伴服務,其設計原型為 Trifacta 領先業界的資料準備解決方案「Trifacta Wrangler」。Google 與 Trifacta 密切合作,攜手提供流暢的使用者體驗,使用者無須預先安裝軟體、另外支付授權費用,也不用持續負擔營運成本。Cloud Dataprep 是一項可以視情況進行擴充的全代管服務,能協助您滿足日漸增加的資料準備需求,讓您持續專注於資料分析工作。

快速探索與偵測異常情況

資料分布情形一目了然,幫助您迅速看懂與探索資料。Cloud Dataprep 會自動偵測結構定義、資料類型、可能的彙整及異常 (例如缺少的值、離群值和重複值),讓您略過耗時的數據剖析工作,直接進行探索和分析。

簡單而強大的資料準備功能

每當您在 UI 中執行操作項目時,Cloud Dataprep 都會自動建議及預測最合適的下一項資料轉換作業。轉換順序定義完畢之後,Cloud Dataprep 會在背景中使用 Cloud Dataflow。您只要輕鬆按幾下滑鼠,就能處理各種規模的結構化或非結構化資料集,完全不需要編寫程式碼。

功能

可預測的轉換

Cloud Dataprep 會透過專屬的推論演算法解讀使用者資料選取項目的資料轉換意圖,然後自動產生一組經過排序的建議和模式,供選取項目比對。

豐富轉換

運用數百種轉換功能將資料轉換為所需的資產。只需要按一下滑鼠,即可套用匯總、透視、解除透視、彙整、聯集、擷取、計算、比較、條件、合併、規則運算式等。

參數化

您可以將變數參數化來取代檔案路徑中每次經過重新整理都會變更的部分,以便在相同資料集的多個執行個體中執行方案。您可以在工作執行階段中視需求修改這類變數。

協同合作

在團隊合作的環境中,如果能讓多位使用者同時處理同一項資產,或是為優質成品建立副本來當做可供他人參考的範本,可收事半功倍之效。Cloud Dataprep 可讓使用者即時協同處理相同的流程物件,或是建立副本供他人用於執行獨立工作。

模式比對

您可以運用資料欄模式比對功能來識別所需的資料模式,並在介面中顯示這類模式,以便建立方案。另外,您可以在方案步驟中套用規則運算式或 Cloud Dataprep 模式,在資料集中搜尋所需模式及轉換相符的資料。

標準化

根據拼字或無關語言的發音的相似性將值分群,以此建立具有一致值的標準化叢集。

動態剖析

透過互動式與視覺化的方式呈現資料分布,方便您查看與探索資料,進而輕鬆進行資料的發掘、清理及轉換。Cloud Dataprep 創新的剖析技術會將關鍵的統計資訊視覺化,並以動態、容易理解的方式呈現,助您解讀大量資料。

取樣

為提高效能,Cloud Dataprep 會自動產生一或多個可在用戶端應用程式中顯示及操控的資料樣本。不過,您可以輕鬆變更樣本大小和範圍,以及建立樣本時使用的方法。

排程

您可以在流程中定期或視需要執行方案。排定的工作成功執行後,您就可以在指定的輸出位置收集已疊加的輸出內容。該輸出內容會以您指定的發布形式呈現。

快速指定目標

您可以透過已匯入或已建立的資料集設定目標結構定義,然後將其指派給現有的方案,建立更有系統且更快速的疊加作業。目標會顯示在轉換頁面中,您可以針對要疊加的資料集全體或當中的特定資料欄套用目標。

常見的資料類型

從 MB 到 TB 規模的結構化或非結構化資料集,無論是儲存為 CSV、JSON 或關聯式資料表等格式,都能以同樣輕鬆、簡單的方式進行轉換。

與 Google Cloud Platform 整合

您可以處理儲存在 Cloud Storage、BigQuery 或本機電腦中的資料,然後將經過修正的資料匯出至 BigQuery 或 Cloud Storage,以便進行儲存、分析、視覺化處理和機器學習作業。另外,您也能利用 Cloud Identity and Access Management 順暢管理使用者的存取權限和資料的安全防護機制。

Cloud Dataprep 架構

Cloud Dataprep 架構

Cloud Dataprep 讓我們能迅速探索新的資料集,且使用上的彈性能滿足我們的各種資料轉換需求。Merkle 的資料準備工作現在只要幾分鐘即可完成,不必耗費數小時或數天的時間,我們的資料準備作業速度因此加快了 90%。

Merkle IT 架構師 Henry Culver

我們的客戶

資源

定價

Cloud Dataprep 是一個互動式網頁應用程式,使用者可以與自己的資料樣本互動,藉此定義資料準備規則。使用這個應用程式探索資料樣本、定義轉換步驟及匯出已轉換的樣本不會產生任何費用。如要在完整的資料集上執行相關流程,可在 Google Cloud Dataflow 中將該流程當做 Cloud Dataprep 工作來執行。如要瞭解詳情及查看完整資訊,請參閱我們的定價指南

後續行動

領取價值 $300 美元的免費抵免額 (效期長達 12 個月),親自體驗 Google Cloud 並透過這項服務建構內容。

免費試用
需要入門協助嗎?
與值得信賴的夥伴攜手合作
繼續瀏覽