Cloud Dataprep by Trifacta

這是一項智慧型雲端資料服務,提供一目了然的探索、清理和準備功能,讓資料分析與機器學習作業更輕鬆。

智慧型資料準備服務

智慧型資料準備服務

Cloud Dataprep by Trifacta 是智慧型資料服務,針對結構化與非結構化資料提供一目了然的探索、清理及準備功能,讓資料分析、報告和機器學習作業更輕鬆。Cloud Dataprep 採用無伺服器技術,而且可以處理任何規模的資料,因此您無須部署或管理任何基礎架構。只要在 UI 中輸入內容,Cloud Dataprep 就會建議和預測接下來最合適的資料轉換作業,為您省去編寫程式碼的麻煩。此外,系統會自動偵測結構定義、資料類型、可能的聯結和異常情況,讓您略過曠日廢時的資料剖析步驟,專注分析資料。

無伺服器的簡便設計

無伺服器的簡便設計

Cloud Dataprep 是由 Trifacta 負責營運的整合式合作夥伴服務,其設計主要是根據 Trifacta 旗下領先業界的資料準備解決方案 Trifacta Wrangler。Google 與 Trifacta 密切合作以提供流暢的使用者體驗,使用者無須預先安裝軟體、另外支付授權費用,也不用持續負擔營運成本。Cloud Dataprep 是一項全代管服務,可依照需求擴充,有助您應付日益增加的資料準備需求,並持續專注於分析工作。

快速探索與偵測異常情況

快速探索與偵測異常情況

資料分布情形一目了然,幫助您迅速看懂與探索資料。Cloud Dataprep 會自動偵測結構定義、資料類型、可能的聯結及異常 (例如缺少的值、離群值和重複值),讓您略過耗時的數據剖析工作,直接進行探索和分析。

簡單而強大的資料準備功能

簡單而強大的資料準備功能

您在 UI 中每進行一項操作,Cloud Dataprep 就會自動建議和預測接下來最合適的資料轉換操作。在您完成轉換順序定義後,Cloud Dataprep 會在背景使用 Cloud Dataflow,您只要輕鬆點幾下滑鼠,就能處理各種規模的結構化或非結構化資料集,完全不需要編寫程式碼。

Cloud Dataprep 客戶

Cloud Dataprep 能讓我們迅速探索新資料集,它的靈活彈性可滿足各種資料轉換需求。Merkle 的資料準備工作現在只要幾分鐘即可完成,無須耗費數小時或數天的時間,資料準備速度加快了 90%。

Merkle IT 架構師 Henry Culver

Cloud Dataprep 架構

Cloud Dataprep 架構

Cloud Dataprep 的特色

可預測的轉換

Cloud Dataprep 透過專屬的推斷演算法來解譯使用者資料選取項目的資料轉換目的,然後自動產生一組經過排序的建議和模式,供選取項目比對。

參數化

您可以將變數參數化來取代檔案路徑中每次重新整理都會變更的部分,以便在相同資料集的多個執行個體中執行方案。您可以在工作執行階段視需要修改這個變數。

協同合作

在團隊合作環境中若能讓多位使用者處理同個資產,或是建立優良作品的副本做為範本供他人使用,將會帶來許多助益。Cloud Dataprep 可讓使用者即時協同處理相同的流程物件,或是建立副本供他人用於執行獨立工作。

模式比對

利用欄位式模式比對來識別您要的資料模式,並呈現在介面中以供建構方案使用。此外,在您的方案步驟中,您可以套用規則運算式或 Cloud Dataprep 模式在資料集中尋找模式並轉換相符的資料。

視覺化剖析

透過互動式與視覺化的方式呈現資料分布,方便您查看與探索資料,輕鬆進行資料的發掘、清理及轉換。Cloud Dataprep 創新的剖析技術會將關鍵的統計資訊視覺化,並以動態、容易理解的方式來呈現,助您解譯大量資料。

取樣

為了達到效能最佳化的目的,Cloud Dataprep 會自動產生一或多個可以在用戶端應用程式中顯示和操作的資料樣本。不過,您可以輕鬆變更樣本大小、樣本範圍,以及建立樣本所使用的方法。

排程

您可以在流程中定期或視需要執行方案。排定的工作成功執行後,您就可以在指定的輸出位置收集統整完畢的輸出內容,該輸出內容會以您指定的發布形式呈現。

目標比對

您可以透過已匯入或已建立的資料集來設定目標結構定義,然後將其指派給現有的方案,建立更有系統且更快速的統整作業。目標會顯示在轉換頁面中,您可以對整個資料集或要統整的特定資料欄套用目標。

常見的資料類型

從 MB 到 TB 規模的結構化或非結構化資料集,無論是儲存為 CSV、JSON 或關聯式資料表等格式,都能透過輕鬆、簡單的方式進行轉換。

與 Google Cloud Platform 整合

可處理儲存於 Cloud Storage、BigQuery 或您電腦中的資料,然後將修正後的資料匯出到 BigQuery 或 Cloud Storage,以便進行儲存、分析、視覺化和機器學習。利用 Cloud Identity and Access Management 全面管理使用者的存取權和資料安全機制。

Cloud Dataprep 定價

Cloud Dataprep 是一種互動式網路應用程式,可讓使用者與自己的資料樣本進行互動,藉此定義資料準備規則。使用此應用程式進行樣本資料探索、定義轉換步驟和匯出已轉換的樣本並不會產生任何費用。如要在完整的資料集上執行相關流程,可在 Google Cloud Dataflow 中將該流程當做 Cloud Dataprep 作業來執行。如要瞭解詳情及查看完整資訊,請參閱我們的定價指南

資源

Google Cloud

開始使用

瞭解詳情並著手實作

第一次使用 GCP 嗎?我們提供您 $300 美元的額度,歡迎免費體驗 GCP 產品。

需要進一步的協助嗎?

我們的專家會協助您建立合適的解決方案,或是為您找到符合需求的合作夥伴。

傳送您對下列選項的寶貴意見...

這個網頁
Cloud Dataprep by Trifacta