Cloud Dataprep by Trifacta

透過這項智慧型雲端資料服務中的視覺化介面,您可以輕鬆探索、清理及準備資料,以便用於資料分析和機器學習作業。

查看這項產品的說明文件

智慧型資料準備服務

智慧型資料準備服務

有了「Cloud Dataprep by Trifacta」這項智慧型資料服務,您就能透過當中的視覺化介面輕鬆探索、清理及準備結構化與非結構化資料,以便用於資料分析、報表和機器學習作業。Cloud Dataprep 採用無伺服器技術,並能處理任意規模的資料,因此您無須部署或管理任何基礎架構。Cloud Dataprep 會在 UI 中的每個輸入位置為您提供建議,並預測後續的最佳資料轉換作業,因此您完全不需要編寫程式碼。有了自動結構定義、資料類型、可能的彙整作業和異常情況偵測,您就能省去曠日廢時的資料剖析程序,專心分析資料。

採用無伺服器技術的簡便設計

Cloud Dataprep 是由 Trifacta 負責營運的整合式合作夥伴服務,其設計原型為 Trifacta 領先業界的資料準備解決方案「Trifacta Wrangler」。Google 與 Trifacta 密切合作,攜手提供流暢的使用者體驗,使用者無須預先安裝軟體、另行支付授權費用,也不必持續負擔營運成本。Cloud Dataprep 是一項可以視情況進行擴充的全代管服務,能協助您滿足日漸增加的資料準備需求,讓您持續專注於資料分析工作。

快速探索與異常情況偵測功能

這項服務會以視覺化的方式呈現資料分布情況,方便您迅速掌握及探索資料。Cloud Dataprep 會自動偵測結構定義、資料類型、可能的彙整作業和異常情況 (例如缺少的值、離群值和重複值),讓您省去曠日廢時的資料剖析工作,直接進行探索與分析。

簡單而強大的資料準備功能

每當您在 UI 中執行操作項目時,Cloud Dataprep 都會自動建議及預測最合適的下一項資料轉換作業。轉換順序定義完畢之後,Cloud Dataprep 會在背景中使用 Cloud Dataflow。您只要輕鬆按幾下滑鼠,就能處理各種規模的結構化或非結構化資料集,完全不需要編寫程式碼。

功能

可預測的轉換作業

Cloud Dataprep 會透過專屬的推論演算法解讀使用者資料選取項目的資料轉換意圖,接著自動產生一組與所選項目相符的建議與模式,並加以排序。

參數化

您可以將變數參數化來取代檔案路徑中每次經過重新整理都會變更的部分,以便在相同資料集的多個執行個體中執行方案。您可以在工作執行階段中視需求修改這類變數。

協同合作

在團隊合作的環境中,如有多位使用者同時處理同一項資產,或是為優質成品建立副本來當做可供他人參考的範本,您就能更輕鬆地執行作業。Cloud Dataprep 可讓使用者即時協同處理相同的流程物件,或是建立可供他人用於其他工作的副本。

模式比對

您可以運用資料欄模式比對功能來識別所需的資料模式,並在介面中顯示這類模式,以便建立方案。另外,您可以在方案步驟中套用規則運算式或 Cloud Dataprep 模式,在資料集中搜尋所需模式及轉換相符的資料。

視覺化剖析功能

這項服務會透過互動式圖表呈現資料分布情況,方便您查看及探索資料,進而輕鬆發掘、清理及轉換資料。Cloud Dataprep 創新的剖析技術會將關鍵統計資訊視覺化,並以動態、易於理解的方式呈現,協助您解讀大量資料。

取樣

為提高效能,Cloud Dataprep 會自動產生一或多個可在用戶端應用程式中顯示及操控的資料樣本。不過,您可以輕鬆變更樣本大小和範圍,以及建立樣本時使用的方法。

排程

您可以在流程中定期或視需求執行方案。預定工作執行完畢之後,您就能在指定的輸出位置取得疊加完成的輸出內容,而且輸出內容會以您指定的發布形式呈現。

目標比對

您可以使用已匯入或已建立的資料集設定目標結構定義,然後指派給現有的方案,藉此建立更有系統且快速的疊加作業。目標會顯示在轉換工具頁面中,您可以針對要疊加的整個資料集或當中的特定資料欄套用目標。

常見的資料類型

無論資料集是否經過結構化處理,內容儲存於 CSV、JSON 或關聯式資料表,資料規模為何 (包含 MB 和 PB 規模),您都能以同樣簡便的方式加以轉換。

與 Google Cloud Platform 相互整合

您可以處理儲存在 Cloud Storage、BigQuery 或本機電腦中的資料,然後將經過修正的資料匯出至 BigQuery 或 Cloud Storage,以便進行儲存、分析、視覺化處理和機器學習作業。另外,您也能利用 Cloud Identity and Access Management 順暢管理使用者的存取權限和資料的安全防護機制。

Cloud Dataprep 架構

Cloud Dataprep 架構

Cloud Dataprep 讓我們能迅速探索新的資料集,其使用彈性則滿足了我們的各種資料轉換需求。Merkle 的資料準備工作現在僅需幾分鐘即可完成,不必耗費數小時或數日,我們的資料準備作業速度因此加快了 90%。

Merkle IT 架構師 Henry Culver

我們的客戶

資源

定價

Cloud Dataprep 是一個互動式網頁應用程式,使用者可以與自己的資料樣本互動來定義資料準備規則。使用這個應用程式探索資料樣本、定義轉換步驟及匯出已轉換的樣本不會產生任何費用。如要在完整的資料集上執行相關流程,可在 Google Cloud Dataflow 中將該流程當做 Cloud Dataprep 作業來執行。如要瞭解詳情及查看完整資訊,請參閱我們的定價指南

Google Cloud

開始使用

瞭解詳情並著手實作

第一次使用 GCP 嗎?我們提供您 $300 美元的額度,歡迎免費體驗 GCP 產品。

需要進一步協助嗎?

我們的專家會協助您打造合適的解決方案,或是為您找到符合需求的合作夥伴。

傳送您對下列選項的寶貴意見...

這個網頁
Cloud Dataprep by Trifacta