Cloud Dataprep by Trifacta

這是一項智慧型雲端資料服務,提供一目了然的探索、清除和準備功能,讓資料分析與機器學習作業更輕鬆。

智慧型資料準備服務

智慧型資料準備服務

Cloud Dataprep by Trifacta 是智慧型資料服務,針對結構化與非結構化資料提供一目了然的探索、清除及準備功能,讓資料分析、報告和機器學習作業更輕鬆。Cloud Dataprep 採用無伺服器技術,而且可以處理任何規模的資料,因此您無須部署或管理任何基礎架構。Cloud Dataprep 會在 UI 中的每個輸入位置為您提供建議,並會預測後續的最佳資料轉換作業,因此您完全不需要編寫程式碼。有了自動結構定義、資料類型、可能的彙整作業和異常情況偵測,您就能略過曠日廢時的資料剖析步驟,將心力集中於分析資料。

無伺服器的簡便設計

無伺服器的簡便設計

Cloud Dataprep 是由 Trifacta 負責營運的整合式合作夥伴服務,其設計主要是根據 Trifacta 旗下領先業界的資料準備解決方案 Trifacta Wrangler。Google 與 Trifacta 密切合作以提供流暢的使用者體驗,包括不要求使用者預先安裝軟體、無需另外支付授權費用,也不用持續負擔營運成本。Cloud Dataprep 是一項全代管服務,可依照需求擴充,有助您應付日益增加的資料準備需求,並持續專注於分析工作。

快速探索與偵測異常情況

快速探索與偵測異常情況

資料分佈情形一目了然,幫助您迅速看懂與探索資料。Cloud Dataprep 會自動偵測結構定義、資料類型、可能的聯結及異常 (例如缺少的值、離群值和重複值),讓您略過耗時的數據剖析工作,直接進行探索和分析。

簡單而強大的資料準備功能

簡單而強大的資料準備功能

您在 UI 中每進行一項操作,Cloud Dataprep 就會自動建議和預測接下來最合適的資料轉換操作。在您完成轉換順序定義後,Cloud Dataprep 會在背景使用 Cloud Dataflow,您只要輕鬆點幾下滑鼠,就能處理各種規模的結構化或非結構化資料集,完全不需要編寫程式碼。

Cloud Dataprep 客戶

Cloud Dataprep 能讓我們迅速探索新資料集,它的靈活彈性可滿足各種資料轉換需求。Merkle 的資料準備工作現在只要幾分鐘即可完成,無須耗費數小時或數天的時間,資料準備速度加快了 90%。

Merkle IT 架構師 Henry Culver

Cloud Dataprep 架構

Cloud Dataprep 架構

Cloud Dataprep 的特色

可預測的轉換

Cloud Dataprep 透過專屬的推斷演算法來解譯使用者資料選取項目的資料轉換目的,然後自動產生一組經過排序的建議和模式,供選取項目比對。

參數化

您可以將變數參數化來取代檔案路徑中每次重新整理都會變更的部分,以便在相同資料集的多個執行個體中執行方案。您可以在工作執行階段視需要修改這個變數。

協同合作

在團隊合作環境中若能讓多位使用者處理同個資產,或是建立優良作品的副本做為範本供他人使用,將會帶來許多助益。Cloud Dataprep 可讓使用者即時協同處理相同的流程物件,或是建立副本供他人用於執行獨立工作。

模式比對

利用欄位式模式比對來識別您要的資料模式,並呈現在介面中以供建構方案使用。此外,在您的方案步驟中,您可以套用規則運算式或 Cloud Dataprep 模式在資料集中尋找模式並轉換相符的資料。

視覺化剖析

透過互動式視覺化的方式呈現資料分佈,供您查看與探索資料,協助您探索、清除及轉換資料。視覺化呈現有助於解譯大量資料,而 Cloud Dataprep 創新的剖析技術會將關鍵的統計資訊視覺化,並以動態、容易操作的方式來呈現。

取樣

為了達到效能最佳化的目的,Cloud Dataprep 會自動產生一或多個可以在用戶端應用程式中顯示和操作的資料樣本。不過,您可以輕鬆變更樣本大小、樣本範圍,以及建立樣本所使用的方法。

排程

您可以在流程中安排定期執行方案,也可以視需要安排。排定的工作成功執行後,您就可以在指定的輸出位置收集疊加輸出內容,並以您指定的發布形式呈現。

目標比對

您可以透過已匯入或已建立的資料集來定義目標結構定義,然後將其指派給現有的方案,讓疊加作業變得更加有系統,同時也能加快作業速度。目標會顯示在轉換頁面中,您可以對整個資料集或針對要疊加的資料集選定資料欄來套用目標。

常見的資料類型

您可以轉換結構化或非結構化資料集、儲存為 CSV、JSON 或關聯式資料表等格式的資料,從 MB 到 TB 等各種規模的資料量,都能以輕鬆、簡單的方式處理。

與 Google Cloud Platform 整合

可處理儲存於 Cloud Storage、BigQuery 或您電腦中的資料,然後將修正後的資料匯出到 BigQuery 或 Cloud Storage,以便進行儲存、分析、視覺化和機器學習。利用 Cloud Identity and Access Management 全面管理使用者的存取權和資料安全機制。

Cloud Dataprep 定價

Cloud Dataprep 是一種互動式網路應用程式,可讓使用者與自己的資料樣本進行互動,藉此定義資料準備規則。使用此應用程式進行樣本資料探索、定義轉換步驟和匯出已轉換的樣本並不會產生任何費用。如要在完整的資料集上執行相關流程,可在 Google Cloud Dataflow 中將該流程當做 Cloud Dataprep 作業來執行。如要瞭解詳情及查看完整資訊,請參閱我們的定價指南

資源

網誌圖示

輕鬆取得深入分析:數據分析和 Cloud Dataprep 現在已全面開放使用

影片圖示

Google Cloud OnAir:透過 Cloud Dataprep 疊加資料

快速入門圖示

透過 Cloud Dataprep 快速入門輕鬆掌握入門要領

Qwiklab 圖示

使用 Cloud Dataprep

Qwiklab 圖示

如何將 IoT Core 資料串流傳輸至 Cloud Dataprep

版本資訊圖示

Cloud Dataprep 產品公告及更新資訊

使用者圖示

和其他 Cloud Dataprep 使用者交流互動

頁面圖示

建構行銷資料倉儲

Google Cloud

開始使用

瞭解詳情並著手實作

第一次使用 GCP 嗎?我們提供您 $300 美元的額度,歡迎免費體驗 GCP 產品。

需要進一步的協助嗎?

我們的專家會協助您建立合適的解決方案,或是為您找到符合需求的合作夥伴。

傳送您對下列選項的寶貴意見...

這個網頁
Cloud Dataprep by Trifacta