工作流程基本資訊

資料分析師、資料專家以及其他領域的專家,均可使用 Cloud Dataprep by TRIFACTA® 迅速清理和轉換各種規模的資料集,以便在整個企業中使用。您可以用這組創新的網頁工具匯入複雜的資料集,並加以疊加處理,幾乎在任何目標系統都能使用。主要功能如下所示:

  • 從一般檔案、資料庫或是分散式儲存系統匯入資料

  • 可找出遺漏或不相符的資料,並將之移除或修改
  • 拆分複雜的巢狀資料結構
  • 辨識資料中的統計離群值,以便檢查和管理資料
  • 於某個資料集執行查詢至其他參考資料集
  • 使用各種匯總函式來匯總欄位式資料
  • 正規化資料欄的值,讓用法和統計模式更具一致性
  • 使用彙整合併資料集
  • 透過聯集操作,將資料集附加到其他資料集上

只需要按幾下滑鼠,就可執行上述大部分的操作。本節會概略說明 Cloud Dataprep by TRIFACTA 一般工作流程的基本資訊。

必備條件

在開始之前,請驗證以下內容:

  1. Cloud Dataprep 帳戶:擁有 Cloud Dataprep 帳戶且可以登入。

  2. 範例資料:您應該在此工作流程期間使用一組範例資料。

基本工作流程

  1. 檢視物件總覽:在開始操作之前,請先檢視 Cloud Dataprep by TRIFACTA 建立和維護的物件總覽。請參閱物件總覽一文。
  2. 匯入資料:整合各種不同的資料來源的資料。請參閱匯入基本資訊一文。
  3. 剖析資料:在資料轉換之前、轉換期間和轉換之後,都可以使用視覺化剖析工具,迅速分析資料並下達決策。請參閱剖析基本資訊一文。
  4. 建構轉換步驟:可使用轉換頁面中的各種視圖來建構轉換步驟,並預覽採樣資料的結果。請參閱轉換基本資訊一文。
  5. 行工作:啟動工作,在完整的資料集上執行您的方案,並可視需要檢視結果和進行迭代。請參閱執行工作基本資訊一文。

  6. 匯出結果:匯出產生的結果資料,以便用於 Cloud Dataprep by TRIFACTA 以外的系統。請參閱匯出基本資訊一文。
本頁內容對您是否有任何幫助?請提供意見:

傳送您對下列選項的寶貴意見...

這個網頁
Google Cloud Dataprep 說明文件
需要協助嗎?請前往我們的支援網頁