工作詳細資料頁面

在 Cloud Dataprep by TRIFACTA® 中,您可以使用工作詳細資料頁面來查看成功或失敗工作的詳細資料,包括輸出、依附元件和其他中繼資料。將結果下載至您的本機電腦上,或是探索結果中資料的視覺化剖析 (如啟用),以對您的方案執行進一步的疊代作業。

  • [View dataflow job]:檢視在 Cloud Dataflow 上執行的工作。

  • [Export dependencies as a flow]:下載執行中的方案及所有依附元件,並將其當做一個獨立的流程。

「Overview」分頁

在「Overview」分頁中,您可以查看工作狀態、其來源和工作執行的詳細資料。

注意:如果工作失敗了,系統會顯示一則錯誤訊息,其中會指出一個與表列內容不同的工作 ID。此工作 ID 是子工作的 ID,該子工作屬於「Job summary」中所列工作的一部分。

圖:「Overview」分頁

您可以查看工作的結果快照。

  • 如要查看工作中的方案和依附元件,請點選 [Go to steps and dependencies]。請參閱下方的「Dependencies」分頁。
  • 如果您選擇剖析工作的結果,請點選 [Go to profile]。請參閱下方的「Profile」分頁。
    • 視覺化剖析可為整個資料集和資料集中的個別資料欄,提供成功轉換工作的結果圖形快照。
    • 有關啟用視覺化剖析工作的詳細資訊,請參閱執行工作頁面一文。
    • 詳情請參閱視覺化剖析總覽一文。
  • 如要檢視已執行的工作,請點選 [View dataflow job]。

您還可以查看工作產生的輸出結果。

    • 如要查看或匯出任何產生的輸出結果,請點選 [View results]。請參閱下方的「Outputs Destinations」分頁。

「Job summary」:

  • 「Job ID」:工作的專屬 ID

  • 「Job status」:工作的目前狀態:
    • Queued: 工作已放入佇列等待執行。
    • Running: 工作正在進行中。
    • Completed:工作成功執行完畢。

      注意:系統會略過方案中的無效步驟,因此工作仍有可能成功執行完畢。

    • Canceled: 使用者已取消工作。

      Failed: 工作無法完成。

      注意:您可以在轉換器頁面中重新執行失敗的工作。如果您在前次執行失敗後修改過方案,則在第二次執行時會套用修改後的變更。請參閱轉換器頁面一文。

  • 「Flow」:執行工作的流程名稱。點選連結可開啟流程。請參閱流程檢視頁面一文。
  • 「Output」:用於定義產生結果的輸出物件名稱。點選連結可開啟輸出。請參閱流程檢視頁面一文。
  • 「Dataflow template」:點選 [Browse] 可查看 Cloud Dataflow 中的工作。

    如有需要,您可以在 Cloud Dataflow 上重新執行工作。點選 [Copy to clipboard] (複製到剪貼簿)。詳情請參閱在 Cloud Dataflow 上執行工作一文。

「Execution summary」:

  • 「Job type」:執行工作的方法:
    • Manual - 工作是透過應用程式介面執行。
    • Scheduled - 工作將依據預先決定的時間表執行。請參閱新增時間表對話方塊一文。

  • 「User」:啟動工作的使用者
  • 「Environment」:顯示執行工作的作業環境 (如適用)。
  • 「Start time」:工作開始處理的時間戳記。此值可能與工作放入佇列等待執行的時間不相符。
  • 「Finish time」:工作處理完成的時間戳記,無論成功與否
  • 「Last update」:上次更新工作的時間戳記
  • 「Duration」:工作執行的經過時間

「Output Destinations」分頁

如果工作已成功完成,您將會看見產生的輸出和匯出結果。

圖:「Output Destinations」分頁

動作:

您可以對每個輸出執行以下動作:

  • 查看詳細資料:在側欄中查看產生輸出的詳細資料。
  • 在 Google Cloud Storage 上查看:在 Google Cloud Storage 中查看結果。請參閱 Google Cloud Storage 瀏覽器一文。


  • 下載結果:將產生的輸出下載到您的本機電腦。

    注意:有些格式的檔案可能無法下載到您的電腦。請參閱下方說明。

  • 建立匯入的資料集:使用產生的輸出建立新的匯入資料集,以在流程中使用。請參閱下方說明。

直接下載檔案

點選提供的連結即可透過瀏覽器將檔案下載到本機電腦上。

注意:如果這些選項無法使用,這可能表示資料下載功能已被系統管理員停用。

建立匯入的資料集

您可以選擇將產生的結果轉換成新的資料集,以在 Cloud Dataprep by TRIFACTA 中立即使用。請在產生輸出的內容選單中,選取 [Create imported dataset]

注意:當您從工作結果中建立新的資料集時,寫入指定輸出位置的一或多個檔案會被當做來源使用。其他使用者能否存取這個位置,需視您後端資料儲存庫的權限設定而定。

寫入新的輸出之後,您可以從該輸出建立新的方案。請參閱資料集的建立順序一文。

「Profile」分頁

您可以在「Profile」分頁中查看產生結果的視覺化剖析。視覺化剖析可幫助您識別資料集中需要進一步處理的問題,包括離群值。

注意:此分頁只有在您選擇在工作定義中剖析結果時才會顯示。請參閱執行工作頁面一文。

圖:「Profile」分頁

您應特別留意不相符的值和遺漏值數目,從中判別受影響的值在整個資料集中約佔的百分比。詳情請參閱視覺化剖析總覽一文。

注意:以互動式視覺化資料剖析功能為大型資料集產生確切視覺化剖析測量結果的運算代價,會嚴重影響工作績效。因此,整個資料集的視覺化剖析結果僅代表統計顯著程度近似值。

注意:Cloud Dataprep by TRIFACTA® 會將空值視為遺漏值。匯入的空值在工作結果中會被當做遺漏值產生 (以灰色長條表示)。請參閱管理空值一文。

提示:將滑鼠游標停在顏色長條上,即可查看類別中的值計數。

提示:請使用水平捲軸來查看大範圍資料集中所有資料欄的剖析。

在下半段中,您可以探索個別資料欄的轉換詳細資料。使用這個區域可以探索個別資料欄中的不相符或遺漏資料元素。

顯示的資訊會隨著資料欄的資料類型而改變。詳情請參閱資料欄統計參考資料

提示:您應按一下資料欄左側的圖示,以查看每個資料欄的類型資訊。

「Dependencies」分頁

在此分頁中,您可以查看簡化版的工作執行流程。此流程圖只會顯示造就產生結果的方案和資料集。

提示:如要開啟完整的流程,請點選左上角的流程名稱。

圖:「Dependencies」分頁

方案動作:

[Download recipe]:下載 Wrangle 方案文字。

[Display Wrangle/natural language]:以原始語言或可讀語言交替顯示方案。

「Data sources」分頁

在「Data sources」分頁中,您可以查看執行中方案的所有資料來源。

圖:「Data sources」分頁

「Parameters」分頁

如果匯入的資料集是含參數的資料集,您可以在工作執行時查看這些參數的狀態。

注意:此分頁只有在工作來源是含參數的資料集時才會顯示。詳情請參閱建立含參數的資料集一文。

含參數的資料集可讓您將輸入來源參數化為單個已匯入資料集。詳情請參閱參數化總覽一文。

圖片:「Parameters」分頁

本頁內容對您是否有任何幫助?請提供意見:

傳送您對下列選項的寶貴意見...

這個網頁
Google Cloud Dataprep 說明文件
需要協助嗎?請前往我們的支援網頁