轉換指令製作工具

轉換指令製作工具可讓您透過選單驅動的簡單介面,快速組合完整的方案步驟。選取要套用的轉換指令後,可以透過選項或預先輸入的欄位設定所有相關參數,這樣一來,系統便只會顯示所選轉換適用的元素供您選擇。

如要開啟轉換指令製作工具,請透過下列其中一種方式開始建立步驟:

  • 在「Transformer」(轉換器) 工具列中選取轉換指令。請參閱轉換器工具列一文。
  • 在資料欄選單中選取轉換指令。請參閱資料欄選單一文。
  • 在「Search」(搜尋) 面板中搜尋並選取轉換指令。請參閱搜尋面板一文。
  • 在「Recipe」(方案) 面板中點選 [New Step] (新增步驟)。請參閱方案面板一文。
  • 編輯現有步驟。

圖:轉換指令製作工具

鍵盤快速鍵:

動作
TAB接受目前所選項目並移至下一個欄位。
SHIFT + TAB移至前一個欄位。

步驟 1:在「Search」(搜尋) 面板中選取轉換指令。

在「Search」(搜尋) 面板中輸入搜尋內容,以查看可用的轉換指令清單,接著選取您想要使用的指令。

joinunion 轉換指令有專用頁面,其中說明如何設定該轉換作業。您可以將 joinunion 當成轉換作業輸入,以開啟對應的工具。

如需可用轉換指令的清單,請參閱轉換指令參考資料

步驟 2:指定資料欄、公式或條件

您必須根據自己選取的轉換指令,在轉換指令製作工具中指定下列一或多個參數類型。

  • 部分轉換指令支援使用下列參數組合。
  • 部分轉換指令 (如 deduplicate) 不需要任何參數。

以下列出參數的一般類別:

  • 常值: 文字值或常數值是固定數字、字串、布林值或其他類型的值,這些值不會隨著求值計算的資料列而變更。
  • 函式。 Cloud Dataprep by TRIFACTA® 支援各種數字、統計或其他函式類型。如需可用轉換指令和函式的清單,請參閱語言索引
  • 資料欄。 在公式中使用資料欄名稱時,轉換指令會將指名資料欄中的值用在目前進行求值的列。
  • 運算子。 您可以在公式中套用邏輯、數字或比較運算子。
  • 中繼資料。您可插入特殊字串來評估資料集中繼資料的參照。詳情請參閱來源中繼資料參照

資料欄

選取或指定一或多個要套用轉換指令的資料欄。

提示:如要指定某一範圍的資料欄,請在第一個資料欄後插入波浪號 (~)。選取的第二個資料欄會定義範圍中的最後一個資料欄。部分轉換指令不支援多個資料欄或資料欄範圍。

模式

在某些轉換指令中,您可以指定模式來識別需要對資料採取動作的條件或元素。您可以使用下列一種類型來指定這些比對模式。

提示:在某一轉換步驟中使用模式或字串文字後,您就可以在另一個轉換步驟中套用該模式或字串文字。在轉換指令製作工具的模式欄位中,按一下 [瀏覽模式記錄]

模式類型說明範例
文字值確切的字串或值。

與引號內的值完全相同即符合下列條件:

'This is what I want to match.'

Cloud Dataprep 模式

Cloud Dataprep by TRIFACTA 支援各種類似巨集的模式 ID,可用來代替更複雜的規則運算式。

開頭為兩位數的值即符合下列條件:

`{start}{digit} {digit}`

規則運算式模式

規則運算式是說明比對模式的標準方法。

注意:規則運算式的語法可以很複雜,若未正確指定,可能會導致意外結果。規則運算式被視為開發人員層級所使用的技能。

0 到 99 的所有數字值即符合下列條件:

/^\d$|^\d\d$/

如要進一步瞭解以模式為基礎的比對,請參閱文字比對一文。

分隔符號群組

在轉換指令製作工具中,系統會將需要使用分隔符號的轉換指令歸類為分隔符號群組,這樣一來,您便只需指定可搭配運作的模式元素。分隔符號群組適用於下列轉換:

以下列出分隔符號群組。

分隔符號群組說明
根據分隔符號根據特定常值或模式套用轉換。
在分隔符號之間在資料庫中將轉換套用至兩個常值或模式分隔符號之間的內容。詳情請見下方說明。
根據多個分隔符號

根據一系列分隔符號套用轉換。個別模式可以是字串常值、Cloud Dataprep 模式或規則運算式,且這一連串的模式可包含這些模式類型的組合。

在位置之間根據起始索引位置和結束索引位置套用轉換。索引位置從任何儲存格資料值左側自 0 開始起算。
根據位置根據一系列索引位置套用轉換。索引位置從任何儲存格資料值左側自 0 開始起算。
按照固定間隔每「n」個位置便套用轉換。索引位置從任何儲存格資料值左側自 0 開始起算。

如要進一步瞭解分隔符號群組的基礎語法,請參閱子句位置模式比對一文。

在兩個分隔符號之間

比對兩個分隔符號之間出現的任何值。一個分隔符號代表比對開頭,另一個分隔符號則代表比對結尾。

每個分隔符號都可以包括或排除比對的值:

轉換指令製作工具選項屬於轉換的一部分包括/排除
起始分隔符號排除子模式
起始分隔符號包括子模式
結尾分隔符號排除子模式
結尾分隔符號包括子模式

條件

條件是指會產生 truefalse 值的運算式。條件可以包括公式中的所有元素。這個值會決定是否將轉換套用到要求值的資料列。

步驟 3 - 分組、排序及命名

部分轉換指令支援下列參數。分組參數:在用於匯總資料的轉換指令中 (例如 pivotwindow),您可以指定要用做計算匯總分組依據的資料欄。在下列範例中,系統會針對 Store_Nbr 資料欄中的每一個值,加總 POS_Sales 資料欄中的所有值。

轉換名稱 Pivot columns
參數:資料列標籤 Store_Nbr
參數:值 sum(POS_Sales)

假設 Store_Nbr 資料欄中的每個項目所產生的轉換步驟有 50 列,每一列均會包含所列商店編號的總銷售額。

排序參數:部分轉換指令支援 order 參數,可讓您指定要依據哪個資料欄的值為輸出結果排序。在以下範例中,系統會按合約日期為所有匯總的 Sales 值排序,並按州名分組:

轉換名稱 Pivot columns
參數:資料列標籤 Store_Nbr
參數:資料欄標籤 contractDate
參數:值 sum(Sales)

新資料欄名稱參數:在用於產生新資料欄的轉換指令中 (例如 deriveextract),您可以視需要指定新資料欄名稱,這樣即可省下重新命名該資料欄的步驟。在以下範例中,系統會加總 colAcolB 的值並將值寫入新資料欄 colC

轉換名稱 New formula
參數:公式類型 Single row formula
參數:公式 colA + colB
參數:新資料欄名稱 colC

步驟 3:指定其他參數

依據轉換指令,系統會向您顯示其他可以指定的必要或選用參數。請參閱轉換一文。

步驟 4:新增步驟

完成轉換步驟後,請在資料網格中查看預覽。

如果可以接受該結果,請按一下 [Add] (新增)

該步驟即會新增至方案並套用於資料網格。

編輯轉換

新增步驟之後,您可以視需要修改步驟。在方案面板中,選取方案步驟旁的鉛筆圖示,步驟即會顯示在轉換指令製作工具中供您編輯。

本頁內容對您是否有任何幫助?請提供意見:

傳送您對下列選項的寶貴意見...

這個網頁
Google Cloud Dataprep 說明文件
需要協助嗎?請前往我們的支援網頁