轉換指令參考資料

本節針對 Cloud Dataprep by TRIFACTA® 中可使用的轉換指令提供相關參考資訊。

提示:在 [Search] (搜尋) 面板中使用 [Title] (標題) 資料欄中的值做為搜尋字串,即可指定轉換指令。

名稱標題說明
changetype

變更資料欄類型

變更資料欄的資料類型 [settype]。
comment

新增評論

在方案中新增評論 [comment]。請參閱新增評論到您的方案
conditions

條件式資料欄

根據 if-then-else 或 case 陳述式等條件傳回值。請參閱套用條件轉換
convertpattern

轉換模式

尋找一或多個模式/文字常值,然後替換為指定的模式值。
countmatches

計算相符項目

計算相符項目的數量 [countpattern]。請參閱運算計數
countmatchesbetween

計算分隔符號之間的相符項目

計算相符項目的數量 [countpattern]。請參閱運算計數
deduplicate

移除重複的資料列

移除每一欄的值皆相同的重複資料列。請參閱簡化資料
derive

新公式

根據公式的結果建立新資料欄。
drop

刪除資料欄

刪除一或多個資料欄。請參閱移除資料
extractbetweendelimiters

擷取分隔符號之間的文字

擷取在兩個模式之間找到的文字。請參閱擷取值
extractcustom

擷取文字或模式

擷取在兩個模式之間找到的文字。子類:自訂文字或模式。請參閱擷取值
extractfirstcharacters

擷取前 n 個字元

根據位置擷取文字。子類:擷取前 n 個字元。請參閱擷取值
extractkv

將鍵/值組合轉換為物件

將鍵/值組合擷取到物件 [extractkv]。請參閱擷取值
extractlastcharacters

擷取最後 n 個字元

將鍵/值組合擷取到物件 [extractkv]。子類:擷取最後 n 個字元。請參閱擷取值
extractlist

將清單轉換成陣列

將清單擷取到陣列 [extractlist]。請參閱擷取值
extractrangeofcharacters

擷取指定位置之間的字元

根據位置擷取文字。子類:擷取最後 n 個字元。請參閱擷取值
extractmismatched

擷取不相符的值

將清單擷取到陣列 [extractlist]。子類:要比對的資料類型。請參閱擷取值
extractnumbers

從文字中擷取數字

將清單擷取到陣列 [extractlist]。子類:從文字中擷取數字。請參閱擷取值
extractquerystrings

擷取 HTTP 查詢字串

將清單擷取到陣列 [extractlist]。子類:從網址查詢字串擷取欄位。請參閱擷取值
filtercontains

篩選值中包含特定內容的資料列

篩選符合特定條件的資料列。子類:篩選包含特定值或模式的資料列。請參閱篩選資料
filtercustom

篩選使用自訂公式的資料列

篩選符合特定條件的資料列。子類:篩選符合任意公式的資料列。請參閱篩選資料
filterendswith

篩選值的尾端為特定內容的資料列

篩選符合特定條件的資料列。子類:篩選以特定值或模式結尾的資料列。請參閱篩選資料
filterexactly

篩選值完全符合特定內容的資料列

篩選符合特定條件的資料列。子類:篩選完全符合特定值的資料列。請參閱篩選資料
filternot

篩選值並非特定內容的資料列

篩選不符合特定條件的資料列。請參閱篩選資料
filterfromtop

從頂端開始篩選資料列

根據位置篩選資料列。子類:從頂端開始篩選資料列。請參閱篩選資料
filtergreaterthan

篩選值大於特定值的資料列

篩選符合特定條件的資料列。子類:篩選值大於 (或等於) 特定值的資料列。請參閱篩選資料
filterinterval

依照固定間隔篩選資料列

根據位置篩選資料列。子類:。子類:用於篩選資料列的間隔大小。請參閱篩選資料
filterlessthan

篩選值小於特定值的資料列

篩選符合特定條件的資料列。子類:篩選值小於 (或等於) 特定值的資料列。請參閱篩選資料
filtermissing

篩選缺少值的資料列

篩選符合特定條件的資料列。子類:篩選缺少值的資料列。請參閱移除資料
filtermismatched

篩選含有不相符值的資料列

篩選符合特定條件的資料列。子類:篩選含有不相符值的資料列。請參閱篩選資料
filteroneof

篩選含有任一指定內容的資料列

篩選符合特定條件的資料列。子類:篩選含有任一指定值的資料列。請參閱篩選資料
filterrange

篩選在範圍內的資料列

根據位置篩選資料列。子類:篩選在範圍內的資料列。請參閱篩選資料
filterstartswith

篩選值的開頭為特定內容的資料列

篩選符合特定條件的資料列。子類:篩選以特定值或模式開頭的資料列。請參閱篩選資料
flatten

將陣列展開為資料列

將陣列中的每個元素皆轉換為新的資料列。請參閱使用陣列
groupby

分組依據

根據此指令將資料分組及執行匯總計算。請參閱建立匯總
join

彙整資料集

從其他資料來源加入額外資料欄 [join]。請參閱彙整面板一文。
lowercase

將文字轉換為小寫格式

為資料欄中的文字設定格式。將資料欄中的文字轉換為小寫格式。請參閱修改字串值
leftpad

用前置字元填充文字

為資料欄中的文字設定格式。子類:為每個值添加必要的字元數,以便讓所有值的長度一致。請參閱修改字串值
merge

合併資料欄

將兩個以上資料欄的值串連成新的資料欄 [merge]。請參閱新增兩個資料欄
move

移動資料欄

將一或多個資料欄移動到另一個資料欄之前或之後 [move]。
nest

將資料欄以巢狀結構轉換為物件

將資料欄轉換為物件或陣列 [nest]。請參閱使用陣列
pivot

資料透視表

為資料欄中的每個不重複值建立新的資料欄 [pivot]。請參閱透視資料一文。
prefix

為文字加上前置字串

為資料欄中的文字設定格式。子類:指定要在每個所選資料欄名稱開頭加上的前置字串。請參閱修改字串值
propercase

將文字轉換為適當大小寫格式

為資料欄中的文字設定格式。將資料欄中的文字轉換為適當大小寫格式。請參閱修改字串值
removesymbols

從文字中移除符號

為資料欄中的文字設定格式。子類:從文字中移除所有非英數字元。請參閱移除資料
removewhitespace

從文字中移除空格字元

為資料欄中的文字設定格式。子類:從文字中移除所有空格字元。請參閱移除資料
removeaccents

從文字中移除重音

從文字中移除重音符號。請參閱修改字串值
rename

重新命名資料欄

為一或多個資料欄重新命名 [rename]。子類:為每個資料欄指定新名稱。請參閱重新命名資料欄
renamepattern

根據模式重新命名資料欄

為一或多個資料欄重新命名 [rename]。子類:為每個資料欄指定新名稱。請參閱重新命名資料欄
renameprefix

使用前置字元重新命名資料欄

為一或多個資料欄重新命名 [rename]。子類:為每個資料欄指定新名稱。請參閱重新命名資料欄
renameheader

使用資料列重新命名資料欄

為一或多個資料欄重新命名 [rename]。子類:為每個資料欄指定新名稱。請參閱重新命名資料欄
renamesuffix

使用後置字元重新命名資料欄

為一或多個資料欄重新命名 [rename]。子類:為每個資料欄指定新名稱。請參閱重新命名資料欄
replacepattern

取代文字或模式

取代符合特定模式的文字。請參閱取代值
replacebetweenpatterns

取代分隔符號之間的內容

取代分隔符號之間的文字子類:取代分隔符號之間的文字請參閱取代值
replacebetweenpositions

在不同位置之間取代

取代分隔符號之間的文字子類:根據位置取代文字。請參閱取代值
replacemismatched

取代不相符的值

取代不相符的值。請參閱取代值
replacemissing

取代遺漏值

取代遺漏值。請參閱取代值
set

使用公式編輯資料欄

將一或多個資料欄的值設為公式的結果 [set]。
sort

依照資料欄排序

根據一或多個資料欄中的值為資料列排序。請參閱排序順序

注意:這個轉換指令並未於 Cloud Dataprep by TRIFACTA 提供使用。

splitondelimiter

根據單一分隔符號分割資料欄

根據分隔符號分割資料欄。子類:文字或模式。請參閱分割資料欄
splitbetweendelimiters

分割分隔符號之間的資料欄

根據分隔符號分割資料欄。子類:在分隔符號之間。請參閱分割資料欄
splitmultipledelimiters

根據多個分隔符號分割資料欄

根據分隔符號分割資料欄。子類:根據多個分隔符號。請參閱分割資料欄
splitpositions

根據位置分割資料欄

根據字元位置分割資料欄。子類:根據位置。請參閱分割資料欄
splitevery

按固定間隔分割資料欄

根據字元位置分割資料欄。子類:按固定間隔。請參閱分割資料欄
splitbetweenpositions

分割指定位置之間的資料欄

根據字元位置分割資料欄。子類:在指定位置之間。請參閱分割資料欄
splitrows

將原始資料分割為資料列

將原始資料分割為資料列 [splitrows]。請參閱分割資料欄
suffix

為文字加上後置字串

為資料欄中的文字設定格式。子類:指定要在每個所選資料欄名稱尾端加上的後置字串。請參閱修改字串值
trimwhitespace

修剪空格字元

為資料欄中的文字設定格式。子類:移除文字開頭及尾端的所有空格字元。請參閱修改字串值
trimquotes

修剪引號

為資料欄中的文字設定格式。子類:移除文字開頭及尾端的所有引號。請參閱修改字串值
udf

叫用外部函式

使用外部函式產生的結果建立新資料欄。

注意:這個轉換指令僅於 Cloud Dataprep by TRIFACTA 提供使用,且需要進行額外設定。

uppercase

將文字轉換為大寫格式

為資料欄中的文字設定格式。子類:將資料欄中的文字轉換為大寫格式。請參閱修改字串值
dateformat

變更日期格式

變更「日期時間」資料欄的格式。請參閱設定日期格式
union

聯集資料集

從其他資料來源加入額外資料列 [union]。請參閱聯集頁面
standardize

標準化資料欄

用於標準化資料欄值的單一資料欄標準化。請參閱標準化頁面
unnest

拆分巢狀物件元素

將物件或陣列中的元素擷取至資料欄。請參閱使用陣列
unpivot

解除透視資料欄

將資料欄轉換為資料列。使用已拆分的巢狀資料產生索引鍵資料欄。請參閱透視資料一文。
valuestocols

將值轉換至資料欄

為資料欄中的每個不重複值建立新的資料欄 [valuestocols]。請參閱透視資料一文。
window

窗型

針對多個已排序的資料列,根據資料列執行計算 [window]。