Wrangler 指令列指示

本頁面說明您可以在 Wrangler 中使用的指令。

在 Wrangler Power 模式 (Wrangler CLI) 中,您可以將指令和函式新增至食譜。詳情請參閱「Wrangler CLI 指示語」和「Wrangler 函式」。

Wrangler 支援下列指令:

資料欄作業

指令 說明
變更欄大小寫 將資料欄名稱變更為小寫或大寫。
更換充電盒 變更資料欄值的大小寫。
清除資料欄名稱 根據特定規則清除資料欄名稱。
Replace 大量變更資料欄名稱。
複製 將來源資料欄的值複製到目標資料欄。
放置資料欄 刪除記錄中的資料欄。
填入空值或空白 如果值為空值或空白,請輸入固定欄值。
Keep 保留記錄中的指定欄。
Merge 插入第三個資料欄,合併兩個資料欄。
重新命名 重新命名記錄中現有的資料欄。
設定標頭 依照指定順序,設定資料欄名稱。
分割為欄 根據分隔符號將資料欄分割為多個資料欄。
交換 交換兩個資料欄的名稱。
設定類型 轉換資料欄的資料類型。

日期轉換

指令 說明
差異日期 計算兩個日期之間的差距。
格式化日期 日期時間格式的自訂模式。
格式化 UNIX 時間戳記 將 UNIX 時間戳記格式化為日期。

日期時間轉換

指令 說明
目前日期時間 使用指定時區產生目前的日期時間。
日期時間到時間戳記 根據日期時間和指定時區建立時間戳記。
格式化日期時間 將日期時間格式化為指定格式的字串。
將時間戳記轉換為日期時間 將時間戳記轉換為標準日期時間格式。

編碼器和解碼器

指令 說明
解碼 將資料欄值解碼為 base32base64hex. 其中之一
編碼 將資料欄值編碼為 base32base64hex. 其中之一

雜湊處理和遮蓋

指令 說明
雜湊 產生訊息摘要。
遮罩編號 對資料欄值套用替換遮罩。
遮罩隨機播放 對資料欄值套用亂數遮蓋。

查詢

指令 說明
目錄查詢 對 ICD-9、ICD-10-2016 和 ICD-10-2017 代碼進行靜態目錄查詢。
資料表查詢 對資料表資料集執行查詢。

自然語言處理

指令 說明
將詞彙轉換為符號 將 Porter 詞幹化演算法套用至英文單字。

輸出格式設定工具

指令 說明
以 CSV 格式寫入 將記錄轉換為 CSV 格式。
以 JSON 對應方式寫入 將記錄轉換為 JSON 對應項目。
撰寫 JSON 物件 根據指定的欄位組合 JSON 物件。
採用貨幣格式 根據語言代碼指定的格式,將數字格式化為貨幣。

剖析器

指令 說明
JSON 路徑 使用 DSL (JSON 路徑運算式) 剖析 JSON 記錄。
剖析為 AVRO 檔案 剖析 AVRO 資料檔案。
以 CSV 格式剖析 將輸入記錄解析為以半形逗號分隔的值
剖析為貨幣 將貨幣值解析為數字,該值是當地貨幣的字串表示法。
剖析為日期時間 使用指定格式,將字串解析為日期時間資料類型。
以 Excel 格式剖析 剖析成 Microsoft Excel 檔案。
剖析為固定長度 以指定寬度的固定長度記錄進行剖析。
以 HL7 格式剖析 剖析 Health Level 7 版本 2 (HL7 V2) 訊息。
剖析為 JSON 剖析 JSON 物件。
以 Log 格式剖析 剖析存取記錄檔,例如 Apache httpd 和 NGINX 伺服器。
剖析為簡單日期 剖析日期字串。
剖析為時間戳記 剖析代表 Unix 時間戳記的資料欄值,並將其視為日期。
將 XML 剖析為 JSON 將 XML 文件剖析為 JSON 結構。

資料列作業

指令 說明
篩選資料列 依據條件篩選記錄。
Filter Row if Matched 篩選符合資料欄模式的資料列。
Flatten 分隔重複欄位中的元素。
因條件而失敗 當系統評估條件為 true 時,處理作業會失敗。
傳送至錯誤 將記錄篩選到錯誤收集器。
傳送至錯誤並繼續處理 將記錄篩選為錯誤收集器,並繼續處理。
分割為資料列 根據分隔符將資料分割為多個記錄。

轉換

指令 說明
更換充電盒 將資料欄值的大小寫變更為大寫或小寫字元。
建立記錄 將值從來源資料欄複製到目的資料欄,藉此建立包含巢狀值的記錄資料欄。
剪下角色 選取字串值的部分。
設定資料欄 將資料欄值設為運算式執行結果。
尋找與取代 使用類似「sed」的運算式轉換字串欄值。
量化 將量化套用至欄值。
擷取規則運算式群組 將一組規則運算式的資料擷取到各自的資料欄。
設定字元集 設定編碼,然後將資料轉換為 UTF-8 字串。
設定記錄分隔符 設定記錄分隔符號。
電子郵件分割 將電子郵件 ID 拆分為帳戶和網域。
分割網址 將網址分割成各個組成部分。
文字距離 (模糊字串比對) 測量兩個字元序列之間的差異。
文字指標 (模糊字串比對) 測量兩個字元序列之間的差異。
網址解碼 application/x-www-form-urlencoded MIME 格式解碼。
網址編碼 application/x-www-form-urlencoded MIME 格式編碼。
修剪空格 用於修剪字串資料周圍空格的函式。

暫時匯總器和 setter

指令 說明
增加變數 使用處理記錄遞增暫時性變數。
設定變數 設定含有處理記錄的暫時變數。

專屬 ID

指令 說明
產生 UUID 產生通用唯一識別碼 (UUID)。

後續步驟