Wrangler コマンドラインのディレクティブ

このページでは、Wrangler で使用できるディレクティブについて説明します。

Wrangler の Power モード(Wrangler CLI)では、ディレクティブと関数をレシピに追加できます。詳細については、Wrangler CLI ディレクティブWrangler 関数をご覧ください。

Wrangler は、次のディレクティブをサポートしています。

列の操作

ディレクティブ 説明
列の大文字と小文字を変更する 列名を小文字または大文字に変換します。
ケースの変更 列の値の大文字と小文字を変更します。
列名をクレンジングする 特定のルールに従って列名をサニタイズします。
列の置換 列名を一括で変更します。
コピー ソース列から宛先列に値をコピーします。
列を破棄する レコード内の列を破棄します。
null を入力するまたは空にする 値が null または空の場合は、列の固定値を入力します。
Keep レコードの指定した列を保持します。
統合 3 つ目の列を挿入して 2 つの列を結合します。
名前を変更 レコード内の既存の列の名前を変更します。
ヘッダーを設定する 指定された順序で列の名前を設定します。
列に分割する 区切り文字に基づいて列を複数の列に分割します。
スワップ 2 つの列の列名を入れ替えます。
セットタイプ 列のデータ型を変更します。

日付変換

ディレクティブ 説明
日付の差分を計算する 2 つの日付の差を計算します。
日付をフォーマットする 日時形式のカスタム パターン。
UNIX タイムスタンプをフォーマットする UNIX タイムスタンプを日付として書式設定します。

日時の変換

ディレクティブ 説明
現在の日時 指定されたタイムゾーンで現在の日時を生成します。
日次からタイムスタンプ 日時と指定されたタイムゾーンからタイムスタンプを作成します。
日時をフォーマットする 日時を指定された形式の文字列にフォーマットします。
タイムスタンプから日時 タイムスタンプを日時に変換します。

エンコーダとデコーダ

ディレクティブ 説明
Decode 列値を base32base64hex. のいずれかとしてデコードします。
Encode 列の値を base32base64hex. のいずれかにエンコードします。

ハッシュ化とマスキング

ディレクティブ 説明
ハッシュ メッセージのダイジェストを生成します。
マスク番号 列値に置換マスクを適用します。
マスク シャッフル 列の値にシャッフル マスキングを適用します。

ルックアップ

ディレクティブ 説明
カタログ検索 ICD-9、ICD-10-2016、ICD-10-2017 コードの静的カタログ検索。
テーブル ルックアップ テーブル データセットのルックアップを実行します。

自然言語処理

ディレクティブ 説明
トークン化された単語のステミング 英語の単語に Porter ステミング アルゴリズムを適用します。

出力フォーマッタ

ディレクティブ 説明
CSV として書き込む レコードを CSV 形式に変換します。
JSON マップとして書き込む レコードを JSON マップに変換します。
JSON オブジェクトを書き込む 指定されたフィールドに基づいて JSON オブジェクトを作成します。
表示形式を通貨に設定 数値をロケールで指定された通貨として書式設定します。

パーサー

ディレクティブ 説明
JSON パス JSON レコードの解析に DSL(JSON Path 式)を使用します。
AVRO ファイルとして解析 AVRO データファイルを解析します。
CSV として解析 入力レコードをカンマ区切り値として解析します。
通貨として解析 現地通貨の文字列表現である通貨値を数値に解析します。
日時として解析する 指定された形式の日時データ型として文字列を解析します。
Excel として解析する Microsoft Excel ファイルに解析します。
固定長として解析する 指定された幅の固定長レコードとして解析します。
HL7 として解析する Health Level 7 バージョン 2(HL7 V2)メッセージを解析します。
JSON として解析する JSON オブジェクトを解析します。
ログとして解析する Apache httpd や NGINX サーバーなどのアクセスログ ファイルを解析します。
単純な日付として解析する 日付文字列を解析します。
タイムスタンプとして解析する UNIX タイムスタンプを日付として表す列値を解析します。
XML を JSON に解析する XML ドキュメントをパースして JSON 構造に変換します。

行の操作

ディレクティブ 説明
行をフィルタ処理する 条件に基づいてレコードをフィルタします。
一致する場合に行をフィルタする 列のパターンに一致する行をフィルタします。
Flatten 繰り返しフィールド内の要素を分離します。
条件で失敗する 条件が true と評価された場合に処理が失敗します。
送信先エラー エラー コレクタにレコードをフィルタします。
エラーに送信して処理を続行する レコードをエラー コレクタにフィルタし、処理を続行します。
行に分割する 区切り文字に基づいて複数のレコードに分割します。

変換

ディレクティブ 説明
ケースの変更 列の値の大文字と小文字を大文字または小文字に変更します。
レコードを作成する ソース列から宛先列に値をコピーして、ネストされた値を含むレコード列を作成します。
文字をカットする 文字列値の一部を選択します。
列を設定する 列の値を式の実行結果に設定します。
検索と置換 「sed」のような式を使用して文字列列の値を変換します。
量子化 列の値に量子化を適用します。
正規表現グループを抽出する 正規表現のグループからデータを抽出して、独自の列に格納します。
文字セットを設定する エンコードを設定し、データを UTF-8 文字列に変換します。
レコードの区切り文字を設定する レコードの区切り文字を設定します。
メールを分割する メール ID をアカウントとそのドメインに分割します。
URL を分割する URL を構成要素に分割します。
テキスト距離(ファジー文字列一致) 2 つの文字列の差異を測定します。
テキスト指標(ファジー文字列一致) 2 つの文字列の差異を測定します。
URL デコード application/x-www-form-urlencoded MIME 形式からデコードします。
URL エンコード application/x-www-form-urlencoded MIME 形式にエンコードします。
スペースのトリミング 文字列データの周囲の空白文字を削除する関数。

一時的なアグリゲータとセッター

ディレクティブ 説明
変数をインクリメントする 処理の記録を使用して、一時変数をインクリメントします。
変数を設定する 処理の記録を含む一時変数を設定します。

一意の ID

ディレクティブ 説明
UUID を生成する ユニバーサルに一意な識別子(UUID)を生成します。

次のステップ