このページでは、Cloud Data Fusion Studio の Wrangler ワークスペースでデータを準備するときに文字列の形式を設定する方法について説明します。
[文字列] 列の形式を設定する手順は次のとおりです。
- Cloud Data Fusion の Wrangler ワークスペースに移動します。
- [データ] タブで列名に移動し、arrow_drop_down 展開矢印をクリックします。
- [形式] を選択し、[TitleCase] などのオプションを選択します。オプションについては、以降のセクションで説明します。
Wrangler は、プレビュー モードで列の値の変換を実行し、対応するディレクティブをレシピに追加します。データ パイプラインを実行すると、列内のすべての値に変換が適用されます。
文字列の大文字と小文字を変更する
大文字と小文字を変更するには、前のセクションの手順に沿って、次のいずれかのオプションを選択します。
オプション | 説明 |
---|---|
UPPERCASE | 文字列の文字ケースをすべて大文字に変更します。たとえば、1800 Amphibious Blvd. は 1800 AMPHIBIOUS BLVD. に変更されます。 |
lowercase | 文字列の文字ケースをすべて小文字に変更します。たとえば、1800 Amphibious Blvd. は 1800 amphibious blvd. に変更されます。 |
TitleCase | 各単語の最初の文字を大文字にします。たとえば、1800 amphibious blvd. は 1800 Amphibious Blvd. に変更されます。 |
文字列を連結する
列内のすべての文字列値の先頭または末尾に文字を追加する手順は次のとおりです。
- Cloud Data Fusion の Wrangler ワークスペースに移動します。
- [データ] タブで列名に移動し、arrow_drop_down 展開矢印をクリックします。
- [形式] > [連結] をクリックします。
- [追加] フィールドに、既存の値に追加する文字列を入力します。
- [先頭] または [末尾] を選択して、文字列のどこに新しい値を追加するかを選択します。
- 省略可: 連結された文字列の新しい列を作成するには、[新しい列にコピー] チェックボックスをオンにします。
例
この例は、列内の各値の先頭に文字列 NEW-
を追加した場合の入力値と出力値を示しています。
入力 | 出力 |
---|---|
bread |
NEW-bread |
butter |
NEW-butter |
文字列からスペースを削除する
スペースを削除するには、このページの冒頭で文字列の列の形式設定の手順に沿って、次のいずれかのオプションを選択します。
オプション | 説明 |
---|---|
空白を取り除く | 先頭と末尾のスペースを削除します(trim )。 |
先頭の空白文字を削除する | 先頭のスペースを削除します(ltrim )。 |
末尾の空白文字を削除する | 末尾のスペースを削除します(rtrim )。 |
次のステップ
- Wrangler ディレクティブの詳細を確認する。