支援的特殊運算式字元

Cloud Dataprep by TRIFACTA® 支援適用於規則運算式的一組特殊字元,於該平台支援的所有執行引擎均通用。

斜線

正斜線字元用於表示規則運算式的界線。

/this_is_my_regular_expression/
  • 反斜線 (\) 是逸出字元,可用來表示逸出字元、字串、常值,或某一組支援的特殊字元。
  • 可使用雙反斜線 (\\) 來表示逸出的字串常值。詳情請參閱轉換中的逸出字串一文。

支援的特殊規則運算式字元

下表為平台支援的特殊字元。

特殊字元說明
\\等同 \ 字元的字串常值。

\b

等同任何寬度為零的文字邊界,例如字母和空格之間。

範例:/\bre/ 不等同 tire 中的 re,因為 re 不在文字邊界上。/re\b/ 即相符。

\B

等同任何寬度為零的非文字邊界,例如兩個字母或兩個空格之間。

範例:/\Bre/ 符合 tire 中的 re,但就不符合 respect,因為其中 re 的實際情況是在文字邊界上。

\cX 等同控制字元 (CTRL + A-Z),其中的 X 是相對應的字母。
\d等同任何數字。
\D等同任何非數字。
\f等同換頁字元。
\n

等同換行字元。

注意:物件和陣列資料類型的輸入值不支援這類字元。

\r等同回車字元。
\s

等同任何空白字元,包括:

  • 空格
  • 定位點
  • 換頁字元
  • 換行字元
  • 其他 Unicode 空格字元。
\S等同並非任何一種支援的空白字元的所有字元。
\t

等同水平定位點。

注意:物件和陣列資料類型的輸入值不支援這類字元。

\v

等同垂直定位點。

\w

等同任何英數字元值,包含底線。

提示:資料欄名稱必須符合同一組字元。

\W等同任何非英數字元,包含底線。
\xHH 等同以十六進位值 HH 表示的 ASCII 字元碼。
\uHHHH等同以十六進位值 HHHH 表示的 Unicode 字元碼。

必要的逸出字元

下列字元在規則運算式內具有特殊意義。

. ^ $ * + - ? ( ) [ ] { } \ | — /

如要使用常值字元,則需在規則運算式中將之逸出,如下所示:

/\./
本頁內容對您是否有任何幫助?請提供意見:

傳送您對下列選項的寶貴意見...

這個網頁
Google Cloud Dataprep 說明文件
需要協助嗎?請前往我們的支援網頁