文字配對

Cloud Dataprep by TRIFACTA® 支援下列類型的比對子句:

  • 字串常值會比對出完全相符的指定字串。撰寫方式是單括號 ('...') 或是雙括號 ("...")。
  • 規則運算式可用於模式比對。規則運算式是使用正斜線撰寫 (/.../)。該語法以 RE2PCRE 規則運算式為基礎。

    注意:規則運算式被視為是開發人員層級功能,如未正確指定則會產生嚴重後果。除非您很熟悉規則運算式,否則建議您改用 Cloud Dataprep 模式。

  • Cloud Dataprep 模式是資料中模式的自訂選擇器,為規則運算式提供了更簡單、更易讀的替代方法。該模式會使用倒引號撰寫 (`...`)。

以下是範例 Cloud Dataprep 模式:

提示:在方案步驟中使用 Cloud Dataprep 模式、規則運算式或字串常值後,您可以在轉換中重複使用它們 (如適用的話)。詳情請參閱模式記錄面板

模式說明
%比對任何字元 (僅處理一次)
%?比對任何字元 (零次或一次)
%*比對任何字元 (零次或多次)
%+比對任何字元 (一次或多次)
%{3}比對任何字元 (僅處理三次)
%{3,5}比對任何字元 (3、4 或 5 次)
#數字字元 [0-9]
{any}比對任何字元 (僅處理一次)
{start}比對行首
{end}比對行尾
{alpha}字母字元 [A-Za-z_]
{upper}大寫字母字元 [A-Z_]
{lower}小寫字母字元 [a-z_]
{digit}數字字元 [0-9]
{delim}單一分隔字元,例如:「, ,, |, /, -, ., \s」
{delim-ws}單一分隔字元和前後所有空格
{alpha-numeric}比對單一英數字元
{alphanum-underscore}比對單一英數字元或底線字元
{at-username}比對 @username
{hashtag}比對 #hashtag
{zip}, {hex}, {phone}, {email}擴充式類型,如同規則運算式
{state}, {state-abbrev}擴充式類型 (同上)
{month}, {month-abbrev}, {url}擴充式類型 (同上)
{ip-address}, {hex-ip-address}擴充式類型 (同上)
{time}, {bool}擴充式類型 (同上)
{[...]}字元類別比對、括號中的字元
{![...]}排除字元類別比對、不在括號中的字元
(...)群組,包含擷取內容
#, %, ?, *, +, {, }, (, ), \, ’, \n, \t逸出字元或模式修飾符。可使用雙反斜線 (\\) 來表示逸出的字串常值。詳情請參閱轉換中的逸出字串一文。
|邏輯子 OR
  • 假如您要串連符合模式的文字,邏輯子 AND 是隱含的運算子。
  • 邏輯子 NOT 則使用排除類別來管理。

另請參閱擷取群組參考資料

本頁內容對您是否有任何幫助?請提供意見:

傳送您對下列選項的寶貴意見...

這個網頁
Google Cloud Dataprep 說明文件
需要協助嗎?請前往我們的支援網頁