REMOVESYMBOLS 函式

從字串中移除不是字母、數字、加重音拉丁字元或空白字元的所有字元。

注意:同時移除非拉丁字母。

提示:這個函式也會移除常見的標點符號,如下所示:

. , ! & ?

若要保留這些字元,您可以將它們替換成英數文字字串。例如,問號可以替換成:

zzQUESTIONMARKzz

套用這個函式之後,您可以再將這些字串替換回原始值。

基本用法

資料欄參照範例:

derive type:single value:REMOVESYMBOLS(MyName)

輸出:MyName 資料欄值中移除所有非英數字元後所得的值。

字串文字範例:

derive type:single value:REMOVESYMBOLS('Héllõ, Wõrlds!?!?')

輸出:此指令會將字串 Héllõ Wõrlds 寫入新的資料欄。

萬用字元範例:

set col:* value:REMOVESYMBOLS($col)

輸出:從資料集的所有資料欄中移除所有非英數或空格字元。

語法

derive type:single value:REMOVESYMBOLS(column_string)

引數是否必要?資料類型說明
column_string字串要套用於函式的資料欄名稱或字串常值

如要進一步瞭解語法標準,請參閱語言文件語法附註

column_string

要移除符號的資料欄名稱或字串常數。

  • 如果系統找不到字串或資料欄值,則會產生空白的字串結果。
  • 字串常數必須以引號括住 ('Hello, World')。
  • 不支援多個資料欄和萬用字元。

使用須知:

是否必要?資料類型範例值
字串常值或資料欄參照myColumn

範例

範例 - 搭配使用字串清理函式

以下範例示範如何使用函式來清理字串。這些函式的作用如下:

  • TRIM - 移除前置及後置空格。請參閱 TRIM 函式
  • REMOVEWHITESPACE - 移除前置和後置空格,以及字元間的所有空格。請參閱 REMOVEWHITESPACE 函式
  • REMOVESYMBOLS - 移除不是英數或空格字元的所有字元。請參閱 REMOVESYMBOLS 函式

來源:

在下列範例中,(space)(tab) 分別代表空格鍵和 Tab 鍵。空格字元函式也支援回車和換行字元。

Stringssource
String01this source(space)(space)
String02(tab)(tab)this source
String03(tab)(tab)this source(space)(space)
String04this source's?
String05Why, you @#$%^&*()!
String06this söurce
String07(space)this söurce
String08à mañana

轉換:

下列轉換指令會使用各個字串清理函式產生新的資料欄:

derive type:single value: TRIM(source) as: 'trim_source'

derive type:single value: REMOVEWHITESPACE(source) as: 'removewhitespace_source'

derive type:single value: REMOVESYMBOLS(source) as: 'removesymbols_source'

結果:

Stringssourceremovesymbols_sourceremovewhitespace_sourcetrim_source
String01this source(space)(space) this source(space)(space) thissourcethis source
String02(tab)(tab)this source(tab)(tab)this sourcethissourcethis source
String03(tab)(tab)this source(space)(space)(tab)(tab)this source(space)(space)thissourcethis source
String04this source's?this sourcesthissource's?this source's?
String05Why, you @#$%^&*()!Why you Why,you@#$%^&*()!Why, you @#$%^&*()!
String06this söurcethis surcethissöurcethis söurce
String07(space)this söurce(space)this surcethissöurcethis söurce
String08à mañana maanaà ma ñanaà ma ñana

本頁內容對您是否有任何幫助?請提供意見:

傳送您對下列選項的寶貴意見...

這個網頁
Google Cloud Dataprep 說明文件
需要協助嗎?請前往我們的支援網頁