UNICODE 函式

為輸入字串的第一個字元產生 Unicode 索引值。
  • Unicode 是一種全球統一的書寫系統數位編碼標準,可讓世界各地的字元集表示法保持一致。
  • 前 256 個 Unicode 字元 (0, 255) 會對應至 ASCII 字元集。
  • 如果函式無法從第一個字元解析出 Unicode 字元,則會傳回空值。

基本用法

資料欄參照範例:

derive type:single value:UNICODE(MyChar)

輸出:MyChar 資料欄中第一個字元的 Unicode 索引值會寫入新的資料欄。

字串文字範例:

derive type:single value:UNICODE('A')

輸出:整數 65 會寫入新的資料欄。

語法

derive type:single value:UNICODE(column_string)

引數是否必要?資料類型說明
column_string字串產生 Unicode 值的來源資料欄名稱或字串常值

如要進一步瞭解語法標準,請參閱語言文件語法附註一文。

column_string

資料欄名稱或字串文字,當中的第一個字元會轉換為相對應的 Unicode 值。

注意事項:如果輸入字串含有多個字元,系統僅會為第一個字元找出相對應的 Unicode 值,其他字元則會遭到忽略。

  • 如果系統找不到字串或資料欄值,則會產生空白的字串結果。
  • 字串常數必須以引號括住 ('Hello, World')。
  • 不支援多個資料欄和萬用字元。

使用須知:

是否必要?資料類型範例值
字串常值或資料欄參照myColumn

範例

範例 - char 和 unicode 函式

在此範例中,可以瞭解如何使用 CHAR 函式將數字索引值轉換成 Unicode 字元,且 UNICODE 函式亦可用來將字元轉換回數字值。

來源:

以下資料欄包含幾個來源索引值:

index
1
33
33.5
34
48
57
65
90
97
121
254
255
256
257
9998
9999

轉換:

將上述值匯入轉換器頁面時,系統會將資料欄的類型設為整數並顯示一個不相符的值 (33.5)。如要查看這些字元的對應 Unicode 字元,請輸入以下轉換指令:

derive type:single value: CHAR(index) as: 'char_index'

如要查看這些字元會對應回何種索引值,請接著新增以下轉換指令:

derive type:single value: UNICODE(char_index) as: 'unicode_char_index'

結果:

indexchar_indexunicode_char_index
1 1
33!33
33.5
34"34
48048
57957
65A65
90Z90
97a97
122z122
254þ254
255ÿ255
256Ā256
257ā257
99989998
99999999

請注意,系統不處理浮點輸入值。

本頁內容對您是否有任何幫助?請提供意見:

傳送您對下列選項的寶貴意見...

這個網頁
Google Cloud Dataprep 說明文件
需要協助嗎?請前往我們的支援網頁