CHAR 函式

此函式會產生與輸入整數值相對應的 Unicode 字元。

Unicode 是一種全球統一的書寫系統數位編碼標準,可讓世界各地的字元集表示法保持一致。

  • 前 256 個 Unicode 字元 (0, 255) 會對應至 ASCII 字元集。
  • 用於 CHAR 函式的輸入值必須是整數類型。小數類型資料欄資料也可用來當做輸入。不過,如果資料包含小數點右側的數字,CHAR 函式就會傳回遺漏值。
  • 如果函無法評估數字資料,就會傳回空值。

基本用法

資料欄參照範例:

derive type:single value:CHAR(MyCharIndex)

輸入:MyCharIndex 資料欄中數字的 Unicode 值會寫入新資料欄。

字串常值範例:

derive type:single value:CHAR(65)

輸出:字串 A 會寫入新資料欄。

語法

derive type:single value:CHAR(index_value)

引數是否必要?資料類型說明
index_value整數 (正數)字元的 Unicode 索引值

如要進一步瞭解語法標準,請參閱語言文件語法附註一文。

index_value

待產生或比對的字元 Unicode 索引值。

  • Unicode 字元集最多可包含 1,114,112 個字元。多數情況仰賴前 10,000 個字元。
  • 值必須小於 end_index

使用須知:

是否必要?資料類型範例值
整數 (非負整數)65

範例

範例 - char 和 unicode 函式

在此範例中,可以瞭解如何使用 CHAR 函式將數字索引值轉換成 Unicode 字元,且 UNICODE 函式亦可用來將字元轉換回數字值。

來源:

以下資料欄包含幾個來源索引值:

index
1
33
33.5
34
48
57
65
90
97
121
254
255
256
257
9998
9999

轉換:

將上述值匯入轉換器頁面時,系統會將資料欄的類型設為整數並顯示一個不相符的值 (33.5)。如要查看這些字元的對應 Unicode 字元,請輸入以下轉換指令:

derive type:single value: CHAR(index) as: 'char_index'

如要查看這些字元會對應回何種索引值,請接著新增以下轉換指令:

derive type:single value: UNICODE(char_index) as: 'unicode_char_index'

結果:

indexchar_indexunicode_char_index
1 1
33!33
33.5
34"34
48048
57957
65A65
90Z90
97a97
122z122
254þ254
255ÿ255
256Ā256
257ā257
99989998
99999999

請注意,系統不處理浮點輸入值。

本頁內容對您是否有任何幫助?請提供意見:

傳送您對下列選項的寶貴意見...

這個網頁
Google Cloud Dataprep 說明文件
需要協助嗎?請前往我們的支援網頁