TRANSLITERATE 函式

將亞洲字集字元從一種字集格式音譯成另一種字集格式。字串可以是資料欄參照或字串常值。

基本用法

資料欄參照範例:

derive type:single value:TRANSLITERATE(MyJapaneseSentences,HiraganaToKatakana) as:'Katakana'

輸出:建立新資料欄 Katakana,其中包含 myJapaneseSentences 中從日文平假名字集格式音譯為日文片假名字集格式的值。

語法

derive type:single value:TRANSLITERATE(column_string,form_enum)

引數是否必要?資料類型說明
column_string字串要套用於函式的資料欄名稱或字串常值
form_enum字串 (列舉值)音譯格式做為列舉值。請參閱下列詳細資訊。

如要進一步瞭解語法標準,請參閱語言文件語法附註

column_string

待音譯的資料欄名稱或字串常值。字串值必須使用支援的日文字集格式,如下所示。

  • 如果系統找不到字串或資料欄值,則產生的結果也會遺漏該值。
  • 字串常數必須以引號括住 ('Hello, World')。
  • 不支援多個資料欄和萬用字元。

使用須知:

是否必要?資料類型範例值
字串常值或資料欄參照myColumn

form_enum

列舉值用於表示要套用至參照資料欄的音譯:

注意:各個寬度選項可與各個格式選項配對。四種獨立選項都能支援。

列舉值說明
HiraganaToKatakana將日文平假名音譯為日文片假名
KatakanaToHiragana將日文片假名音譯為日文平假名
FullwidthToHalfwidth將全形格式音譯為半形格式
HalfwidthToFullwidth將半形格式音譯為全形格式

使用須知:

是否必要?資料類型範例值
字串 (列舉值)HiraganaToKatakana

範例

範例 - TRANSLITERATE 函式

來源:

EnglishJapanese_Hiragana
a
i
U
e
o
ka
ki
ku
ke
ko


轉換:

以下指令將上述字串音譯為是日文片假名格式:

derive type: single value: TRANSLITERATE(Japanese_Hiragana, HiraganaToKatakana) as: 'Japanese_Katakana'

這會產生全形的日文片假名。以下指令會將該資料欄音譯為半形格式:

derive type: single value: TRANSLITERATE(Japanese_Katakana, FullwidthToHalfwidth) as: 'Japanese_Katakana_halfwidth'


結果:

EnglishJapanese_HiraganaJapanese_KatakanaJapanese_Katakana_halfwidth
a
i
U
e
o
ka
ki
ku
ke
ko

本頁內容對您是否有任何幫助?請提供意見:

傳送您對下列選項的寶貴意見...

這個網頁
Google Cloud Dataprep 說明文件
需要協助嗎?請前往我們的支援網頁