範例 - Double Metaphone 函式

這個範例會說明下列 Double Metaphone 演算法函式如何在 Cloud Dataprep by TRIFACTA® 運作。

  • DOUBLEMETAPHONE:計算輸入字串的主要及次要語音編碼,編碼會傳回雙元素陣列。詳情請參閱 DOUBLEMETAPHONE 函式
  • DOUBLEMETAPHONEQUALS:使用 Double Metaphone 演算法比較兩個輸入字串,如果語音相符,系統會傳回 true。詳情請參閱 DOUBLEMETAPHONEEQUALS 函式

來源:

下表含有待比較的字串範例。

string1string2附註
My Stringmy string系統進行比較時不區分大小寫
judgejuge錯字
knocknock不發音字母
whitewite字母缺失
recordrecord兩個不一樣的英文字串,但比對結果相符
pairpear比對結果相符,但是不同的字串
bookkeeperbook keeper空格會導致比較發生錯誤
test1test123系統不會比較數字
the end.the end….標點符號的差異沒有影響
a elephantan elephant系統會將 a 和 an 視為不同字串


轉換:

您可以使用 DOUBLEMETAPHONE 函式產生語音拼字,如下所示:

derive type: single value: DOUBLEMETAPHONE(string1) as: 'dblmeta_s1'

您可以使用 DOUBLEMETAPHONEEQUALS 函式比較 string1string2

derive type: single value: DOUBLEMETAPHONEEQUALS(string1, string2, 'normal') as: 'compare'

結果:

下表含有待比較的字串範例。

string1dblmeta_s1string2比較附註
My String["MSTRNK","MSTRNK"]my stringTRUE系統進行比較時不區分大小寫
judge["JJ","AJ"]jugeTRUE錯字
knock["NK","NK"]nockTRUE不發音字母
white["AT","AT"]witeTRUE字母缺失
record["RKRT","RKRT"]recordTRUE兩個不一樣的英文字串,但比對結果相符
pair["PR","PR"]pearTRUE比對結果相符,但是不同的字串
bookkeeper["PKPR","PKPR"]book keeperFALSE空格會導致比較發生錯誤
test1["TST","TST"]test123TRUE系統不會比較數字
the end.["0NT","TNT"]the end….TRUE標點符號的差異沒有影響
a elephant["ALFNT","ALFNT"]an elephantFALSE系統會將 a 和 an 視為不同字串
本頁內容對您是否有任何幫助?請提供意見:

傳送您對下列選項的寶貴意見...

這個網頁
Google Cloud Dataprep 說明文件
需要協助嗎?請前往我們的支援網頁