字串定序規則

定序是指將寫入的內容整理成標準化順序。字串比較函式會利用拉丁文字元的定序規則。規則摘要如下:

  • 進行比較時會區分大小寫。
    • 相同字母的大寫字體版本大於小寫字體版本。
    • 但在字母表中位置在後面的小寫字母大於位置在前的大寫字母。
  • 如果兩個字串完全相同,則為相等。
    • 如果兩個字串相同,但第二個字串的結尾含有一個額外的字元,則第二個字串較大。
  • 正規化版夲的字母是不帶有重音符號的小寫版本字母。在字串比較中,這是所有變異項中的最小值。
    • a 小於 ă。
    • 但與 b 相比較時,a = ă。
    • 拉丁文正規化字元集含有 26 個以上的字元。

下表說明拉丁文字元定序的部分通用規則。

順序說明較小範例較大範例
1空白字元(空格鍵)(Return 鍵)
2標點符號'@
3數字12
4字母aA
5 Ab

資源:

注意:在以下圖表中 (見下方連結),頁面頂端的值小於頁面下方列出的值。同樣的,左側導覽列中列出的圖表也是按遞增順序排列。

如要進一步瞭解適用的定序規則,請參閱 http://www.unicode.org/charts/collation/

本頁內容對您是否有任何幫助?請提供意見:

傳送您對下列選項的寶貴意見...

這個網頁
Google Cloud Dataprep 說明文件
需要協助嗎?請前往我們的支援網頁