支援的語言

Google Distributed Cloud (GDC) 實體隔離設備的文字辨識功能可偵測多種語言,並在單一圖片中偵測多種語言。

您可以為光學字元辨識 (OCR) API 要求指定選用的語言提示。舉例來說,如果 API 無法偵測圖片中使用的語言,您可能需要提供提示。

如要指定選用的語言提示,請在 BatchAnnotateImagesBatchAnnotateFiles 要求的 image_context 欄位中,以 language_hints 欄位中的值清單形式新增提示。

language_hints 格式採用下列 BCP 47 語言代碼格式設定規範:

language["-" script] ["-" region] *("-" variant) *("-" extension) ["-" privateuse]

舉例來說,語言提示 en-t-i0-handwrit 表示語言為「從手寫轉換的英文」。

文字辨識功能支援三種語言層級:

  1. 我們會定期評估成效,優先支援支援的語言。
  2. 實驗語言仍處於積極開發階段。他們沒有定期進行績效評估。
  3. 對應的語言可透過對應至其他語言代碼或一般字元辨識器來支援。舉例來說,en-GB 支援文字辨識,但系統不會以不同方式處理 en。OCR 服務會嘗試在 entity 欄位中傳回正確的對應語言代碼。不過,相應語言比完全或實驗性支援的語言更容易誤判。

OCR 服務的主要功能之一是偵測及擷取圖片中的文字。例如手寫文字。如需手寫辨識功能支援的手寫文字清單,請參閱「手寫文字」。

支援的語言

文字辨識功能會優先處理支援的語言,並定期評估。如要依語言篩選,請在下列欄位中輸入語言:

語言 語言 (英文名稱) 語言提示代碼 腳本和附註
南非荷蘭文 南非荷蘭文 af Latn
shqip 阿爾巴尼亞文 sq Latn
العربية 阿拉伯文 ar 阿拉伯文;現代標準
беларуская 白俄羅斯語 be Cyrl
български 保加利亞文 bg Cyrl
Català 加泰隆尼亞文 ca Latn
普通話 中文 zh 漢斯/漢特
Hrvatski 克羅埃西亞文 hr Latn
Čeština 捷克文 cs Latn
Dansk 丹麥文 da Latn
Nederlands 荷蘭文 nl Latn
英文 英文 en Latn; American
Eesti keel 愛沙尼亞 et Latn
菲律賓文 菲律賓文 filtl Latn
Suomi 芬蘭文 fi Latn
Français 法文 fr Latn; European
Deutsch 德文 de Latn
Ελληνικά 希臘文 el Grek
עברית 希伯來文 iw Hebr
हिन्दी 北印度文 hi 戴瓦
Magyar 匈牙利文 hu Latn
Íslenska 冰島文 is Latn
Bahasa Indonesia 印尼文 id Latn
Italiano 義大利文 it Latn
日本語 日文 ja 日本
한국어 韓文 ko Kore
Latviešu 拉脫維亞文 lv Latn
Lietuvių 立陶宛文 lt Latn
Македонски 馬其頓文 mk Cyrl
馬來文 馬來文 ms Latn
മലയാളം 馬拉雅拉姆文 ml Mlym
मराठी 馬拉地文 mr 戴瓦
नेपाली 尼泊爾文 ne 戴瓦
Norsk 挪威文 no Latn; Bokmål
فارسی 波斯文 fa 阿拉伯
Polski 波蘭文 pl Latn
Português 葡萄牙文 pt Latn;巴西
Română 羅馬尼亞文 ro Latn
Русский 俄文 ru Cyrl
Русский (старая орфография) 俄文 ru-PETR1708 Cyrl; Old Orthography
Српски 塞爾維亞文 sr Cyrl & Latn
Српски (латиница) 塞爾維亞文 sr-Latn Latn
Slovenčina 斯洛伐克文 sk Latn
Slovenščina 斯洛維尼亞文 sl Latn
Español 西班牙文 es Latn; European
Svenska 瑞典文 sv Latn
塔加路文 塔加路文 tl Latn
Türkçe 土耳其文 tr Latn
Українська 烏克蘭文 uk Cyrl
Tiếng Việt 越南文 vi Latn
意第緒語 意第緒語 yi Hebr

實驗語言

實驗語言仍在積極開發中,尚未經過評估。如要依語言篩選,請在下列欄位中輸入語言:

語言 語言 (英文名稱) 語言提示代碼 腳本和附註
Αρχαία ελληνικά 古希臘文 grc Grek
Azərbaycan 阿塞拜疆語 az Latn
Azərbaycan (qədim yazı) 阿塞拜疆語 az-Cyrl Cyrl; old orthography
Euskara 巴斯克文 eu Latn
Bosanski 波士尼亞文 bs Latn
宿霧文 宿霧文 ceb Latn
世界文 世界文 eo Latn
Galego 加里西亞文 gl Latn
ქართული 喬治亞文 ka Geor
Kreyòl Ayisyen 海地克里奧爾文 ht Latn
Gaeilge 愛爾蘭文 ga Latn
Jawa 爪哇文 jv Latn
Қазақ 哈薩克文 kk Cyrl
吉爾吉斯文 吉爾吉斯文 ky Cyrl
Latine 拉丁文 la Latn
Malti 馬耳他文 mt Latn
Монгол 蒙古文 mn Cyrl
پښتو 普什圖文 ps 阿拉伯
संस्कृतम् 梵文 sa 戴瓦
斯瓦希里文 斯瓦希里文 sw Latn
اردو 烏都文 ur 阿拉伯
oʻzbekcha 烏茲別克文 uz Latn;拉丁文
oʻzbekcha 烏茲別克文 uz-Cyrl Cyrl; old orthography
Cymraeg 威爾斯文 cy Latn
IsiZulu 祖魯語 zu Latn

對應的語言

對應語言會與其他語言代碼或一般字元辨識器建立關聯。如要依語言篩選,請在下列欄位中輸入語言:

語言 語言 (英文名稱) 語言提示代碼 腳本和附註 對應至
بهسا اچيه 亞齊語 ace Latn 拉丁字母模型
Lwo 阿喬利語 ach Latn 拉丁字母模型
丹格貝文 阿當莫文 ada Latn 拉丁字母模型
阿肯文 阿肯文 ak Latn 拉丁字母模型
Anicinâbemowin 阿爾岡昆語 alg Latn 拉丁字母模型
馬普切文 Araucanian/Mapuche arn Latn 拉丁字母模型
阿斯圖里亞斯文 阿斯圖里亞斯文 ast Latn 拉丁字母模型
Dene Athabaskan ath Latn 拉丁字母模型
Aymar aru 艾馬拉文 ay Latn 拉丁字母模型
Bhāṣa Bali 峇里文 ban Latn 拉丁字母模型
Bamanankan 班巴拉文 bm Latn 拉丁字母模型
窄幅班圖語 班圖 bnt Latn 拉丁字母模型
башҡорт теле 巴什噶爾語 ba Cyrl 西里爾字母模型
多巴巴塔克語 巴塔克文 btk Latn 拉丁字母模型
奇本巴文 本巴語 bem Latn 拉丁字母模型
比科爾文納加 比科爾語 bik Latn 拉丁字母模型
比切拉馬爾語 碧斯拉瑪文 bi Latn 拉丁字母模型
Brezhoneg 布列塔尼語 br Latn 拉丁字母模型
нохчийн мотт / noxçiyn mott 車臣文 ce Cyrl 西里爾字母模型
汉语 中文 zh-Hans 簡體中文;華語 zh
漢語 中文 zh-Hant Hant; Traditional; Mandarin zh
普通話 中文 zh-Hant-HK Hant; Mandarin; Hong Kong zh
Chahta' 查克托文 cho Latn 拉丁字母模型
Чӑвашла 楚瓦什語 cv Cyrl 西里爾字母模型
克里文 - 蒙塔奈斯文 - 納斯卡皮文 克里文 cr Latn 拉丁字母模型
Mvskoke 小溪 mus Latn 拉丁字母模型
qırımtatar tili, къырымтатар тили 克里米亞韃靼語 crh Latn 西里爾字母模型
Dakhótiyapi、Dakȟótiyapi Dakota dak Latn 拉丁字母模型
杜阿拉 Duala dua Latn 拉丁字母模型
Ikɔ Efik 埃菲克文 efi Latn 拉丁字母模型
英文 (英國) 英文 en-GB Latn; British en
Èʋegbe 埃維文 ee Latn 拉丁字母模型
føroyskt mál 法羅語 fo Latn 拉丁字母模型
Na Vosa Vakaviti 斐濟語 fj Latn 拉丁字母模型
fɔ̀ngbè 豐文 fon Latn 拉丁字母模型
Français canadien 法文 fr-CA Latn; Canadian fr
富拉尼文、富拉文、富爾文 富拉文 ff Latn 拉丁字母模型
加語 gaa Latn 拉丁字母模型
盧干達文 干達文 lg Latn 拉丁字母模型
嘉佑文 嘉佑文 gay Latn 拉丁字母模型
吉里巴斯 吉里巴斯文 gil Latn 拉丁字母模型
歌德文 歌德文 got Latn 拉丁字母模型
瓜拉尼語 瓜拉尼語 gn Latn 拉丁字母模型
Harshen/Halshen Hausa هَرْشَن هَوْسَ 豪薩文 ha Latn 拉丁字母模型
ʻŌlelo Hawaiʻi 夏威夷文 haw Latn 拉丁字母模型
Otjiherero Herero hz Latn 拉丁字母模型
Ilonggo 希里蓋農語 hil Latn 拉丁字母模型
Jaku Iban 伊邦文 iba Latn 拉丁字母模型
Asụsụ Igbo 伊博文 ig Latn 拉丁字母模型
伊洛卡諾文 伊洛果語 ilo Latn 拉丁字母模型
Taqbaylit Kabyle kab Latn 拉丁字母模型
景頗文 克欽文 kac Latn 拉丁字母模型
克拉蘇特文 克拉蘇特文 kl Latn 拉丁字母模型
基坎巴文 坎巴文 kam Latn 拉丁字母模型
卡努里文 卡努里文 kr Latn 拉丁字母模型
Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى 卡拉卡爾帕克文 kaa Cyrl/Latn 西里爾字母模型
Ka Ktien Khasi 卡西文 kha Latn 拉丁字母模型
Gĩkũyũ 基庫猶文 ki Latn 拉丁字母模型
盧安達文 盧安達文 rw Latn 拉丁字母模型
коми кыв 科米文 kv Cyrl 西里爾字母模型
剛果文 剛果文 kg Latn 拉丁字母模型
科斯雷文 科斯雷文 kos Latn 拉丁字母模型
Oshikwanyama Kuanyama kj Latn 拉丁字母模型
Ngala 林格拉文 ln Latn 拉丁字母模型
Plattdütsch、Plattdeutsch、Nedersaksisch 低地德語 nds Latn 拉丁字母模型
siLozi 洛齊文 loz Latn 拉丁字母模型
Kiluba 盧巴卡坦加文 lu Latn 拉丁字母模型
盧歐文 盧歐語 luo Latn 拉丁字母模型
Madhura、Basa Mathura、بَهاسَ مَدورا 馬都拉文 mad Latn 拉丁字母模型
馬達加斯加文 馬達加斯加文 mg Latn 拉丁字母模型
曼丁卡文,لغة مندنكا 曼丁哥文 man Latn 拉丁字母模型
Gaelg、Gailck 曼島文 gv Latn 拉丁字母模型
Te reo Māori 毛利文 mi Latn 拉丁字母模型
Ebon 馬紹爾文 mh Latn 拉丁字母模型
Mɛnde yia 曼德族文 men Latn 拉丁字母模型
中古英語 中古英語 enm Latn 拉丁字母模型
Mittelhochdeutsch 中古高地德語 gmh Latn 拉丁字母模型
Baso Minangkabau, باسو مينڠكاباو 米南佳保文 min Latn 拉丁字母模型
卡尼恩凱哈文 Mohawk moh Latn 拉丁字母模型
Nkundu Mongo lol Latn 拉丁字母模型
納瓦特爾文 納瓦特爾文 nah Latn 拉丁字母模型
Diné bizaad 納瓦伙文 nv Latn 拉丁字母模型
恩東佳文 恩東佳文 ng Latn 拉丁字母模型
ko e vagahau Niuē 紐埃文 niu Latn 拉丁字母模型
辛巴威恩德貝萊文 北恩德貝萊文 nd Latn 拉丁字母模型
Sesotho sa Leboa 北索托文 nso Latn 拉丁字母模型
齊切瓦文、奇尼安賈文 尼揚賈文 ny Latn 拉丁字母模型
Runyankore 尼揚科勒文 nyn Latn 拉丁字母模型
東加文 尼亞薩東加文 tog Latn 拉丁字母模型
Appolo Nzima nzi Latn 拉丁字母模型
奧克文、朗格多克文、普羅旺斯文 奧克語 oc Latn 拉丁字母模型
Anishinaabemowin (ᐊᓂᔑᓈᐯᒧᐎᓐ) 歐及布威文 oj Latn 拉丁字母模型
Ænglisc、Englisc、Anglisc 古英語 ang Latn 拉丁字母模型
Franceis、François、Romanz 古法文 fro Latn 拉丁字母模型
Diutisk、Althochdeutsch 古高地德語 goh Latn 拉丁字母模型
Dǫnsk tunga 古諾斯文 non Latn 拉丁字母模型
Occitan ancian 古普羅旺斯文 pro Latn 拉丁字母模型
ирон ӕвзаг 奧塞提文 os Cyrl 西里爾字母模型
邦板牙語 邦板牙 pam Latn 拉丁字母模型
Salitan Pangasinan 邦阿西楠語 pag Latn 拉丁字母模型
Papiamentu 帕皮阿門多語 pap Latn 拉丁字母模型
Português (Portugal) 葡萄牙文 pt-PT Latn; European pt
克丘亞語 / Runa Simi 克丘亞文 qu Latn 拉丁字母模型
羅曼斯文 羅曼斯文 rm Latn 拉丁字母模型
羅姆文 吉普賽文 rom Latn 拉丁字母模型
Ikirundi 基隆迪語 rn Latn 拉丁字母模型
薩哈文 薩哈文 sah Cyrl 西里爾字母模型
Gagana faʻa Sāmoa 薩摩亞文 sm Latn 拉丁字母模型
yângâ tî sängö 桑戈語 sg Latn 拉丁字母模型
(Braid) Scots、Lallans、Doric 低地蘇格蘭文 sco Latn 拉丁字母模型
Gàidhlig 蘇格蘭蓋爾文 gd Latn 拉丁字母模型
chiShona 修納文 sn Latn 拉丁字母模型
桑海 宋海 son Latn 拉丁字母模型
塞索托文 塞索托文 st Latn 拉丁字母模型
Español (Latinoamérica) 西班牙文 es-419 Latn;拉丁美洲 es
ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda 巽他文 su Latn 拉丁字母模型
siSwati 史瓦濟語 ss Latn 拉丁字母模型
Reo Tahiti 塔希提文 ty Latn 拉丁字母模型
тоҷикӣ 塔吉克文 tg Cyrl 西里爾字母模型
татар теле 韃靼文 tt Cyrl/Latn 西里爾字母模型
KʌThemnɛ 譚姆恩族文 tem Latn 拉丁字母模型
lea faka-Tonga 東加文 to Latn 拉丁字母模型
尚加文 宗卡文 ts Latn 拉丁字母模型
塞茲瓦那文 札那語 tn Latn 拉丁字母模型
Türkmençe 土庫曼語 tk Latn 西里爾字母模型
удмурт кыл 烏德穆爾特文 udm Cyrl 西里爾字母模型
Tshivenḓa 溫達文 ve Latn 拉丁字母模型
隨選影片 沃特語 vot Cyrl/Latn 西里爾字母模型
Frysk 西弗里西亞文 fy Latn 拉丁字母模型
沃洛夫文 沃洛夫文 wo Latn 拉丁字母模型
isiXhosa 科薩文 xh Latn 拉丁字母模型
Èdè Yorùbá 約魯巴文 yo Latn 拉丁字母模型
Diidxazá Zapotec zap Latn 拉丁字母模型

手寫指令碼

這個部分包含手寫辨識功能支援的文字。如要瞭解每種文字使用的語言,請參閱支援實驗性對應語言的表格。如要依指令碼篩選,請在下列欄位中輸入指令碼:

指令碼標記 名稱 支援級別
Beng 孟加拉文 實驗功能
Cyrl 斯拉夫文 實驗功能
戴瓦 梵文 實驗功能
Grek 希臘文 實驗功能
哈尼文 中文 實驗功能
日本 日文 支援
Kore 韓文 支援
Latn 拉丁文 支援
vi 越南文 實驗功能