支持的语言

Google Distributed Cloud (GDC) air-gapped 的文本识别功能可以检测多种语言,还可以检测单张图片中的多种语言。

您可以为光学字符识别 (OCR) API 请求指定可选的语言提示。例如,当 API 难以检测图片中所用的语言时,您可能需要提供提示。

如需指定可选的语言提示,请在 image_context 字段中将它们作为 language_hints 字段中的值列表添加到 BatchAnnotateImagesBatchAnnotateFiles 请求中。

language_hints 格式采用以下 BCP 47 语言标记格式设置指南:

language["-" script] ["-" region] *("-" variant) *("-" extension) ["-" privateuse]

例如,语言提示 en-t-i0-handwrit 表示语言为“从手写转换而来的英语”。

文本识别功能支持三种级别的语言:

  1. 受支持语言会得到优先考虑,并会定期进行性能评估。
  2. 实验性语言正处于积极开发阶段。他们没有定期绩效评估。
  3. 映射的语言可通过映射到其他语言代码或常规字符识别器而获得支持。例如,en-GB 受支持,但出于文本识别的目的,系统不会将其与 en 区分对待。OCR 服务会尝试在 entity 字段中返回正确的映射语言代码。不过,与完全受支持的语言或用实验方法支持的语言相比,映射的语言更有可能被误识别。

OCR 服务的一项主要功能是能够检测并提取图片中的文本。例如,图片可以是手写文字。如需查看支持手写识别的手写文字列表,请参阅手写文字

支持的语言

文字识别功能会优先考虑并定期评估受支持的语言。如需按语言过滤,请在以下字段中输入语言:

语言 语言(中文名称) 语言提示代码 脚本和备注
南非荷兰语 南非荷兰语 af Latn
shqip 阿尔巴尼亚语 sq Latn
العربية 阿拉伯语 ar 现代标准阿拉伯语
беларуская 白俄罗斯语 be Cyrl
български 保加利亚语 bg Cyrl
加泰罗尼亚语 加泰罗尼亚语 ca Latn
普通话 中文 zh Hans/Hant
Hrvatski 克罗地亚语 hr Latn
Čeština 捷克语 cs Latn
Dansk 丹麦语 da Latn
Nederlands 荷兰语 nl Latn
英语 英语 en Latn; 美国
Eesti keel 爱沙尼亚语 et Latn
菲律宾语 菲律宾语 filtl Latn
Suomi 芬兰语 fi Latn
Français 法语 fr Latn; 欧洲
Deutsch 德语 de Latn
Ελληνικά 希腊语 el Grek
עברית 希伯来语 iw Hebr
हिन्दी 印地语 hi Deva
Magyar 匈牙利语 hu Latn
Íslenska 冰岛语 is Latn
Bahasa Indonesia 印度尼西亚语 id Latn
Italiano 意大利语 it Latn
日本語 日语 ja Jpan
한국어 韩语 ko Kore
Latviešu 拉脱维亚语 lv Latn
Lietuvių 立陶宛语 lt Latn
Македонски 马其顿语 mk Cyrl
Bahasa Melayu 马来语 ms Latn
മലയാളം 马拉雅拉姆语 ml Mlym
मराठी 马拉地语 mr Deva
नेपाली 尼泊尔语 ne Deva
Norsk 挪威语 no Latn; Bokmål
فارسی 波斯语 fa Arab
Polski 波兰语 pl Latn
Português 葡萄牙语 pt Latn; 巴西
Română 罗马尼亚语 ro Latn
Русский 俄语 ru Cyrl
Русский (старая орфография) 俄语 ru-PETR1708 Cyrl; 旧拼字法
Српски 塞尔维亚语 sr Cyrl 与 Latn
Српски (латиница) 塞尔维亚语 sr-Latn Latn
Slovenčina 斯洛伐克语 sk Latn
Slovenščina 斯洛维尼亚语 sl Latn
Español 西班牙语 es Latn; 欧洲
Svenska 瑞典语 sv Latn
塔加路文 塔加路文 tl Latn
Türkçe 土耳其语 tr Latn
Українська 乌克兰语 uk Cyrl
Tiếng Việt 越南语 vi Latn
意第绪语 意第绪语 yi Hebr

实验性语言

实验性语言正处于积极开发阶段,但不会进行评估。如需按语言过滤,请在以下字段中输入语言:

语言 语言(中文名称) 语言提示代码 脚本和备注
Αρχαία ελληνικά 古希腊语 grc Grek
Azərbaycan 阿塞拜疆语 az Latn
Azərbaycan (qədim yazı) 阿塞拜疆语 az-Cyrl Cyrl; 旧拼字法
Euskara 巴斯克语 eu Latn
Bosanski 波斯尼亚语 bs Latn
宿务语 宿务语 ceb Latn
世界语 世界语 eo Latn
Galego 加利西亚语 gl Latn
ქართული 格鲁吉亚语 ka Geor
Kreyòl Ayisyen 海地克里奥尔语 ht Latn
Gaeilge 爱尔兰语 ga Latn
Jawa 爪哇语 jv Latn
Қазақ 哈萨克语 kk Cyrl
吉尔吉斯语 吉尔吉斯语 ky Cyrl
Latine 拉丁语 la Latn
Malti 马耳他语 mt Latn
Монгол 蒙古语 mn Cyrl
پښتو 普什图语 ps Arab
संस्कृतम् 梵语 sa Deva
斯瓦希里语 斯瓦希里语 sw Latn
اردو 乌尔都语 ur Arab
oʻzbekcha 乌兹别克语 uz Latn; 拉丁美洲
oʻzbekcha 乌兹别克语 uz-Cyrl Cyrl; 旧拼字法
Cymraeg 威尔士语 cy Latn
IsiZulu 祖鲁语 zu Latn

映射语言

映射的语言会关联到其他语言代码或常规字符识别器。如需按语言过滤,请在以下字段中输入语言:

语言 语言(中文名称) 语言提示代码 脚本和备注 映射到
بهسا اچيه 亚齐语 ace Latn 拉丁字母文字模式
Lwo 阿乔利语 ach Latn 拉丁字母文字模式
当梅语 Adangme ada Latn 拉丁字母文字模式
阿坎语 阿坎语 ak Latn 拉丁字母文字模式
Anicinâbemowin 阿尔贡金语 alg Latn 拉丁字母文字模式
Mapudungu 阿洛柯语/马普切语 arn Latn 拉丁字母文字模式
Asturianu 阿斯图里亚斯语 ast Latn 拉丁字母文字模式
Dene 阿萨巴斯卡语 ath Latn 拉丁字母文字模式
Aymar aru 艾马拉语 ay Latn 拉丁字母文字模式
Bhāṣa Bali 巴厘文 ban Latn 拉丁字母文字模式
Bamanankan 班巴拉语 bm Latn 拉丁字母文字模式
Narrow Bantu 班图语 bnt Latn 拉丁字母文字模式
башҡорт теле 巴什基尔语 ba Cyrl 西里尔字母文字模式
Toba–Batak 巴塔克文 btk Latn 拉丁字母文字模式
Chibemba 奔巴语 bem Latn 拉丁字母文字模式
Bikol Naga 比科尔语 bik Latn 拉丁字母文字模式
Bichelamar 比斯拉马语 bi Latn 拉丁字母文字模式
Brezhoneg 布列塔尼语 br Latn 拉丁字母文字模式
нохчийн мотт / noxçiyn mott 车臣语 ce Cyrl 西里尔字母文字模式
汉语 中文 zh-Hans Hans; 简体; 普通话 zh
漢語 中文 zh-Hant Hant; 繁体; 繁体中文 zh
普通話 中文 zh-Hant-HK Hant; 香港繁体; 香港 zh
Chahta' 乔克托语 cho Latn 拉丁字母文字模式
Чӑвашла 楚瓦什语 cv Cyrl 西里尔字母文字模式
Cree–Montagnais–Naskapi 克里语 cr Latn 拉丁字母文字模式
Mvskoke Creek mus Latn 拉丁字母文字模式
qırımtatar tili, къырымтатар тили 克里米亚鞑靼语 crh Latn 西里尔字母文字模式
Dakhótiyapi, Dakȟótiyapi Dakota dak Latn 拉丁字母文字模式
杜阿拉 Duala dua Latn 拉丁字母文字模式
Ikɔ Efik 埃菲克语 efi Latn 拉丁字母文字模式
英语(英国) 英语 en-GB Latn; 英国 en
Èʋegbe 埃维语 ee Latn 拉丁字母文字模式
føroyskt mál 法罗语 fo Latn 拉丁字母文字模式
Na Vosa Vakaviti 斐济语 fj Latn 拉丁字母文字模式
fɔ̀ngbè 丰族语 fon Latn 拉丁字母文字模式
Français canadien 法语 fr-CA Latn; 加拿大 fr
Fulani, Fulah, Peul Fulah ff Latn 拉丁字母文字模式
加 (Ga) 语 gaa Latn 拉丁字母文字模式
卢干达语 干达语 lg Latn 拉丁字母文字模式
Basa Gayo 卡约语 gay Latn 拉丁字母文字模式
基里巴斯 吉尔伯特语 gil Latn 拉丁字母文字模式
哥特文 哥特文 got Latn 拉丁字母文字模式
Guaraní 瓜拉尼人 gn Latn 拉丁字母文字模式
Harshen/Halshen Hausa هَرْشَن هَوْسَ 豪萨语 ha Latn 拉丁字母文字模式
ʻŌlelo Hawaiʻi 夏威夷语 haw Latn 拉丁字母文字模式
Otjiherero 赫雷罗语 hz Latn 拉丁字母文字模式
Ilonggo 希利盖农语 hil Latn 拉丁字母文字模式
Jaku Iban 伊班语 iba Latn 拉丁字母文字模式
Asụsụ Igbo 伊博语 ig Latn 拉丁字母文字模式
Ilokano 伊洛果语 ilo Latn 拉丁字母文字模式
Taqbaylit 卡拜尔语 kab Latn 拉丁字母文字模式
景颇语 克钦语 kac Latn 拉丁字母文字模式
格陵兰语 格陵兰语 kl Latn 拉丁字母文字模式
Kikamba 卡姆巴语 kam Latn 拉丁字母文字模式
卡努里语 卡努里语 kr Latn 拉丁字母文字模式
Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى 卡拉卡尔帕克语 kaa Cyrl/Latn 西里尔字母文字模式
Ka Ktien Khasi 卡西语 kha Latn 拉丁字母文字模式
Gĩkũyũ 吉库尤语 ki Latn 拉丁字母文字模式
卢旺达语 卢旺达语 rw Latn 拉丁字母文字模式
коми кыв 科米语 kv Cyrl 西里尔字母文字模式
Kikongo 刚果语 kg Latn 拉丁字母文字模式
科斯拉伊语 科斯拉伊语 kos Latn 拉丁字母文字模式
Oshikwanyama 宽尼亚玛语 kj Latn 拉丁字母文字模式
Ngala 林加拉语 ln Latn 拉丁字母文字模式
Plattdütsch, Plattdeutsch, Nedersaksisch 低地德语 nds Latn 拉丁字母文字模式
siLozi Lozi loz Latn 拉丁字母文字模式
Kiluba 卢巴加丹加语 lu Latn 拉丁字母文字模式
Dholuo 卢奥语 luo Latn 拉丁字母文字模式
Madhura, Basa Mathura, بَهاسَ مَدورا 马都拉语 mad Latn 拉丁字母文字模式
马尔加什语 马尔加什语 mg Latn 拉丁字母文字模式
Mandinka, لغة مندنكا 曼丁果语 man Latn 拉丁字母文字模式
Gaelg, Gailck 马恩岛语 gv Latn 拉丁字母文字模式
Te reo Māori 毛利语 mi Latn 拉丁字母文字模式
埃崩 马绍尔语 mh Latn 拉丁字母文字模式
Mɛnde yia 门德语 men Latn 拉丁字母文字模式
中古英语 中古英语 enm Latn 拉丁字母文字模式
Mittelhochdeutsch 中古高地德语 gmh Latn 拉丁字母文字模式
Baso Minangkabau, باسو مينڠكاباو 米南佳保语 min Latn 拉丁字母文字模式
Kanienʼkéha Mohawk moh Latn 拉丁字母文字模式
Nkundu Mongo lol Latn 拉丁字母文字模式
Nāhuatl 纳瓦特尔语 nah Latn 拉丁字母文字模式
Diné bizaad 纳瓦霍语 nv Latn 拉丁字母文字模式
恩东加语 恩东加语 ng Latn 拉丁字母文字模式
ko e vagahau Niuē 纽埃语 niu Latn 拉丁字母文字模式
津巴布韦恩德贝莱 北恩德贝勒语 nd Latn 拉丁字母文字模式
塞索托萨莱博亚 北索托语 nso Latn 拉丁字母文字模式
奇切瓦,钦亚尼亚 尼昂加语 ny Latn 拉丁字母文字模式
鲁扬科雷 尼扬科莱语 nyn Latn 拉丁字母文字模式
Chitonga 汤加语(尼亚萨地区) tog Latn 拉丁字母文字模式
Appolo 恩济马语 nzi Latn 拉丁字母文字模式
Occitan, lenga d'òc, provençal 奥克斯坦语 oc Latn 拉丁字母文字模式
Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ 奥杰布瓦语 oj Latn 拉丁字母文字模式
Ænglisc, Englisc, Anglisc 古英语 ang Latn 拉丁字母文字模式
Franceis, François, Romanz 古法语 fro Latn 拉丁字母文字模式
Diutisk, Althochdeutsch 古高地德语 goh Latn 拉丁字母文字模式
Dǫnsk tunga 古诺斯语 non Latn 拉丁字母文字模式
奥克斯坦语 古普罗文斯语 pro Latn 拉丁字母文字模式
ирон ӕвзаг 奥塞特语 os Cyrl 西里尔字母文字模式
邦板牙语 Pampanga pam Latn 拉丁字母文字模式
Salitan Pangasinan 邦阿西楠语 pag Latn 拉丁字母文字模式
Papiamentu 帕皮阿门托语 pap Latn 拉丁字母文字模式
Português (Portugal) 葡萄牙语 pt-PT Latn; 欧洲 pt
Kechua / Runa Simi 克丘亚语 qu Latn 拉丁字母文字模式
Rumantsch 罗曼什语 rm Latn 拉丁字母文字模式
Romani čhib 吉普赛语 rom Latn 拉丁字母文字模式
Ikirundi 隆迪语 rn Latn 拉丁字母文字模式
萨哈语 萨哈语 sah Cyrl 西里尔字母文字模式
Gagana faʻa Sāmoa 萨摩亚语 sm Latn 拉丁字母文字模式
yângâ tî sängö 桑戈语 sg Latn 拉丁字母文字模式
(Braid) Scots, Lallans, Doric 苏格兰语 sco Latn 拉丁字母文字模式
Gàidhlig 苏格兰盖尔语 gd Latn 拉丁字母文字模式
chiShona 修纳语 sn Latn 拉丁字母文字模式
Songhay Songhai son Latn 拉丁字母文字模式
塞索托语 南索托语 st Latn 拉丁字母文字模式
Español (Latinoamérica) 西班牙语 es-419 Latn; 拉丁美洲 es
ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda 巽他语 su Latn 拉丁字母文字模式
siSwati 斯瓦特语 ss Latn 拉丁字母文字模式
Reo Tahiti 塔希提语 ty Latn 拉丁字母文字模式
тоҷикӣ 塔吉克语 tg Cyrl 西里尔字母文字模式
татар теле 鞑靼语 tt Cyrl/Latn 西里尔字母文字模式
KʌThemnɛ 提姆语 tem Latn 拉丁字母文字模式
lea faka-Tonga 汤加语 to Latn 拉丁字母文字模式
Xitsonga 聪加语 ts Latn 拉丁字母文字模式
Setswana 茨瓦纳语 tn Latn 拉丁字母文字模式
Türkmençe 土库曼语 tk Latn 西里尔字母文字模式
удмурт кыл 乌德穆尔特语 udm Cyrl 西里尔字母文字模式
Tshivenḓa 文达语 ve Latn 拉丁字母文字模式
Vod 沃提克语 vot Cyrl/Latn 西里尔字母文字模式
Frysk 西弗里西亚语 fy Latn 拉丁字母文字模式
沃洛夫语 沃洛夫语 wo Latn 拉丁字母文字模式
isiXhosa 科萨语 xh Latn 拉丁字母文字模式
Èdè Yorùbá 约鲁巴语 yo Latn 拉丁字母文字模式
Diidxazá Zapotec zap Latn 拉丁字母文字模式

手写文字

本部分包含支持手写识别的文字。如需了解哪些语言使用每种文字,请参阅受支持的语言实验性语言映射的语言的相关表格。如需按脚本过滤,请在以下字段中输入脚本:

脚本标记 名称 支持级别
Beng 孟加拉文 实验性
Cyrl 西里尔文 实验性
Deva 梵文 实验性
Grek 希腊文 实验性
哈尼语 中文 实验性
Jpan 日语 支持
Kore 韩语 支持
Latn 拉丁文 支持
vi 越南语 实验性