Google Distributed Cloud (GDC) 气隙设备的文本识别功能可以检测多种语言,还可以检测单张图片中的多种语言。
您可以为光学字符识别 (OCR) API 请求指定可选的语言提示。例如,当 API 难以检测图片中所用的语言时,您可能需要提供提示。
如需指定可选的语言提示,请在 image_context 字段中将它们作为 language_hints 字段中的值列表添加到 BatchAnnotateImages 或 BatchAnnotateFiles 请求中。
language_hints 格式采用以下 BCP 47 语言标记格式设置指南:
language["-" script] ["-" region] *("-" variant) *("-" extension) ["-" privateuse]
例如,语言提示 en-t-i0-handwrit 表示语言为“从手写转换而来的英语”。
文本识别功能支持三种级别的语言:
- 受支持语言会得到优先考虑,并会定期进行性能评估。
- 实验性语言正处于积极开发阶段。他们没有定期绩效评估。
- 映射的语言可通过映射到其他语言代码或常规字符识别器而获得支持。例如,
en-GB受支持,但出于文本识别的目的,系统不会将其与en区分对待。OCR 服务会尝试在entity字段中返回正确的映射语言代码。不过,与完全受支持的语言或用实验方法支持的语言相比,映射的语言更有可能被误识别。
OCR 服务的一项主要功能是能够检测并提取图片中的文本。例如,图片可以是手写文字。如需查看支持手写识别的手写文字列表,请参阅手写文字。
支持的语言
文字识别功能会优先考虑并定期评估受支持的语言。如需按语言过滤,请在以下字段中输入语言:
| 语言 | 语言(中文名称) | 语言提示代码 | 脚本和备注 |
|---|---|---|---|
| 南非荷兰语 | 南非荷兰语 | af |
Latn |
| shqip | 阿尔巴尼亚语 | sq |
Latn |
| العربية | 阿拉伯语 | ar |
现代标准阿拉伯语 |
| беларуская | 白俄罗斯语 | be |
Cyrl |
| български | 保加利亚语 | bg |
Cyrl |
| 加泰罗尼亚语 | 加泰罗尼亚语 | ca |
Latn |
| 普通话 | 中文 | zh |
Hans/Hant |
| Hrvatski | 克罗地亚语 | hr |
Latn |
| Čeština | 捷克语 | cs |
Latn |
| Dansk | 丹麦语 | da |
Latn |
| Nederlands | 荷兰语 | nl |
Latn |
| 英语 | 英语 | en |
Latn; 美国 |
| Eesti keel | 爱沙尼亚语 | et |
Latn |
| 菲律宾语 | 菲律宾语 | fil 或 tl |
Latn |
| Suomi | 芬兰语 | fi |
Latn |
| Français | 法语 | fr |
Latn; 欧洲 |
| Deutsch | 德语 | de |
Latn |
| Ελληνικά | 希腊语 | el |
Grek |
| עברית | 希伯来语 | iw |
Hebr |
| हिन्दी | 印地语 | hi |
Deva |
| Magyar | 匈牙利语 | hu |
Latn |
| Íslenska | 冰岛语 | is |
Latn |
| Bahasa Indonesia | 印度尼西亚语 | id |
Latn |
| Italiano | 意大利语 | it |
Latn |
| 日本語 | 日语 | ja |
Jpan |
| 한국어 | 韩语 | ko |
Kore |
| Latviešu | 拉脱维亚语 | lv |
Latn |
| Lietuvių | 立陶宛语 | lt |
Latn |
| Македонски | 马其顿语 | mk |
Cyrl |
| Bahasa Melayu | 马来语 | ms |
Latn |
| മലയാളം | 马拉雅拉姆语 | ml |
Mlym |
| मराठी | 马拉地语 | mr |
Deva |
| नेपाली | 尼泊尔语 | ne |
Deva |
| Norsk | 挪威语 | no |
Latn; Bokmål |
| فارسی | 波斯语 | fa |
Arab |
| Polski | 波兰语 | pl |
Latn |
| Português | 葡萄牙语 | pt |
Latn; 巴西 |
| Română | 罗马尼亚语 | ro |
Latn |
| Русский | 俄语 | ru |
Cyrl |
| Русский (старая орфография) | 俄语 | ru-PETR1708 |
Cyrl; 旧拼字法 |
| Српски | 塞尔维亚语 | sr |
Cyrl 与 Latn |
| Српски (латиница) | 塞尔维亚语 | sr-Latn |
Latn |
| Slovenčina | 斯洛伐克语 | sk |
Latn |
| Slovenščina | 斯洛维尼亚语 | sl |
Latn |
| Español | 西班牙语 | es |
Latn; 欧洲 |
| Svenska | 瑞典语 | sv |
Latn |
| 塔加路文 | 塔加路文 | tl |
Latn |
| Türkçe | 土耳其语 | tr |
Latn |
| Українська | 乌克兰语 | uk |
Cyrl |
| Tiếng Việt | 越南语 | vi |
Latn |
| 意第绪语 | 意第绪语 | yi |
Hebr |
实验性语言
实验性语言正处于积极开发阶段,但不会进行评估。如需按语言过滤,请在以下字段中输入语言:
| 语言 | 语言(中文名称) | 语言提示代码 | 脚本和备注 |
|---|---|---|---|
| Αρχαία ελληνικά | 古希腊语 | grc |
Grek |
| Azərbaycan | 阿塞拜疆语 | az |
Latn |
| Azərbaycan (qədim yazı) | 阿塞拜疆语 | az-Cyrl |
Cyrl; 旧拼字法 |
| Euskara | 巴斯克语 | eu |
Latn |
| Bosanski | 波斯尼亚语 | bs |
Latn |
| 宿务语 | 宿务语 | ceb |
Latn |
| 世界语 | 世界语 | eo |
Latn |
| Galego | 加利西亚语 | gl |
Latn |
| ქართული | 格鲁吉亚语 | ka |
Geor |
| Kreyòl Ayisyen | 海地克里奥尔语 | ht |
Latn |
| Gaeilge | 爱尔兰语 | ga |
Latn |
| Jawa | 爪哇语 | jv |
Latn |
| Қазақ | 哈萨克语 | kk |
Cyrl |
| 吉尔吉斯语 | 吉尔吉斯语 | ky |
Cyrl |
| Latine | 拉丁语 | la |
Latn |
| Malti | 马耳他语 | mt |
Latn |
| Монгол | 蒙古语 | mn |
Cyrl |
| پښتو | 普什图语 | ps |
Arab |
| संस्कृतम् | 梵语 | sa |
Deva |
| 斯瓦希里语 | 斯瓦希里语 | sw |
Latn |
| اردو | 乌尔都语 | ur |
Arab |
| oʻzbekcha | 乌兹别克语 | uz |
Latn; 拉丁美洲 |
| oʻzbekcha | 乌兹别克语 | uz-Cyrl |
Cyrl; 旧拼字法 |
| Cymraeg | 威尔士语 | cy |
Latn |
| IsiZulu | 祖鲁语 | zu |
Latn |
映射语言
映射的语言会关联到其他语言代码或常规字符识别器。如需按语言过滤,请在以下字段中输入语言:
| 语言 | 语言(中文名称) | 语言提示代码 | 脚本和备注 | 映射到 |
|---|---|---|---|---|
| بهسا اچيه | 亚齐语 | ace |
Latn | 拉丁字母文字模式 |
| Lwo | 阿乔利语 | ach |
Latn | 拉丁字母文字模式 |
| 当梅语 | Adangme | ada |
Latn | 拉丁字母文字模式 |
| 阿坎语 | 阿坎语 | ak |
Latn | 拉丁字母文字模式 |
| Anicinâbemowin | 阿尔贡金语 | alg |
Latn | 拉丁字母文字模式 |
| Mapudungu | 阿洛柯语/马普切语 | arn |
Latn | 拉丁字母文字模式 |
| Asturianu | 阿斯图里亚斯语 | ast |
Latn | 拉丁字母文字模式 |
| Dene | 阿萨巴斯卡语 | ath |
Latn | 拉丁字母文字模式 |
| Aymar aru | 艾马拉语 | ay |
Latn | 拉丁字母文字模式 |
| Bhāṣa Bali | 巴厘文 | ban |
Latn | 拉丁字母文字模式 |
| Bamanankan | 班巴拉语 | bm |
Latn | 拉丁字母文字模式 |
| Narrow Bantu | 班图语 | bnt |
Latn | 拉丁字母文字模式 |
| башҡорт теле | 巴什基尔语 | ba |
Cyrl | 西里尔字母文字模式 |
| Toba–Batak | 巴塔克文 | btk |
Latn | 拉丁字母文字模式 |
| Chibemba | 奔巴语 | bem |
Latn | 拉丁字母文字模式 |
| Bikol Naga | 比科尔语 | bik |
Latn | 拉丁字母文字模式 |
| Bichelamar | 比斯拉马语 | bi |
Latn | 拉丁字母文字模式 |
| Brezhoneg | 布列塔尼语 | br |
Latn | 拉丁字母文字模式 |
| нохчийн мотт / noxçiyn mott | 车臣语 | ce |
Cyrl | 西里尔字母文字模式 |
| 汉语 | 中文 | zh-Hans |
Hans; 简体; 普通话 | zh |
| 漢語 | 中文 | zh-Hant |
Hant; 繁体; 繁体中文 | zh |
| 普通話 | 中文 | zh-Hant-HK |
Hant; 香港繁体; 香港 | zh |
| Chahta' | 乔克托语 | cho |
Latn | 拉丁字母文字模式 |
| Чӑвашла | 楚瓦什语 | cv |
Cyrl | 西里尔字母文字模式 |
| Cree–Montagnais–Naskapi | 克里语 | cr |
Latn | 拉丁字母文字模式 |
| Mvskoke | Creek | mus |
Latn | 拉丁字母文字模式 |
| qırımtatar tili, къырымтатар тили | 克里米亚鞑靼语 | crh |
Latn | 西里尔字母文字模式 |
| Dakhótiyapi, Dakȟótiyapi | Dakota | dak |
Latn | 拉丁字母文字模式 |
| 杜阿拉 | Duala | dua |
Latn | 拉丁字母文字模式 |
| Ikɔ Efik | 埃菲克语 | efi |
Latn | 拉丁字母文字模式 |
| 英语(英国) | 英语 | en-GB |
Latn; 英国 | en |
| Èʋegbe | 埃维语 | ee |
Latn | 拉丁字母文字模式 |
| føroyskt mál | 法罗语 | fo |
Latn | 拉丁字母文字模式 |
| Na Vosa Vakaviti | 斐济语 | fj |
Latn | 拉丁字母文字模式 |
| fɔ̀ngbè | 丰族语 | fon |
Latn | 拉丁字母文字模式 |
| Français canadien | 法语 | fr-CA |
Latn; 加拿大 | fr |
| Fulani, Fulah, Peul | Fulah | ff |
Latn | 拉丁字母文字模式 |
| Gã | 加 (Ga) 语 | gaa |
Latn | 拉丁字母文字模式 |
| 卢干达语 | 干达语 | lg |
Latn | 拉丁字母文字模式 |
| Basa Gayo | 卡约语 | gay |
Latn | 拉丁字母文字模式 |
| 基里巴斯 | 吉尔伯特语 | gil |
Latn | 拉丁字母文字模式 |
| 哥特文 | 哥特文 | got |
Latn | 拉丁字母文字模式 |
| Guaraní | 瓜拉尼人 | gn |
Latn | 拉丁字母文字模式 |
| Harshen/Halshen Hausa هَرْشَن هَوْسَ | 豪萨语 | ha |
Latn | 拉丁字母文字模式 |
| ʻŌlelo Hawaiʻi | 夏威夷语 | haw |
Latn | 拉丁字母文字模式 |
| Otjiherero | 赫雷罗语 | hz |
Latn | 拉丁字母文字模式 |
| Ilonggo | 希利盖农语 | hil |
Latn | 拉丁字母文字模式 |
| Jaku Iban | 伊班语 | iba |
Latn | 拉丁字母文字模式 |
| Asụsụ Igbo | 伊博语 | ig |
Latn | 拉丁字母文字模式 |
| Ilokano | 伊洛果语 | ilo |
Latn | 拉丁字母文字模式 |
| Taqbaylit | 卡拜尔语 | kab |
Latn | 拉丁字母文字模式 |
| 景颇语 | 克钦语 | kac |
Latn | 拉丁字母文字模式 |
| 格陵兰语 | 格陵兰语 | kl |
Latn | 拉丁字母文字模式 |
| Kikamba | 卡姆巴语 | kam |
Latn | 拉丁字母文字模式 |
| 卡努里语 | 卡努里语 | kr |
Latn | 拉丁字母文字模式 |
| Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى | 卡拉卡尔帕克语 | kaa |
Cyrl/Latn | 西里尔字母文字模式 |
| Ka Ktien Khasi | 卡西语 | kha |
Latn | 拉丁字母文字模式 |
| Gĩkũyũ | 吉库尤语 | ki |
Latn | 拉丁字母文字模式 |
| 卢旺达语 | 卢旺达语 | rw |
Latn | 拉丁字母文字模式 |
| коми кыв | 科米语 | kv |
Cyrl | 西里尔字母文字模式 |
| Kikongo | 刚果语 | kg |
Latn | 拉丁字母文字模式 |
| 科斯拉伊语 | 科斯拉伊语 | kos |
Latn | 拉丁字母文字模式 |
| Oshikwanyama | 宽尼亚玛语 | kj |
Latn | 拉丁字母文字模式 |
| Ngala | 林加拉语 | ln |
Latn | 拉丁字母文字模式 |
| Plattdütsch, Plattdeutsch, Nedersaksisch | 低地德语 | nds |
Latn | 拉丁字母文字模式 |
| siLozi | Lozi | loz |
Latn | 拉丁字母文字模式 |
| Kiluba | 卢巴加丹加语 | lu |
Latn | 拉丁字母文字模式 |
| Dholuo | 卢奥语 | luo |
Latn | 拉丁字母文字模式 |
| Madhura, Basa Mathura, بَهاسَ مَدورا | 马都拉语 | mad |
Latn | 拉丁字母文字模式 |
| 马尔加什语 | 马尔加什语 | mg |
Latn | 拉丁字母文字模式 |
| Mandinka, لغة مندنكا | 曼丁果语 | man |
Latn | 拉丁字母文字模式 |
| Gaelg, Gailck | 马恩岛语 | gv |
Latn | 拉丁字母文字模式 |
| Te reo Māori | 毛利语 | mi |
Latn | 拉丁字母文字模式 |
| 埃崩 | 马绍尔语 | mh |
Latn | 拉丁字母文字模式 |
| Mɛnde yia | 门德语 | men |
Latn | 拉丁字母文字模式 |
| 中古英语 | 中古英语 | enm |
Latn | 拉丁字母文字模式 |
| Mittelhochdeutsch | 中古高地德语 | gmh |
Latn | 拉丁字母文字模式 |
| Baso Minangkabau, باسو مينڠكاباو | 米南佳保语 | min |
Latn | 拉丁字母文字模式 |
| Kanienʼkéha | Mohawk | moh |
Latn | 拉丁字母文字模式 |
| Nkundu | Mongo | lol |
Latn | 拉丁字母文字模式 |
| Nāhuatl | 纳瓦特尔语 | nah |
Latn | 拉丁字母文字模式 |
| Diné bizaad | 纳瓦霍语 | nv |
Latn | 拉丁字母文字模式 |
| 恩东加语 | 恩东加语 | ng |
Latn | 拉丁字母文字模式 |
| ko e vagahau Niuē | 纽埃语 | niu |
Latn | 拉丁字母文字模式 |
| 津巴布韦恩德贝莱 | 北恩德贝勒语 | nd |
Latn | 拉丁字母文字模式 |
| 塞索托萨莱博亚 | 北索托语 | nso |
Latn | 拉丁字母文字模式 |
| 奇切瓦,钦亚尼亚 | 尼昂加语 | ny |
Latn | 拉丁字母文字模式 |
| 鲁扬科雷 | 尼扬科莱语 | nyn |
Latn | 拉丁字母文字模式 |
| Chitonga | 汤加语(尼亚萨地区) | tog |
Latn | 拉丁字母文字模式 |
| Appolo | 恩济马语 | nzi |
Latn | 拉丁字母文字模式 |
| Occitan, lenga d'òc, provençal | 奥克斯坦语 | oc |
Latn | 拉丁字母文字模式 |
| Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ | 奥杰布瓦语 | oj |
Latn | 拉丁字母文字模式 |
| Ænglisc, Englisc, Anglisc | 古英语 | ang |
Latn | 拉丁字母文字模式 |
| Franceis, François, Romanz | 古法语 | fro |
Latn | 拉丁字母文字模式 |
| Diutisk, Althochdeutsch | 古高地德语 | goh |
Latn | 拉丁字母文字模式 |
| Dǫnsk tunga | 古诺斯语 | non |
Latn | 拉丁字母文字模式 |
| 奥克斯坦语 | 古普罗文斯语 | pro |
Latn | 拉丁字母文字模式 |
| ирон ӕвзаг | 奥塞特语 | os |
Cyrl | 西里尔字母文字模式 |
| 邦板牙语 | Pampanga | pam |
Latn | 拉丁字母文字模式 |
| Salitan Pangasinan | 邦阿西楠语 | pag |
Latn | 拉丁字母文字模式 |
| Papiamentu | 帕皮阿门托语 | pap |
Latn | 拉丁字母文字模式 |
| Português (Portugal) | 葡萄牙语 | pt-PT |
Latn; 欧洲 | pt |
| Kechua / Runa Simi | 克丘亚语 | qu |
Latn | 拉丁字母文字模式 |
| Rumantsch | 罗曼什语 | rm |
Latn | 拉丁字母文字模式 |
| Romani čhib | 吉普赛语 | rom |
Latn | 拉丁字母文字模式 |
| Ikirundi | 隆迪语 | rn |
Latn | 拉丁字母文字模式 |
| 萨哈语 | 萨哈语 | sah |
Cyrl | 西里尔字母文字模式 |
| Gagana faʻa Sāmoa | 萨摩亚语 | sm |
Latn | 拉丁字母文字模式 |
| yângâ tî sängö | 桑戈语 | sg |
Latn | 拉丁字母文字模式 |
| (Braid) Scots, Lallans, Doric | 苏格兰语 | sco |
Latn | 拉丁字母文字模式 |
| Gàidhlig | 苏格兰盖尔语 | gd |
Latn | 拉丁字母文字模式 |
| chiShona | 修纳语 | sn |
Latn | 拉丁字母文字模式 |
| Songhay | Songhai | son |
Latn | 拉丁字母文字模式 |
| 塞索托语 | 南索托语 | st |
Latn | 拉丁字母文字模式 |
| Español (Latinoamérica) | 西班牙语 | es-419 |
Latn; 拉丁美洲 | es |
| ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda | 巽他语 | su |
Latn | 拉丁字母文字模式 |
| siSwati | 斯瓦特语 | ss |
Latn | 拉丁字母文字模式 |
| Reo Tahiti | 塔希提语 | ty |
Latn | 拉丁字母文字模式 |
| тоҷикӣ | 塔吉克语 | tg |
Cyrl | 西里尔字母文字模式 |
| татар теле | 鞑靼语 | tt |
Cyrl/Latn | 西里尔字母文字模式 |
| KʌThemnɛ | 提姆语 | tem |
Latn | 拉丁字母文字模式 |
| lea faka-Tonga | 汤加语 | to |
Latn | 拉丁字母文字模式 |
| Xitsonga | 聪加语 | ts |
Latn | 拉丁字母文字模式 |
| Setswana | 茨瓦纳语 | tn |
Latn | 拉丁字母文字模式 |
| Türkmençe | 土库曼语 | tk |
Latn | 西里尔字母文字模式 |
| удмурт кыл | 乌德穆尔特语 | udm |
Cyrl | 西里尔字母文字模式 |
| Tshivenḓa | 文达语 | ve |
Latn | 拉丁字母文字模式 |
| Vod | 沃提克语 | vot |
Cyrl/Latn | 西里尔字母文字模式 |
| Frysk | 西弗里西亚语 | fy |
Latn | 拉丁字母文字模式 |
| 沃洛夫语 | 沃洛夫语 | wo |
Latn | 拉丁字母文字模式 |
| isiXhosa | 科萨语 | xh |
Latn | 拉丁字母文字模式 |
| Èdè Yorùbá | 约鲁巴语 | yo |
Latn | 拉丁字母文字模式 |
| Diidxazá | Zapotec | zap |
Latn | 拉丁字母文字模式 |
手写文字
本部分包含支持手写识别的文字。如需了解哪些语言使用每种文字,请参阅受支持的语言、实验性语言和映射的语言的相关表格。如需按脚本过滤,请在以下字段中输入脚本:
| 脚本标记 | 名称 | 支持级别 |
|---|---|---|
| Beng | 孟加拉文 | 实验性 |
| Cyrl | 西里尔文 | 实验性 |
| Deva | 梵文 | 实验性 |
| Grek | 希腊文 | 实验性 |
| 哈尼语 | 中文 | 实验性 |
| Jpan | 日语 | 支持 |
| Kore | 韩语 | 支持 |
| Latn | 拉丁文 | 支持 |
| vi | 越南语 | 实验性 |