Google Distributed Cloud (GDC) 實體隔離設備的文字辨識功能可偵測多種語言,並在單一圖片中偵測多種語言。
您可以為光學字元辨識 (OCR) API 要求指定選用的語言提示。舉例來說,如果 API 無法偵測圖片中使用的語言,您可能需要提供提示。
如要指定選用的語言提示,請在 BatchAnnotateImages 或 BatchAnnotateFiles 要求的 image_context 欄位中,以 language_hints 欄位中的值清單形式新增提示。
language_hints 格式採用下列 BCP 47 語言代碼格式設定規範:
language["-" script] ["-" region] *("-" variant) *("-" extension) ["-" privateuse]
舉例來說,語言提示 en-t-i0-handwrit 表示語言為「從手寫轉換的英文」。
文字辨識功能支援三種語言層級:
- 我們會定期評估成效,優先支援支援的語言。
- 實驗語言仍處於積極開發階段。他們沒有定期進行績效評估。
- 對應的語言可透過對應至其他語言代碼或一般字元辨識器來支援。舉例來說,
en-GB支援文字辨識,但系統不會以不同方式處理en。OCR 服務會嘗試在entity欄位中傳回正確的對應語言代碼。不過,相應語言比完全或實驗性支援的語言更容易誤判。
OCR 服務的主要功能之一是偵測及擷取圖片中的文字。例如手寫文字。如需手寫辨識功能支援的手寫文字清單,請參閱「手寫文字」。
支援的語言
文字辨識功能會優先處理支援的語言,並定期評估。如要依語言篩選,請在下列欄位中輸入語言:
| 語言 | 語言 (英文名稱) | 語言提示代碼 | 腳本和附註 |
|---|---|---|---|
| 南非荷蘭文 | 南非荷蘭文 | af |
Latn |
| shqip | 阿爾巴尼亞文 | sq |
Latn |
| العربية | 阿拉伯文 | ar |
阿拉伯文;現代標準 |
| беларуская | 白俄羅斯語 | be |
Cyrl |
| български | 保加利亞文 | bg |
Cyrl |
| Català | 加泰隆尼亞文 | ca |
Latn |
| 普通話 | 中文 | zh |
漢斯/漢特 |
| Hrvatski | 克羅埃西亞文 | hr |
Latn |
| Čeština | 捷克文 | cs |
Latn |
| Dansk | 丹麥文 | da |
Latn |
| Nederlands | 荷蘭文 | nl |
Latn |
| 英文 | 英文 | en |
Latn; American |
| Eesti keel | 愛沙尼亞 | et |
Latn |
| 菲律賓文 | 菲律賓文 | fil或tl |
Latn |
| Suomi | 芬蘭文 | fi |
Latn |
| Français | 法文 | fr |
Latn; European |
| Deutsch | 德文 | de |
Latn |
| Ελληνικά | 希臘文 | el |
Grek |
| עברית | 希伯來文 | iw |
Hebr |
| हिन्दी | 北印度文 | hi |
戴瓦 |
| Magyar | 匈牙利文 | hu |
Latn |
| Íslenska | 冰島文 | is |
Latn |
| Bahasa Indonesia | 印尼文 | id |
Latn |
| Italiano | 義大利文 | it |
Latn |
| 日本語 | 日文 | ja |
日本 |
| 한국어 | 韓文 | ko |
Kore |
| Latviešu | 拉脫維亞文 | lv |
Latn |
| Lietuvių | 立陶宛文 | lt |
Latn |
| Македонски | 馬其頓文 | mk |
Cyrl |
| 馬來文 | 馬來文 | ms |
Latn |
| മലയാളം | 馬拉雅拉姆文 | ml |
Mlym |
| मराठी | 馬拉地文 | mr |
戴瓦 |
| नेपाली | 尼泊爾文 | ne |
戴瓦 |
| Norsk | 挪威文 | no |
Latn; Bokmål |
| فارسی | 波斯文 | fa |
阿拉伯 |
| Polski | 波蘭文 | pl |
Latn |
| Português | 葡萄牙文 | pt |
Latn;巴西 |
| Română | 羅馬尼亞文 | ro |
Latn |
| Русский | 俄文 | ru |
Cyrl |
| Русский (старая орфография) | 俄文 | ru-PETR1708 |
Cyrl; Old Orthography |
| Српски | 塞爾維亞文 | sr |
Cyrl & Latn |
| Српски (латиница) | 塞爾維亞文 | sr-Latn |
Latn |
| Slovenčina | 斯洛伐克文 | sk |
Latn |
| Slovenščina | 斯洛維尼亞文 | sl |
Latn |
| Español | 西班牙文 | es |
Latn; European |
| Svenska | 瑞典文 | sv |
Latn |
| 塔加路文 | 塔加路文 | tl |
Latn |
| Türkçe | 土耳其文 | tr |
Latn |
| Українська | 烏克蘭文 | uk |
Cyrl |
| Tiếng Việt | 越南文 | vi |
Latn |
| 意第緒語 | 意第緒語 | yi |
Hebr |
實驗語言
實驗語言仍在積極開發中,尚未經過評估。如要依語言篩選,請在下列欄位中輸入語言:
| 語言 | 語言 (英文名稱) | 語言提示代碼 | 腳本和附註 |
|---|---|---|---|
| Αρχαία ελληνικά | 古希臘文 | grc |
Grek |
| Azərbaycan | 阿塞拜疆語 | az |
Latn |
| Azərbaycan (qədim yazı) | 阿塞拜疆語 | az-Cyrl |
Cyrl; old orthography |
| Euskara | 巴斯克文 | eu |
Latn |
| Bosanski | 波士尼亞文 | bs |
Latn |
| 宿霧文 | 宿霧文 | ceb |
Latn |
| 世界文 | 世界文 | eo |
Latn |
| Galego | 加里西亞文 | gl |
Latn |
| ქართული | 喬治亞文 | ka |
Geor |
| Kreyòl Ayisyen | 海地克里奧爾文 | ht |
Latn |
| Gaeilge | 愛爾蘭文 | ga |
Latn |
| Jawa | 爪哇文 | jv |
Latn |
| Қазақ | 哈薩克文 | kk |
Cyrl |
| 吉爾吉斯文 | 吉爾吉斯文 | ky |
Cyrl |
| Latine | 拉丁文 | la |
Latn |
| Malti | 馬耳他文 | mt |
Latn |
| Монгол | 蒙古文 | mn |
Cyrl |
| پښتو | 普什圖文 | ps |
阿拉伯 |
| संस्कृतम् | 梵文 | sa |
戴瓦 |
| 斯瓦希里文 | 斯瓦希里文 | sw |
Latn |
| اردو | 烏都文 | ur |
阿拉伯 |
| oʻzbekcha | 烏茲別克文 | uz |
Latn;拉丁文 |
| oʻzbekcha | 烏茲別克文 | uz-Cyrl |
Cyrl; old orthography |
| Cymraeg | 威爾斯文 | cy |
Latn |
| IsiZulu | 祖魯語 | zu |
Latn |
對應的語言
對應語言會與其他語言代碼或一般字元辨識器建立關聯。如要依語言篩選,請在下列欄位中輸入語言:
| 語言 | 語言 (英文名稱) | 語言提示代碼 | 腳本和附註 | 對應至 |
|---|---|---|---|---|
| بهسا اچيه | 亞齊語 | ace |
Latn | 拉丁字母模型 |
| Lwo | 阿喬利語 | ach |
Latn | 拉丁字母模型 |
| 丹格貝文 | 阿當莫文 | ada |
Latn | 拉丁字母模型 |
| 阿肯文 | 阿肯文 | ak |
Latn | 拉丁字母模型 |
| Anicinâbemowin | 阿爾岡昆語 | alg |
Latn | 拉丁字母模型 |
| 馬普切文 | Araucanian/Mapuche | arn |
Latn | 拉丁字母模型 |
| 阿斯圖里亞斯文 | 阿斯圖里亞斯文 | ast |
Latn | 拉丁字母模型 |
| Dene | Athabaskan | ath |
Latn | 拉丁字母模型 |
| Aymar aru | 艾馬拉文 | ay |
Latn | 拉丁字母模型 |
| Bhāṣa Bali | 峇里文 | ban |
Latn | 拉丁字母模型 |
| Bamanankan | 班巴拉文 | bm |
Latn | 拉丁字母模型 |
| 窄幅班圖語 | 班圖 | bnt |
Latn | 拉丁字母模型 |
| башҡорт теле | 巴什噶爾語 | ba |
Cyrl | 西里爾字母模型 |
| 多巴巴塔克語 | 巴塔克文 | btk |
Latn | 拉丁字母模型 |
| 奇本巴文 | 本巴語 | bem |
Latn | 拉丁字母模型 |
| 比科爾文納加 | 比科爾語 | bik |
Latn | 拉丁字母模型 |
| 比切拉馬爾語 | 碧斯拉瑪文 | bi |
Latn | 拉丁字母模型 |
| Brezhoneg | 布列塔尼語 | br |
Latn | 拉丁字母模型 |
| нохчийн мотт / noxçiyn mott | 車臣文 | ce |
Cyrl | 西里爾字母模型 |
| 汉语 | 中文 | zh-Hans |
簡體中文;華語 | zh |
| 漢語 | 中文 | zh-Hant |
Hant; Traditional; Mandarin | zh |
| 普通話 | 中文 | zh-Hant-HK |
Hant; Mandarin; Hong Kong | zh |
| Chahta' | 查克托文 | cho |
Latn | 拉丁字母模型 |
| Чӑвашла | 楚瓦什語 | cv |
Cyrl | 西里爾字母模型 |
| 克里文 - 蒙塔奈斯文 - 納斯卡皮文 | 克里文 | cr |
Latn | 拉丁字母模型 |
| Mvskoke | 小溪 | mus |
Latn | 拉丁字母模型 |
| qırımtatar tili, къырымтатар тили | 克里米亞韃靼語 | crh |
Latn | 西里爾字母模型 |
| Dakhótiyapi、Dakȟótiyapi | Dakota | dak |
Latn | 拉丁字母模型 |
| 杜阿拉 | Duala | dua |
Latn | 拉丁字母模型 |
| Ikɔ Efik | 埃菲克文 | efi |
Latn | 拉丁字母模型 |
| 英文 (英國) | 英文 | en-GB |
Latn; British | en |
| Èʋegbe | 埃維文 | ee |
Latn | 拉丁字母模型 |
| føroyskt mál | 法羅語 | fo |
Latn | 拉丁字母模型 |
| Na Vosa Vakaviti | 斐濟語 | fj |
Latn | 拉丁字母模型 |
| fɔ̀ngbè | 豐文 | fon |
Latn | 拉丁字母模型 |
| Français canadien | 法文 | fr-CA |
Latn; Canadian | fr |
| 富拉尼文、富拉文、富爾文 | 富拉文 | ff |
Latn | 拉丁字母模型 |
| Gã | 加語 | gaa |
Latn | 拉丁字母模型 |
| 盧干達文 | 干達文 | lg |
Latn | 拉丁字母模型 |
| 嘉佑文 | 嘉佑文 | gay |
Latn | 拉丁字母模型 |
| 吉里巴斯 | 吉里巴斯文 | gil |
Latn | 拉丁字母模型 |
| 歌德文 | 歌德文 | got |
Latn | 拉丁字母模型 |
| 瓜拉尼語 | 瓜拉尼語 | gn |
Latn | 拉丁字母模型 |
| Harshen/Halshen Hausa هَرْشَن هَوْسَ | 豪薩文 | ha |
Latn | 拉丁字母模型 |
| ʻŌlelo Hawaiʻi | 夏威夷文 | haw |
Latn | 拉丁字母模型 |
| Otjiherero | Herero | hz |
Latn | 拉丁字母模型 |
| Ilonggo | 希里蓋農語 | hil |
Latn | 拉丁字母模型 |
| Jaku Iban | 伊邦文 | iba |
Latn | 拉丁字母模型 |
| Asụsụ Igbo | 伊博文 | ig |
Latn | 拉丁字母模型 |
| 伊洛卡諾文 | 伊洛果語 | ilo |
Latn | 拉丁字母模型 |
| Taqbaylit | Kabyle | kab |
Latn | 拉丁字母模型 |
| 景頗文 | 克欽文 | kac |
Latn | 拉丁字母模型 |
| 克拉蘇特文 | 克拉蘇特文 | kl |
Latn | 拉丁字母模型 |
| 基坎巴文 | 坎巴文 | kam |
Latn | 拉丁字母模型 |
| 卡努里文 | 卡努里文 | kr |
Latn | 拉丁字母模型 |
| Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى | 卡拉卡爾帕克文 | kaa |
Cyrl/Latn | 西里爾字母模型 |
| Ka Ktien Khasi | 卡西文 | kha |
Latn | 拉丁字母模型 |
| Gĩkũyũ | 基庫猶文 | ki |
Latn | 拉丁字母模型 |
| 盧安達文 | 盧安達文 | rw |
Latn | 拉丁字母模型 |
| коми кыв | 科米文 | kv |
Cyrl | 西里爾字母模型 |
| 剛果文 | 剛果文 | kg |
Latn | 拉丁字母模型 |
| 科斯雷文 | 科斯雷文 | kos |
Latn | 拉丁字母模型 |
| Oshikwanyama | Kuanyama | kj |
Latn | 拉丁字母模型 |
| Ngala | 林格拉文 | ln |
Latn | 拉丁字母模型 |
| Plattdütsch、Plattdeutsch、Nedersaksisch | 低地德語 | nds |
Latn | 拉丁字母模型 |
| siLozi | 洛齊文 | loz |
Latn | 拉丁字母模型 |
| Kiluba | 盧巴卡坦加文 | lu |
Latn | 拉丁字母模型 |
| 盧歐文 | 盧歐語 | luo |
Latn | 拉丁字母模型 |
| Madhura、Basa Mathura、بَهاسَ مَدورا | 馬都拉文 | mad |
Latn | 拉丁字母模型 |
| 馬達加斯加文 | 馬達加斯加文 | mg |
Latn | 拉丁字母模型 |
| 曼丁卡文,لغة مندنكا | 曼丁哥文 | man |
Latn | 拉丁字母模型 |
| Gaelg、Gailck | 曼島文 | gv |
Latn | 拉丁字母模型 |
| Te reo Māori | 毛利文 | mi |
Latn | 拉丁字母模型 |
| Ebon | 馬紹爾文 | mh |
Latn | 拉丁字母模型 |
| Mɛnde yia | 曼德族文 | men |
Latn | 拉丁字母模型 |
| 中古英語 | 中古英語 | enm |
Latn | 拉丁字母模型 |
| Mittelhochdeutsch | 中古高地德語 | gmh |
Latn | 拉丁字母模型 |
| Baso Minangkabau, باسو مينڠكاباو | 米南佳保文 | min |
Latn | 拉丁字母模型 |
| 卡尼恩凱哈文 | Mohawk | moh |
Latn | 拉丁字母模型 |
| Nkundu | Mongo | lol |
Latn | 拉丁字母模型 |
| 納瓦特爾文 | 納瓦特爾文 | nah |
Latn | 拉丁字母模型 |
| Diné bizaad | 納瓦伙文 | nv |
Latn | 拉丁字母模型 |
| 恩東佳文 | 恩東佳文 | ng |
Latn | 拉丁字母模型 |
| ko e vagahau Niuē | 紐埃文 | niu |
Latn | 拉丁字母模型 |
| 辛巴威恩德貝萊文 | 北恩德貝萊文 | nd |
Latn | 拉丁字母模型 |
| Sesotho sa Leboa | 北索托文 | nso |
Latn | 拉丁字母模型 |
| 齊切瓦文、奇尼安賈文 | 尼揚賈文 | ny |
Latn | 拉丁字母模型 |
| Runyankore | 尼揚科勒文 | nyn |
Latn | 拉丁字母模型 |
| 東加文 | 尼亞薩東加文 | tog |
Latn | 拉丁字母模型 |
| Appolo | Nzima | nzi |
Latn | 拉丁字母模型 |
| 奧克文、朗格多克文、普羅旺斯文 | 奧克語 | oc |
Latn | 拉丁字母模型 |
| Anishinaabemowin (ᐊᓂᔑᓈᐯᒧᐎᓐ) | 歐及布威文 | oj |
Latn | 拉丁字母模型 |
| Ænglisc、Englisc、Anglisc | 古英語 | ang |
Latn | 拉丁字母模型 |
| Franceis、François、Romanz | 古法文 | fro |
Latn | 拉丁字母模型 |
| Diutisk、Althochdeutsch | 古高地德語 | goh |
Latn | 拉丁字母模型 |
| Dǫnsk tunga | 古諾斯文 | non |
Latn | 拉丁字母模型 |
| Occitan ancian | 古普羅旺斯文 | pro |
Latn | 拉丁字母模型 |
| ирон ӕвзаг | 奧塞提文 | os |
Cyrl | 西里爾字母模型 |
| 邦板牙語 | 邦板牙 | pam |
Latn | 拉丁字母模型 |
| Salitan Pangasinan | 邦阿西楠語 | pag |
Latn | 拉丁字母模型 |
| Papiamentu | 帕皮阿門多語 | pap |
Latn | 拉丁字母模型 |
| Português (Portugal) | 葡萄牙文 | pt-PT |
Latn; European | pt |
| 克丘亞語 / Runa Simi | 克丘亞文 | qu |
Latn | 拉丁字母模型 |
| 羅曼斯文 | 羅曼斯文 | rm |
Latn | 拉丁字母模型 |
| 羅姆文 | 吉普賽文 | rom |
Latn | 拉丁字母模型 |
| Ikirundi | 基隆迪語 | rn |
Latn | 拉丁字母模型 |
| 薩哈文 | 薩哈文 | sah |
Cyrl | 西里爾字母模型 |
| Gagana faʻa Sāmoa | 薩摩亞文 | sm |
Latn | 拉丁字母模型 |
| yângâ tî sängö | 桑戈語 | sg |
Latn | 拉丁字母模型 |
| (Braid) Scots、Lallans、Doric | 低地蘇格蘭文 | sco |
Latn | 拉丁字母模型 |
| Gàidhlig | 蘇格蘭蓋爾文 | gd |
Latn | 拉丁字母模型 |
| chiShona | 修納文 | sn |
Latn | 拉丁字母模型 |
| 桑海 | 宋海 | son |
Latn | 拉丁字母模型 |
| 塞索托文 | 塞索托文 | st |
Latn | 拉丁字母模型 |
| Español (Latinoamérica) | 西班牙文 | es-419 |
Latn;拉丁美洲 | es |
| ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda | 巽他文 | su |
Latn | 拉丁字母模型 |
| siSwati | 史瓦濟語 | ss |
Latn | 拉丁字母模型 |
| Reo Tahiti | 塔希提文 | ty |
Latn | 拉丁字母模型 |
| тоҷикӣ | 塔吉克文 | tg |
Cyrl | 西里爾字母模型 |
| татар теле | 韃靼文 | tt |
Cyrl/Latn | 西里爾字母模型 |
| KʌThemnɛ | 譚姆恩族文 | tem |
Latn | 拉丁字母模型 |
| lea faka-Tonga | 東加文 | to |
Latn | 拉丁字母模型 |
| 尚加文 | 宗卡文 | ts |
Latn | 拉丁字母模型 |
| 塞茲瓦那文 | 札那語 | tn |
Latn | 拉丁字母模型 |
| Türkmençe | 土庫曼語 | tk |
Latn | 西里爾字母模型 |
| удмурт кыл | 烏德穆爾特文 | udm |
Cyrl | 西里爾字母模型 |
| Tshivenḓa | 溫達文 | ve |
Latn | 拉丁字母模型 |
| 隨選影片 | 沃特語 | vot |
Cyrl/Latn | 西里爾字母模型 |
| Frysk | 西弗里西亞文 | fy |
Latn | 拉丁字母模型 |
| 沃洛夫文 | 沃洛夫文 | wo |
Latn | 拉丁字母模型 |
| isiXhosa | 科薩文 | xh |
Latn | 拉丁字母模型 |
| Èdè Yorùbá | 約魯巴文 | yo |
Latn | 拉丁字母模型 |
| Diidxazá | Zapotec | zap |
Latn | 拉丁字母模型 |
手寫指令碼
這個部分包含手寫辨識功能支援的文字。如要瞭解每種文字使用的語言,請參閱支援、實驗性和對應語言的表格。如要依指令碼篩選,請在下列欄位中輸入指令碼:
| 指令碼標記 | 名稱 | 支援級別 |
|---|---|---|
| Beng | 孟加拉文 | 實驗功能 |
| Cyrl | 斯拉夫文 | 實驗功能 |
| 戴瓦 | 梵文 | 實驗功能 |
| Grek | 希臘文 | 實驗功能 |
| 哈尼文 | 中文 | 實驗功能 |
| 日本 | 日文 | 支援 |
| Kore | 韓文 | 支援 |
| Latn | 拉丁文 | 支援 |
| vi | 越南文 | 實驗功能 |