A funcionalidade de reconhecimento de texto da Cloud Vision API consegue detetar uma grande variedade de idiomas e pode detetar vários idiomas numa única imagem.
Não é necessário fornecer uma sugestão de idioma ao serviço, mas pode fazê-lo se o serviço tiver problemas em detetar o idioma usado na sua imagem.
Com o lançamento da DG de OCR de escrita manual, as imagens
com escrita manual já não requerem uma languageHints
flag de escrita manual
quando usam
DOCUMENT_TEXT_DETECTION
.
As sugestões de idioma opcionais
são especificadas no
ImageContext
de um pedido como uma lista de languageHints
para um pedido de
TEXT_DETECTION
e DOCUMENT_TEXT_DETECTION
.
Normalmente, cada parâmetro de código de idioma consiste num identificador BCP-47. Este parâmetro pode ter o formato language-region, em que language se refere ao idioma principal e o region opcional refere-se a uma região (normalmente, um identificador de país) de um dialeto específico. Por exemplo, o chinês pode ser representado como chinês simplificado, como é escrito na República Popular da China (zh-Hans
), ou chinês tradicional, como é escrito em Taiwan (zh-Hant
).
Existem três níveis de suporte de idiomas na funcionalidade de reconhecimento de texto:
- Os idiomas suportados são aqueles aos quais damos prioridade e em relação aos quais avaliamos regularmente o desempenho.
- Os idiomas experimentais são aqueles que estão em desenvolvimento ativo, mas não são avaliados regularmente.
- Os idiomas mapeados são os que são suportados através do respetivo mapeamento para outro código de idioma ou para um reconhecedor de carateres geral. Por exemplo, "
en-GB
" é suportado, mas não é tratado de forma diferente de "en
" para efeitos de reconhecimento de texto. Fazemos o nosso melhor para devolver o código do idioma mapeado correto no campo de localidade da entidade, mas é mais provável que os idiomas mapeados do que os idiomas totalmente suportados ou suportados experimentalmente sejam identificados incorretamente como um idioma semelhante.
A lista de idiomas (com os códigos languageHint
associados) suportados pelo
TEXT_DETECTION
e DOCUMENT_TEXT_DETECTION
é apresentada abaixo.
Se a sugestão de idioma for deixada em branco, vamos tentar detetar automaticamente o idioma mais adequado. O ponto final TEXT_DETECTION
deteta automaticamente apenas um subconjunto de idiomas suportados, enquanto o ponto final DOCUMENT_TEXT_DETECTION
deteta automaticamente o conjunto completo de idiomas suportados.
Idiomas suportados
Os seguintes idiomas são prioritários e avaliados regularmente.
Para filtrar por funcionalidades, escreva ou selecione diretamente o idioma pretendido no menu pendente:
Idioma | Idioma (nome em inglês) | Código languageHints |
Script | Notas | |
---|---|---|---|---|---|
Afrikaans | Afrikaans | af |
Latn |
||
shqip | Albanês | sq |
Latn |
||
العربية | Árabe | ar |
Arab |
Modern Standard | |
Հայ | Arménio | hy |
Armn |
||
беларуская | Bielorrusso | be |
Cyrl |
||
বাংলা | Bengali | bn |
Beng |
||
български | Búlgaro | bg |
Cyrl |
||
Català | Catalão | ca |
Latn |
||
普通话 | Chinês | zh |
Hans/Hant |
||
Hrvatski | Croata | hr |
Latn |
||
Čeština | Checo | cs |
Latn |
||
Dansk | Dinamarquês | da |
Latn |
||
Nederlands | Neerlandês | nl |
Latn |
||
English | Inglês | en |
Latn |
Americano | |
Eesti keel | Estónio | et |
Latn |
||
Filipino | Filipino | fil |
Latn |
||
Suomi | Finlandês | fi |
Latn |
||
Français | Francês | fr |
Latn |
Europeu | |
Deutsch | Alemão | de |
Latn |
||
Ελληνικά | Grego | el |
Grek |
||
ગુજરાતી | Gujarati | gu |
Gujr |
||
עברית | Hebraico | iw |
Hebr |
||
हिन्दी | Hindi | hi |
Deva |
||
Magyar | Húngaro | hu |
Latn |
||
Íslenska | Islandês | is |
Latn |
||
Bahasa Indonesia | Indonésio | id |
Latn |
||
Italiano | Italiano | it |
Latn |
||
日本語 | Japonês | ja |
Jpan |
||
ಕನ್ನಡ | Canará | kn |
Knda |
||
ភាសាខ្មែរ | Khmer | km |
Khmr |
||
한국어 | Coreano | ko |
Kore |
||
ລາວ | Laociano | lo |
Laoo |
||
Latviešu | Letão | lv |
Latn |
||
Lietuvių | Lituano | lt |
Latn |
||
Македонски | Macedónio | mk |
Cyrl |
||
Bahasa Melayu | Malaio | ms |
Latn |
||
മലയാളം | Malaiala | ml |
Mlym |
||
मराठी | Marati | mr |
Deva |
||
नेपाली | Nepalês | ne |
Deva |
||
Norsk | Norueguês | no |
Latn |
Bokmål | |
فارسی | Persa | fa |
Arab |
||
Polski | Polaco | pl |
Latn |
||
Português | Português | pt |
Latn |
Brasileiro | |
ਪੰਜਾਬੀ | Punjabi | pa |
Guru |
Gurmukhi | |
Română | Romeno | ro |
Latn |
||
Русский | Russo | ru |
Cyrl |
||
Русский (старая орфография) | Russo | ru-PETR1708 |
Cyrl |
Ortografia antiga | |
Српски | Sérvio | sr |
Cyrl |
||
Српски (латиница) | Sérvio | sr-Latn |
Latn |
||
Slovenčina | Eslovaco | sk |
Latn |
||
Slovenščina | Esloveno | sl |
Latn |
||
Español | Espanhol | es |
Latn |
Europeu | |
Svenska | Sueco | sv |
Latn |
||
Tagalog | Tagalo | tl |
Latn |
||
தமிழ் | Tamil | ta |
Taml |
||
తెలుగు | Telugu | te |
Telu |
||
ไทย | Tailandês | th |
Thai |
||
Türkçe | Turco | tr |
Latn |
||
Українська | Ucraniano | uk |
Cyrl |
||
Tiếng Việt | Vietnamita | vi |
Latn |
||
Yiddish | Iídiche | yi |
Hebr |
Idiomas experimentais
Os seguintes idiomas estão em desenvolvimento ativo e ainda não são avaliados regularmente.
Idioma | Idioma (nome em inglês) | Código languageHints |
Script | Notas | |
---|---|---|---|---|---|
አማርኛ | Amárico | am |
Ethi |
||
Αρχαία ελληνικά | Grego antigo | grc |
Grek |
||
অসমীয়া | Assamês | as |
Beng |
||
Azərbaycan | Azeri | az |
Latn |
||
Azərbaycan (qədim yazı) | Azeri | az-Cyrl |
Cyrl |
Ortografia antiga | |
Euskara | Basco | eu |
Latn |
||
Bosanski | Bósnio | bs |
Latn |
||
မြန်မာ | Birmanês | my |
Mymr |
||
Cebuano | Cebuano | ceb |
Latn |
||
ᏣᎳᎩ ᎦᏬᏂᎯᏍᏗ | Cherokee | chr |
Cher |
||
dhivehi, dhivehi-bas | Divehi | dv |
Thaa |
||
རྫོང་ཁ | Dzonkha | dz |
Tibt |
||
Esperanto | Esperanto | eo |
Latn |
||
Galego | Galego | gl |
Latn |
||
ქართული | Georgiana | ka |
Geor |
||
Kreyòl Ayisyen | Crioulo haitiano | ht |
Latn |
||
Gaeilge | Irlandês | ga |
Latn |
||
Jawa | Javanês | jv |
Latn |
||
Қазақ | Cazaque | kk |
Cyrl |
||
Kirghiz | Quirguiz | ky |
Cyrl |
||
Latine | Latim | la |
Latn |
||
Malti | Maltês | mt |
Latn |
||
Монгол | Mongol | mn |
Cyrl |
||
ଓଡ଼ିଆ | Oriya | or |
Orya |
||
پښتو | Pastó | ps |
Arab |
||
संस्कृतम् | Sânscrito | sa |
Deva |
||
සිංහල | Cingalês | si |
Sinh |
||
Swahili | Suaíli | sw |
Latn |
||
leššānā Suryāyā | Siríaco | syr |
Syriac |
||
བོད་སྐད་ | Tibetano | bo |
Tibt |
||
ትግርኛ | Tigrinya | ti |
Ethi |
||
اردو | Urdu | ur |
Arab |
||
oʻzbekcha | Usbeque | uz |
Latn |
Latim | |
oʻzbekcha | Usbeque | uz-Cyrl |
Cyrl |
Ortografia antiga | |
Cymraeg | Galês | cy |
Latn |
||
IsiZulu | Zulu | zu |
Latn |
Idiomas mapeados
Os seguintes idiomas estão mapeados para outro código de idioma ou para um reconhecedor de carateres geral.
Idioma | Idioma (nome em inglês) | Código languageHints |
Script | Notas | |
---|---|---|---|---|---|
بهسا اچيه | Achém | ace |
Latn |
Modelo latino | |
Lwo | Acholi | ach |
Latn |
Modelo latino | |
Dangme | Adangme | ada |
Latn |
Modelo latino | |
Akan | Akan | ak |
Latn |
Modelo latino | |
Anicinâbemowin | Algonquino | alg |
Latn |
Modelo latino | |
Mapudungu | Araucano/mapuche | arn |
Latn |
Modelo latino | |
Asturianu | Asturiano | ast |
Latn |
Modelo latino | |
Dene | Athabaskan | ath |
Latn |
Modelo latino | |
Aymar aru | Aimará | ay |
Latn |
Modelo latino | |
Bhāṣa Bali | Balinês | ban |
Latn |
Modelo latino | |
Bamanankan | Bambara | bm |
Latn |
Modelo latino | |
Narrow Bantu | Bantu | bnt |
Latn |
Modelo latino | |
башҡорт теле | Bashkir | ba |
Cyrl |
Modelo cirílico | |
Toba–Batak | Bataque | btk |
Latn |
Modelo latino | |
Chibemba | Bemba | bem |
Latn |
Modelo latino | |
Bikol Naga | Bikol | bik |
Latn |
Modelo latino | |
Bichelamar | Bislama | bi |
Latn |
Modelo latino | |
Brezhoneg | Bretão | br |
Latn |
Modelo latino | |
нохчийн мотт / noxçiyn mott | Checheno | ce |
Cyrl |
Modelo cirílico | |
汉语 | Chinês (mandarim, simplificado) | zh-Hans |
Hans |
Modelo chinês | |
漢語 | Chinês (mandarim, tradicional) | zh-Hant |
Hant |
Modelo chinês | |
普通話 | Chinês (mandarim, Hong Kong) | zh-Hant-HK |
Hant |
Modelo chinês | |
Chahta' | Choctaw | cho |
Latn |
Modelo latino | |
Чӑвашла | Chuvache | cv |
Cyrl |
Modelo cirílico | |
Cree–Montagnais–Naskapi | Cree | cr |
Latn |
Modelo latino | |
Mvskoke | Riacho | mus |
Latn |
Modelo latino | |
qırımtatar tili, къырымтатар тили | Tártaro da Crimeia | crh |
Latn |
Modelo cirílico | |
Dakhótiyapi, Dakȟótiyapi | Dakota | dak |
Latn |
Modelo latino | |
Douala | Duala | dua |
Latn |
Modelo latino | |
Ikɔ Efik | Efik | efi |
Latn |
Modelo latino | |
English (British) | Inglês (Reino Unido) | en-GB |
Latn |
Modelo latino | |
Èʋegbe | Ewe | ee |
Latn |
Modelo latino | |
føroyskt mál | Faroé | fo |
Latn |
Modelo latino | |
Na Vosa Vakaviti | Fijiano | fj |
Latn |
Modelo latino | |
fɔ̀ngbè | Fon | fon |
Latn |
Modelo latino | |
Français canadien | Francês (Canadá) | fr-CA |
Latn |
Modelo latino | |
Fulani, Fulah, Peul | Fula | ff |
Latn |
Modelo latino | |
Gã | Ga | gaa |
Latn |
Modelo latino | |
Luganda | Ganda | lg |
Latn |
Modelo latino | |
Basa Gayo | Gayo | gay |
Latn |
Modelo latino | |
Kiribati | Gilbertês | gil |
Latn |
Modelo latino | |
Gothic | Gótico | got |
Latn |
Modelo latino | |
Guaraní | Guarani | gn |
Latn |
Modelo latino | |
Harshen/Halshen Hausa هَرْشَن هَوْسَ | Haúça | ha |
Latn |
Modelo latino | |
ʻŌlelo Hawaiʻi | Havaiano | haw |
Latn |
Modelo latino | |
Otjiherero | Herero | hz |
Latn |
Modelo latino | |
Ilonggo | Hiligaynon | hil |
Latn |
Modelo latino | |
Jaku Iban | Iban | iba |
Latn |
Modelo latino | |
Asụsụ Igbo | Igbo | ig |
Latn |
Modelo latino | |
Ilokano | Iloko | ilo |
Latn |
Modelo latino | |
Taqbaylit | Kabyle | kab |
Latn |
Modelo latino | |
Jingpho | Kachin | kac |
Latn |
Modelo latino | |
Kalaallisut | Kalaallisut | kl |
Latn |
Modelo latino | |
Kikamba | Kikamba | kam |
Latn |
Modelo latino | |
Kanuri | Kanuri | kr |
Latn |
Modelo latino | |
Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى | Caracalpaque | kaa |
Cyrl/Latn |
Modelo cirílico | |
Ka Ktien Khasi | Khasi | kha |
Latn |
Modelo latino | |
Gĩkũyũ | Kikuyu | ki |
Latn |
Modelo latino | |
Kinyarwanda | Kinyarwanda | rw |
Latn |
Modelo latino | |
коми кыв | Komi | kv |
Cyrl |
Modelo cirílico | |
Kikongo | Conguês | kg |
Latn |
Modelo latino | |
Kosraean | Kosraean | kos |
Latn |
Modelo latino | |
Oshikwanyama | Cuanhama | kj |
Latn |
Modelo latino | |
Ngala | Lingala | ln |
Latn |
Modelo latino | |
Plattdütsch, Plattdeutsch, Nedersaksisch | Baixo-alemão | nds |
Latn |
Modelo latino | |
siLozi | Lozi | loz |
Latn |
Modelo latino | |
Kiluba | Luba-katanga | lu |
Latn |
Modelo latino | |
Dholuo | Luo | luo |
Latn |
Modelo latino | |
Madhura, Basa Mathura, بَهاسَ مَدورا | Madurês | mad |
Latn |
Modelo latino | |
Malagasy | Malgaxe | mg |
Latn |
Modelo latino | |
Mandinka, لغة مندنكا | Mandingo | man |
Latn |
Modelo latino | |
Gaelg, Gailck | Manquês | gv |
Latn |
Modelo latino | |
Te reo Māori | Maori | mi |
Latn |
Modelo latino | |
Ebon | Marshalês | mh |
Latn |
Modelo latino | |
Mɛnde yia | Mende | men |
Latn |
Modelo latino | |
Middle English | Inglês médio | enm |
Latn |
Modelo latino | |
Mittelhochdeutsch | Alto-alemão médio | gmh |
Latn |
Modelo latino | |
Baso Minangkabau, باسو مينڠكاباو | Minangkabau | min |
Latn |
Modelo latino | |
Kanienʼkéha | Mohawk | moh |
Latn |
Modelo latino | |
Nkundu | Mongo | lol |
Latn |
Modelo latino | |
Nāhuatl | Nauatle | nah |
Latn |
Modelo latino | |
Diné bizaad | Navajo | nv |
Latn |
Modelo latino | |
Ndonga | Ndonga | ng |
Latn |
Modelo latino | |
ko e vagahau Niuē | Niueano | niu |
Latn |
Modelo latino | |
Zimbabwe Ndebele | Ndebele do norte | nd |
Latn |
Modelo latino | |
Sesotho sa Leboa | Soto do Norte | nso |
Latn |
Modelo latino | |
Chichewa, Chinyanja | Nianja | ny |
Latn |
Modelo latino | |
Runyankore | Nyankole | nyn |
Latn |
Modelo latino | |
Chitonga | Nyasa tonga | tog |
Latn |
Modelo latino | |
Appolo | Nzima | nzi |
Latn |
Modelo latino | |
Occitan, lenga d'òc, provençal | Occitânico | oc |
Latn |
Modelo latino | |
Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ | Ojíbua | oj |
Latn |
Modelo latino | |
Ænglisc, Englisc, Anglisc | Inglês antigo | ang |
Latn |
Modelo latino | |
Franceis, François, Romanz | Francês antigo | fro |
Latn |
Modelo latino | |
Diutisk, Althochdeutsch | Alto-alemão antigo | goh |
Latn |
Modelo latino | |
Dǫnsk tunga | Nórdico antigo | non |
Latn |
Modelo latino | |
Occitan ancian | Provençal antigo | pro |
Latn |
Modelo latino | |
ирон ӕвзаг | Osseta | os |
Cyrl |
Modelo cirílico | |
Kapampangan | Pampanga | pam |
Latn |
Modelo latino | |
Salitan Pangasinan | Pangasinês | pag |
Latn |
Modelo latino | |
Papiamentu | Papiamento | pap |
Latn |
Modelo latino | |
Português (Portugal) | Português (europeu) | pt-PT |
Latn |
Modelo latino | |
Kechua / Runa Simi | Quíchua | qu |
Latn |
Modelo latino | |
Rumantsch | Romanche | rm |
Latn |
Modelo latino | |
Romani čhib | Romani | rom |
Latn |
Modelo latino | |
Ikirundi | Rundi | rn |
Latn |
Modelo latino | |
Sakha | Sakha | sah |
Cyrl |
Modelo cirílico | |
Gagana faʻa Sāmoa | Samoano | sm |
Latn |
Modelo latino | |
yângâ tî sängö | Sango | sg |
Latn |
Modelo latino | |
(Braid) Scots, Lallans, Doric | Escocês | sco |
Latn |
Modelo latino | |
Gàidhlig | Gaélico Escocês | gd |
Latn |
Modelo latino | |
chiShona | Shona | sn |
Latn |
Modelo latino | |
Songhay | Songai | son |
Latn |
Modelo latino | |
Sesotho | Sesoto | st |
Latn |
Modelo latino | |
Español (Latinoamérica) | Espanhol (latino-americano) | es-419 |
Latn |
Modelo latino | |
ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda | Sundanês | su |
Latn |
Modelo latino | |
siSwati | Suazi | ss |
Latn |
Modelo latino | |
Reo Tahiti | Taitiano | ty |
Latn |
Modelo latino | |
тоҷикӣ | Tajique | tg |
Cyrl |
Modelo cirílico | |
татар теле | Tártaro | tt |
Cyrl/Latn |
Modelo cirílico | |
KʌThemnɛ | Temne | tem |
Latn |
Modelo latino | |
lea faka-Tonga | Tonga | to |
Latn |
Modelo latino | |
Xitsonga | Tsonga | ts |
Latn |
Modelo latino | |
Setswana | Tsuana | tn |
Latn |
Modelo latino | |
Türkmençe | Turcomenistão | tk |
Latn |
Modelo cirílico | |
удмурт кыл | Udmurte | udm |
Cyrl |
Modelo cirílico | |
Tshivenḓa | Venda | ve |
Latn |
Modelo latino | |
Vod | Vótico | vot |
Cyrl/Latn |
Modelo cirílico | |
Frysk | Frísico ocidental | fy |
Latn |
Modelo latino | |
Wolof | Jalofo | wo |
Latn |
Modelo latino | |
isiXhosa | Xhosa | xh |
Latn |
Modelo latino | |
Èdè Yorùbá | Iorubá | yo |
Latn |
Modelo latino | |
Diidxazá | Zapotec | zap |
Latn |
Modelo latino |
Scripts de escrita manual
Os seguintes scripts são suportados para o reconhecimento de escrita manual. Consulte as tabelas de idiomas acima para ver os idiomas que usam cada script.
Script | Nome | Nível de apoio técnico |
---|---|---|
Beng |
Bengali | Experimental |
Cyrl |
Cirílico | Experimental |
Deva |
Devanagari | Experimental |
Grek |
Grego | Experimental |
Hani |
Chinês | Experimental |
Jpan |
Japonês | Suportado |
Kore |
Coreano | Suportado |
Latn |
Latim | Suportado |
vi |
Vietnamita | Experimental |