O recurso de reconhecimento de texto da API Cloud Vision consegue detectar uma grande variedade de idiomas, além de identificar vários idiomas dentro de uma única imagem.
Não é preciso dar dicas de idioma para o serviço. No entanto, isso poderá ser feito se houver dificuldade de detectar o idioma usado na imagem.
Com o lançamento do OCR de escrita à mão em disponibilidade geral, as imagens com manuscritos não precisam mais da flag languageHints
ao usar DOCUMENT_TEXT_DETECTION
.
As dicas de idioma opcionais são especificadas no ImageContext de uma solicitação como uma lista de languageHints
para uma solicitação TEXT_DETECTION
e DOCUMENT_TEXT_DETECTION
.
Cada parâmetro de código de idioma normalmente consiste em um identificador BCP-47. Esse parâmetro pode estar
no formato idioma-região, em que a primeira parte é o idioma principal
e a segunda, que é opcional, refere-se à região, geralmente um identificador de país,
de um dialeto específico. Por exemplo, podemos representar
o chinês nas variações simplificado, conforme escrito na China
(zh-Hans
), ou tradicional, conforme escrito em Taiwan (zh-Hant
).
Há três níveis de suporte a idiomas no recurso de reconhecimento de texto:
- Os idiomas aceitos são aqueles que priorizamos e avaliamos regularmente quanto ao desempenho.
- Os idiomas experimentais são aqueles em desenvolvimento ativo, mas que não são avaliados com frequência.
- Os idiomas mapeados são aceitos no mapeamento para outro código de idioma ou para um reconhecedor geral de caracteres. Por exemplo, "
en-GB
" é compatível, mas não é tratado de forma diferente de "en
" para fins de reconhecimento de texto. Fazemos um esforço para retornar o código de idioma mapeado correto no campo "Localidade da entidade". No entanto, os idiomas mapeados têm mais chance de serem confundidos com idiomas semelhantes do que idiomas com compatibilidade total ou experimental.
A lista de idiomas (com códigos languageHint
associados) compatíveis com
TEXT_DETECTION
e DOCUMENT_TEXT_DETECTION
é mostrada abaixo.
Se a dica de idioma for deixada em branco, tentaremos detectar automaticamente
o idioma mais apropriado. O endpoint TEXT_DETECTION
detectará automaticamente apenas
um subconjunto de idiomas compatíveis, enquanto o endpoint DOCUMENT_TEXT_DETECTION
detectará automaticamente o conjunto completo de idiomas compatíveis.
Idiomas compatíveis
Os idiomas a seguir são priorizados e avaliados regularmente.
Para filtrar por recursos, digite ou selecione diretamente o idioma escolhido no menu suspenso:
Idioma | Idioma (nome em português) | Código languageHints |
Script | Observações | |
---|---|---|---|---|---|
Afrikaans | Africâner | af |
Latn |
||
shqip | Albanês | sq |
Latn |
||
العربية | Árabe | ar |
Arab |
Moderno padrão | |
Հայ | Armênio | hy |
Armn |
||
беларуская | Bielorrusso | be |
Cyrl |
||
বাংলা | Bengalês | bn |
Beng |
||
български | Búlgaro | bg |
Cyrl |
||
Català | Catalão | ca |
Latn |
||
普通话 | Chinês | zh |
Hans/Hant |
||
Hrvatski | Croata | hr |
Latn |
||
Čeština | Tcheco | cs |
Latn |
||
Dansk | Dinamarquês | da |
Latn |
||
Nederlands | Holandês | nl |
Latn |
||
English | Inglês | en |
Latn |
Americano | |
Eesti keel | Estoniano | et |
Latn |
||
Filipino | Filipino | fil |
Latn |
||
Suomi | Finlandês | fi |
Latn |
||
Français | Francês | fr |
Latn |
Europeu | |
Deutsch | Alemão | de |
Latn |
||
Ελληνικά | Grego | el |
Grek |
||
ગુજરાતી | Guzerate | gu |
Gujr |
||
עברית | Hebraico | iw |
Hebr |
||
हिन्दी | Hindi | hi |
Deva |
||
Magyar | Húngaro | hu |
Latn |
||
Íslenska | Islandês | is |
Latn |
||
Bahasa Indonesia | Indonésio | id |
Latn |
||
Italiano | Italiano | it |
Latn |
||
日本語 | Japonês | ja |
Jpan |
||
ಕನ್ನಡ | Canarês | kn |
Knda |
||
ភាសាខ្មែរ | Khmer | km |
Khmr |
||
한국어 | Coreano | ko |
Kore |
||
ລາວ | Laosiano | lo |
Laoo |
||
Latviešu | Letão | lv |
Latn |
||
Lietuvių | Lituano | lt |
Latn |
||
Македонски | Macedônio | mk |
Cyrl |
||
Bahasa Melayu | Malaio | ms |
Latn |
||
മലയാളം | Malaiala | ml |
Mlym |
||
मराठी | Marati | mr |
Deva |
||
नेपाली | Nepalês | ne |
Deva |
||
Norsk | Norueguês | no |
Latn |
Bokmål | |
فارسی | Persa | fa |
Arab |
||
Polski | Polonês | pl |
Latn |
||
Português | Português | pt |
Latn |
Brasileiro | |
ਪੰਜਾਬੀ | Punjabi | pa |
Guru |
Gurmukhi | |
Română | Romeno | ro |
Latn |
||
Русский | Russo | ru |
Cyrl |
||
Русский (старая орфография) | Russo | ru-PETR1708 |
Cyrl |
Ortografia antiga | |
Српски | Sérvio | sr |
Cyrl |
||
Српски (латиница) | Sérvio | sr-Latn |
Latn |
||
Slovenčina | Eslovaco | sk |
Latn |
||
Slovenščina | Esloveno | sl |
Latn |
||
Español | Espanhol | es |
Latn |
Europeu | |
Svenska | Sueco | sv |
Latn |
||
Tagalog | Tagalo | tl |
Latn |
||
தமிழ் | Tâmil | ta |
Taml |
||
తెలుగు | Télugo | te |
Telu |
||
ไทย | Tailandês | th |
Thai |
||
Türkçe | Turco | tr |
Latn |
||
Українська | Ucraniano | uk |
Cyrl |
||
Tiếng Việt | Vietnamita | vi |
Latn |
||
Yiddish | Ídiche | yi |
Hebr |
Idiomas experimentais
Os idiomas a seguir estão em desenvolvimento ativo e ainda não são avaliados regularmente.
Idioma | Idioma (nome em português) | Código languageHints |
Script | Observações | |
---|---|---|---|---|---|
አማርኛ | Amárico | am |
Ethi |
||
Αρχαία ελληνικά | Grego antigo | grc |
Grek |
||
অসমীয়া | Assamês | as |
Beng |
||
Azərbaycan | Azerbaijano | az |
Latn |
||
Azərbaycan (qədim yazı) | Azerbaijano | az-Cyrl |
Cyrl |
Ortografia antiga | |
Euskara | Basco | eu |
Latn |
||
Bosanski | Bósnio | bs |
Latn |
||
မြန်မာ | Birmanês | my |
Mymr |
||
Cebuano | Cebuano | ceb |
Latn |
||
ᏣᎳᎩ ᎦᏬᏂᎯᏍᏗ | Cheroqui | chr |
Cher |
||
dhivehi, dhivehi-bas | Diveí | dv |
Thaa |
||
རྫོང་ཁ | Dzonga | dz |
Tibt |
||
Esperanto | Esperanto | eo |
Latn |
||
Galego | Galego | gl |
Latn |
||
ქართული | Georgiano | ka |
Geor |
||
Kreyòl Ayisyen | Crioulo haitiano | ht |
Latn |
||
Gaeilge | Irlandês | ga |
Latn |
||
Jawa | Javanês | jv |
Latn |
||
Қазақ | Cazaque | kk |
Cyrl |
||
Kirghiz | Quirguiz | ky |
Cyrl |
||
Latine | Latim | la |
Latn |
||
Malti | Maltês | mt |
Latn |
||
Монгол | Mongol | mn |
Cyrl |
||
ଓଡ଼ିଆ | Oriá | or |
Orya |
||
پښتو | Pastó | ps |
Arab |
||
संस्कृतम् | Sânscrito | sa |
Deva |
||
සිංහල | Cingalês | si |
Sinh |
||
Swahili | Suaíli | sw |
Latn |
||
leššānā Suryāyā | Siríaco | syr |
Syriac |
||
བོད་སྐད་ | Tibetano | bo |
Tibt |
||
ትግርኛ | Tigrínio | ti |
Ethi |
||
اردو | Urdu | ur |
Arab |
||
oʻzbekcha | Uzbeque | uz |
Latn |
Latim | |
oʻzbekcha | Uzbeque | uz-Cyrl |
Cyrl |
Ortografia antiga | |
Cymraeg | Galês | cy |
Latn |
||
IsiZulu | Zulu | zu |
Latn |
Idiomas mapeados
Os idiomas a seguir são mapeados para outro código de idioma ou para um reconhecedor geral de caracteres.
Idioma | Idioma (nome em português) | Código languageHints |
Script | Observações | |
---|---|---|---|---|---|
بهسا اچيه | Achém | ace |
Latn |
Modelo latino | |
Lwo | Acholi | ach |
Latn |
Modelo latino | |
Dangme | Adangme | ada |
Latn |
Modelo latino | |
Akan | Acã | ak |
Latn |
Modelo latino | |
Anicinâbemowin | Algonquiniano | alg |
Latn |
Modelo latino | |
Mapudungu | Araucaniano/Mapuche | arn |
Latn |
Modelo latino | |
Asturianu | Asturiano | ast |
Latn |
Modelo latino | |
Dene | Athabaskan | ath |
Latn |
Modelo latino | |
Aymar aru | Aimará | ay |
Latn |
Modelo latino | |
Bhāṣa Bali | Balinês | ban |
Latn |
Modelo latino | |
Bamanankan | Bambara | bm |
Latn |
Modelo latino | |
Narrow Bantu | Bantu | bnt |
Latn |
Modelo latino | |
башҡорт теле | Bashkir | ba |
Cyrl |
Modelo cirílico | |
Toba–Batak | Batak | btk |
Latn |
Modelo latino | |
Chibemba | Bemba | bem |
Latn |
Modelo latino | |
Bikol Naga | Bikol | bik |
Latn |
Modelo latino | |
Bichelamar | Bislama | bi |
Latn |
Modelo latino | |
Brezhoneg | Bretão | br |
Latn |
Modelo latino | |
нохчийн мотт / noxçiyn mott | Checheno | ce |
Cyrl |
Modelo cirílico | |
汉语 | Chinês (mandarim, simplificado) | zh-Hans |
Hans |
Modelo chinês | |
漢語 | Chinês (mandarim tradicional) | zh-Hant |
Hant |
Modelo chinês | |
普通話 | Chinês (mandarim, Hong Kong) | zh-Hant-HK |
Hant |
Modelo chinês | |
Chahta' | Choctaw | cho |
Latn |
Modelo latino | |
Чӑвашла | Chuvache | cv |
Cyrl |
Modelo cirílico | |
Cree–Montagnais–Naskapi | Cree | cr |
Latn |
Modelo latino | |
Mvskoke | Creek | mus |
Latn |
Modelo latino | |
qırımtatar tili, къырымтатар тили | Tártaro da Crimeia | crh |
Latn |
Modelo cirílico | |
Dakhótiyapi, Dakȟótiyapi | Dakota | dak |
Latn |
Modelo latino | |
Douala | Duala | dua |
Latn |
Modelo latino | |
Ikɔ Efik | Efik | efi |
Latn |
Modelo latino | |
English (British) | Inglês (britânico) | en-GB |
Latn |
Modelo latino | |
Èʋegbe | Ewe | ee |
Latn |
Modelo latino | |
føroyskt mál | Faroês | fo |
Latn |
Modelo latino | |
Na Vosa Vakaviti | Fijiano | fj |
Latn |
Modelo latino | |
fɔ̀ngbè | Fon | fon |
Latn |
Modelo latino | |
Français canadien | Francês (canadense) | fr-CA |
Latn |
Modelo latino | |
Fulani, Fulah, Peul | Fulah | ff |
Latn |
Modelo latino | |
Gã | Ga | gaa |
Latn |
Modelo latino | |
Luganda | Ganda | lg |
Latn |
Modelo latino | |
Basa Gayo | Gayo | gay |
Latn |
Modelo latino | |
Kiribati | Gilbertese | gil |
Latn |
Modelo latino | |
Gothic | Gótico | got |
Latn |
Modelo latino | |
Guaraní | Guarani | gn |
Latn |
Modelo latino | |
Harshen/Halshen Hausa هَرْشَن هَوْسَ | Hauçá | ha |
Latn |
Modelo latino | |
ʻŌlelo Hawaiʻi | Havaiano | haw |
Latn |
Modelo latino | |
Otjiherero | Herero | hz |
Latn |
Modelo latino | |
Ilonggo | Hiligaynon | hil |
Latn |
Modelo latino | |
Jaku Iban | Iban | iba |
Latn |
Modelo latino | |
Asụsụ Igbo | Igbo | ig |
Latn |
Modelo latino | |
Ilokano | Iloko | ilo |
Latn |
Modelo latino | |
Taqbaylit | Kabyle | kab |
Latn |
Modelo latino | |
Jingpho | Kachin | kac |
Latn |
Modelo latino | |
Kalaallisut | Groenlandês | kl |
Latn |
Modelo latino | |
Kikamba | Kamba | kam |
Latn |
Modelo latino | |
Kanuri | Kanuri | kr |
Latn |
Modelo latino | |
Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى | Caracalpaques | kaa |
Cyrl/Latn |
Modelo cirílico | |
Ka Ktien Khasi | Khasi | kha |
Latn |
Modelo latino | |
Gĩkũyũ | Kikuyu | ki |
Latn |
Modelo latino | |
Kinyarwanda | Quiniaruanda | rw |
Latn |
Modelo latino | |
коми кыв | Komi | kv |
Cyrl |
Modelo cirílico | |
Kikongo | Quicongo | kg |
Latn |
Modelo latino | |
Kosraean | Kosraean | kos |
Latn |
Modelo latino | |
Oshikwanyama | Kuanyama | kj |
Latn |
Modelo latino | |
Ngala | Lingala | ln |
Latn |
Modelo latino | |
Plattdütsch, Plattdeutsch, Nedersaksisch | Baixo-alemão | nds |
Latn |
Modelo latino | |
siLozi | Lozi | loz |
Latn |
Modelo latino | |
Kiluba | Luba-katanga | lu |
Latn |
Modelo latino | |
Dholuo | Luo | luo |
Latn |
Modelo latino | |
Madhura, Basa Mathura, بَهاسَ مَدورا | Madurês | mad |
Latn |
Modelo latino | |
Malagasy | Malgaxe | mg |
Latn |
Modelo latino | |
Mandinka, لغة مندنكا | Mandingo | man |
Latn |
Modelo latino | |
Gaelg, Gailck | Manx | gv |
Latn |
Modelo latino | |
Te reo Māori | Maori | mi |
Latn |
Modelo latino | |
Ebon | Marshallese | mh |
Latn |
Modelo latino | |
Mɛnde yia | Mende | men |
Latn |
Modelo latino | |
Middle English | Inglês médio | enm |
Latn |
Modelo latino | |
Mittelhochdeutsch | Alto-alemão médio | gmh |
Latn |
Modelo latino | |
Baso Minangkabau, باسو مينڠكاباو | Minangkabau | min |
Latn |
Modelo latino | |
Kanienʼkéha | Mohawk | moh |
Latn |
Modelo latino | |
Nkundu | Mongo | lol |
Latn |
Modelo latino | |
Nāhuatl | Náuatle | nah |
Latn |
Modelo latino | |
Diné bizaad | Navarro | nv |
Latn |
Modelo latino | |
Ndonga | Ndonga | ng |
Latn |
Modelo latino | |
ko e vagahau Niuē | Niueano | niu |
Latn |
Modelo latino | |
Zimbabwe Ndebele | Ndebele do norte | nd |
Latn |
Modelo latino | |
Sesotho sa Leboa | Soto do norte | nso |
Latn |
Modelo latino | |
Chichewa, Chinyanja | Nianja | ny |
Latn |
Modelo latino | |
Runyankore | Nyankole | nyn |
Latn |
Modelo latino | |
Chitonga | Nyasa Tonga | tog |
Latn |
Modelo latino | |
Appolo | Nzima | nzi |
Latn |
Modelo latino | |
Occitan, lenga d'òc, provençal | Occitano | oc |
Latn |
Modelo latino | |
Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ | Ojibwa | oj |
Latn |
Modelo latino | |
Ænglisc, Englisc, Anglisc | Inglês antigo | ang |
Latn |
Modelo latino | |
Franceis, François, Romanz | Francês antigo | fro |
Latn |
Modelo latino | |
Diutisk, Althochdeutsch | Alto-alemão antigo | goh |
Latn |
Modelo latino | |
Dǫnsk tunga | Norueguês antigo | non |
Latn |
Modelo latino | |
Occitan ancian | Provençal antigo | pro |
Latn |
Modelo latino | |
ирон ӕвзаг | Osseta | os |
Cyrl |
Modelo cirílico | |
Kapampangan | Pampanga | pam |
Latn |
Modelo latino | |
Salitan Pangasinan | Língua pangasiana | pag |
Latn |
Modelo latino | |
Papiamentu | Papiamento | pap |
Latn |
Modelo latino | |
Português (Portugal) | Português (europeu) | pt-PT |
Latn |
Modelo latino | |
Kechua / Runa Simi | Quíchua | qu |
Latn |
Modelo latino | |
Rumantsch | Romanche | rm |
Latn |
Modelo latino | |
Romani čhib | Romani | rom |
Latn |
Modelo latino | |
Ikirundi | Rundi | rn |
Latn |
Modelo latino | |
Sakha | Sakha | sah |
Cyrl |
Modelo cirílico | |
Gagana faʻa Sāmoa | Samoano | sm |
Latn |
Modelo latino | |
yângâ tî sängö | Sango | sg |
Latn |
Modelo latino | |
(Braid) Scots, Lallans, Doric | Scots | sco |
Latn |
Modelo latino | |
Gàidhlig | Gaélico escocês | gd |
Latn |
Modelo latino | |
chiShona | Chona | sn |
Latn |
Modelo latino | |
Songhay | Songhai | son |
Latn |
Modelo latino | |
Sesotho | Soto do sul | st |
Latn |
Modelo latino | |
Español (Latinoamérica) | Espanhol (latino) | es-419 |
Latn |
Modelo latino | |
ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda | Sudanês | su |
Latn |
Modelo latino | |
siSwati | Swati | ss |
Latn |
Modelo latino | |
Reo Tahiti | Taitiano | ty |
Latn |
Modelo latino | |
тоҷикӣ | Tadjique | tg |
Cyrl |
Modelo cirílico | |
татар теле | Tártaro | tt |
Cyrl/Latn |
Modelo cirílico | |
KʌThemnɛ | Temne | tem |
Latn |
Modelo latino | |
lea faka-Tonga | Tonga | to |
Latn |
Modelo latino | |
Xitsonga | Tsonga | ts |
Latn |
Modelo latino | |
Setswana | Tswana | tn |
Latn |
Modelo latino | |
Türkmençe | Turcomano | tk |
Latn |
Modelo cirílico | |
удмурт кыл | Udmurte | udm |
Cyrl |
Modelo cirílico | |
Tshivenḓa | Venda | ve |
Latn |
Modelo latino | |
Vod | Votic | vot |
Cyrl/Latn |
Modelo cirílico | |
Frysk | Frísio ocidental | fy |
Latn |
Modelo latino | |
Wolof | Wolof | wo |
Latn |
Modelo latino | |
isiXhosa | Xhosa | xh |
Latn |
Modelo latino | |
Èdè Yorùbá | Iorubá | yo |
Latn |
Modelo latino | |
Diidxazá | Zapoteco | zap |
Latn |
Modelo latino |
Scripts de escrita à mão
Os seguintes scripts são compatíveis com o reconhecimento de escrita manual. Consulte as tabelas de linguagens acima para ver os que são usados por cada script.
Script | Nome | Nível de suporte |
---|---|---|
Beng |
Bengalês | Experimental |
Cyrl |
Cirílico | Experimental |
Deva |
Devanágari | Experimental |
Grek |
Grego | Experimental |
Hani |
Chinês | Experimental |
Jpan |
Japonês | Com suporte |
Kore |
Coreano | Com suporte |
Latn |
Latim | Com suporte |
vi |
Vietnamita | Experimental |