O recurso de reconhecimento de texto da API Cloud Vision é capaz de detectar uma grande variedade de idiomas, além de detectar vários idiomas dentro de uma única imagem.
Não é preciso fornecer uma dica de idioma para o serviço. No entanto, isso poderá ser feito se houver dificuldade para detectar o idioma usado na imagem.
Com o lançamento do OCR de escrita à mão em disponibilidade geral, as imagens
com manuscritos não precisam mais da sinalização languageHints
ao usar
DOCUMENT_TEXT_DETECTION
.
As dicas de idioma opcionais
são especificadas no
ImageContext
de uma solicitação como uma lista de
languageHints
para uma solicitação TEXT_DETECTION
e DOCUMENT_TEXT_DETECTION
.
Cada parâmetro de código de idioma normalmente consiste em um identificador
BCP-47. Esse parâmetro pode estar
no formato idioma-região, em que a primeira parte é o idioma principal
e a segunda, que é opcional, refere-se à região, geralmente um identificador de país,
de um dialeto específico. Por exemplo, podemos representar
o chinês nas variações simplificado, conforme escrito na China
(zh-Hans
), ou tradicional, conforme escrito em Taiwan (zh-Hant
).
Há três níveis de suporte a idiomas no recurso de reconhecimento de texto:
- Os idiomas compatíveis são aqueles que priorizamos e cujos desempenhos avaliamos regularmente.
- Os idiomas experimentais são os que estão em desenvolvimento ativo, mas não são avaliados regularmente.
- Os idiomas mapeados são aqueles compatíveis com o mapeamento
para outro código de idioma
ou para um reconhecedor geral de caracteres. Por exemplo, "
en-GB
" é compatível, mas não é tratado de forma diferente de "en
" para fins de reconhecimento de texto. Fazemos um esforço para retornar o código de idioma mapeado correto no campo "Localidade da entidade". No entanto, os idiomas mapeados têm mais chance de serem confundidos com idiomas semelhantes do que idiomas com compatibilidade total ou experimental.
A lista de idiomas (com códigos languageHint
associados) compatíveis com
TEXT_DETECTION
e DOCUMENT_TEXT_DETECTION
é mostrada abaixo.
Se a dica de idioma for deixada em branco, tentaremos detectar automaticamente
o idioma mais apropriado. O endpoint TEXT_DETECTION
detectará automaticamente apenas
um subconjunto de idiomas compatíveis, enquanto o endpoint DOCUMENT_TEXT_DETECTION
detectará automaticamente o conjunto completo de idiomas compatíveis.
Idiomas compatíveis
Os idiomas a seguir são priorizados e avaliados regularmente.
Para filtrar por recursos, digite ou selecione diretamente o idioma escolhido no menu suspenso:
Idioma | Idioma (nome em português) | Código languageHints | Script / observações |
---|---|---|---|
Africâner | Africâner | af | Latn |
shqip | Albanês | sq | Latn |
العربية | Árabe | ar | Arabrabe; Padrão moderno |
Հայ | Armênio | hy | Armn |
беларуская | Bielorrusso | be | Cyrl |
বাংলা | Bengalês | bn | Beng |
български | Búlgaro | bg | Cyrl |
Catalão | Catalão | ca | Latn |
普通话 | Chinês | zh | Hans/Hant |
Hrvatski | Croata | h | Latn |
Čeština | Tcheco | cs | Latn |
Dansk | Dinamarquês | da | Latn |
Nederlands | Holandês | nl | Latn |
Inglês | Inglês | en | Latn; Americano |
Eesti keel | Estoniano | et | Latn |
Filipino | Filipino | fil ou tl | Latn |
Suomi | Finlandês | fi | Latn |
Français | Francês | fr | Latn; Europeu |
Deutsch | Alemão | de | Latn |
Ελληνικά | Grego | el | Grego |
ગુજરાતી | Gujarati | gu | Gujr |
עברית | Hebraico | iw | Hebr |
हिन्दी | Hindi | oi | Deva |
Magyar | Húngaro | hu | Latn |
Íslenska | Islandês | representa | Latn |
Bahasa Indonesia | Indonésio | id | Latn |
Italiano | Italiano | it | Latn |
日本語 | Japonês | ja | Japão |
ಕನ್ನಡ | Canarês | kn | Knda |
ភាសាខ្មែរ | Khmer | km | Khmr |
한국어 | Coreano | ko | Kore |
ລາວ | Laosiano | lo | Laoo |
Latviešu | Letão | lv | Latn |
Lietuvių | Lituano | lt | Latn |
Македонски | Macedônio | mk | Cyrl |
Bahasa Melayu | Malaio | ms | Latn |
മലയാളം | Malaiala | ml | Mlym |
मराठी | Marata | mr | Deva |
नेपाली | Nepalês | ne | Deva |
Norsk | Norueguês | não | Latn; Bokmål |
فارسی | Persa | fa | Arab |
Polski | Polonês | pl | Latn |
Português | Português | pt | Latn; Brasileiro |
ਪੰਜਾਬੀ | punjabi | pa | Guru; Gurmukhi |
Română | Romeno | ro | Latn |
Pусский | Russo | ru | Cyrl |
Русский (старая орфография) | Russo | ru-PETR1708 | Cyrl; Ortografia antiga |
Српски | Sérvio | sr | Cyrl & Latn |
Српски (латиница) | Sérvio | sr-Latn | Latn |
Slovenčina | Slovak | sk | Latn |
Slovenščina | Esloveno | sl | Latn |
Español | Espanhol | es | Latn; Europeu |
Svenska | Sueco | sv | Latn |
தமிழ் | Tâmil | ta | Taml |
తెలుగు | Télugo | te | Telu |
ไทย | Tailandês | th | Tailandês |
Türkçe | Turco | tr | Latn |
Українськa | Ucraniano | uk | Cyrl |
Tiếng Việt | Vietnamita | vi | Latn |
Ídiche | Ídiche | yi | Hebr |
Idiomas experimentais
Os idiomas a seguir estão em desenvolvimento ativo e ainda não são avaliados regularmente.
Idioma | Idioma (nome em português) | languageHints código |
Script / observações |
---|---|---|---|
አማርኛ | Amárico | da manhã | Ethi |
Αρχαία ελληνικά | grego antigo | GRC | Grego |
অসমীয়া | Assamês | as | Beng |
Azərbaycan | Azerbaijano | az | Latn |
Azərbaycan (qədim yazı) | Azerbaijano | az-Cyrl | Cyrl; ortografia antiga |
Euskara | Basco | eu | Latn |
Bosanski | Bósnio | bs | Latn |
မြန်မာ | Birmanês | my | Mymr |
Cebuano | Cebuano | ceb | Latn |
ᏣᎳᎩ ᎦᏬᏂᎯᏍᏗ | Cheroqui | chr | Cher |
dhivehi, dhivehi-bas | Divehi | dv | Thaa |
རྫོང་ཁ | Dzonkha | dz | Tibt |
Esperanto | Esperanto | eo | Latn |
Galego | galega | gl | Latn |
ქართული | Georgiano | ka | Geor |
Kreyòl Ayisyen | Creole haitiano | ht | Latn |
Gaeilge | Irlandês | ga | Latn |
Jawa | Javanês | jv | Latn |
Қазақ | Cazaque | kk | Cyrl |
Quirguiz | Quirguiz | ky | Cyrl |
Latim | Latim | la | Latn |
Malti | Maltês | mt | Latn |
Монгол | Mongol | mn | Cyrl |
ଓଡ଼ିଆ | Oriá | ou | Orya |
پښتو | Pachto | ps | Arab |
संस्कृतम् | Sânscrito | sa | Deva |
සිංහල | Cingalês | si | Sinh |
Suaíli | Suaíli | sw | Latn |
leššānā Suryāyā | Siríaco | syr | Siríaco |
བོད་སྐད་ | Tibetano | bo | Tibt |
ትግርኛ | Tigirinya | ti | Ethi |
اردو | Urdu | ur | Arab |
oʻzbekcha | Uzbeque | uz | Latn; Latim |
oʻzbekcha | Uzbeque | uz-Cyrl | Cyrl; ortografia antiga |
Cymraeg | Galês | cy | Latn |
IsiZulu | Zulu | zu | Latn |
Idiomas mapeados
Os idiomas a seguir são mapeados para outro código de idioma ou para um reconhecedor geral de caracteres.
Idioma | Idioma (nome em português) | Código languageHints | Script / observações | Mapeado para |
---|---|---|---|---|
بهسا | Achém | ace | Latn | Modelo de script latino |
Lwo | Acholi | ach | Latn | Modelo de script latino |
Dangme | Adangme | ada | Latn | Modelo de script latino |
Akan | Akan | ak | Latn | Modelo de script latino |
Anicinâbemowin | Algonquinian | alg | Latn | Modelo de script latino |
Mapudungu | Araucanian/Mapuche | arn | Latn | Modelo de script latino |
Asturianu | Asturiano | ast | Latn | Modelo de script latino |
Dene | Athabaskan | ath | Latn | Modelo de script latino |
Aymar aru | Aymara | ay | Latn | Modelo de script latino |
Bhāṣa Bali | Balinês | ban | Latn | Modelo de script latino |
Bamanankan | Bambara | bm | Latn | Modelo de script latino |
Narrow Bantu | Bantu | bnt | Latn | Modelo de script latino |
башҡорт теле | Bashkir | ba | Cyrl | Modelo de script Cirílico |
Toba–Batak | Batak | btk | Latn | Modelo de script latino |
Chibemba | Bemba | bem | Latn | Modelo de script latino |
Bikol Naga | Bikol | bik | Latn | Modelo de script latino |
Bichelamar | Bislamá | bi | Latn | Modelo de script latino |
Brezhoneg | Bretão | br | Latn | Modelo de script latino |
нохчийн мотт / noxçiyn mott | Checheno | ce | Cyrl | Modelo de script Cirílico |
汉语 | Chinês | zh-Hans | Hans Simplificado Mandarim | zh |
漢語 | Chinês | zh-Hant | Hant Tradicional Mandarim | zh |
普通話 | Chinês | zh_Hant_HK | Hant; Mandarim; Hong Kong | zh |
Chahta' | Choctaw | cho | Latn | Modelo de script latino |
Чӑвашла | Chuvache | cv | Cyrl | Modelo de script Cirílico |
Cree–Montagnais–Naskapi | Cree | cr | Latn | Modelo de script latino |
Mvskoke | Creek | mus | Latn | Modelo de script latino |
qırımtatar tili, къырымтатар тили | Tártaro da Crimeia | crh | Latn | Modelo de script Cirílico |
Dakhótiyapi, Dakȟótiyapi | Dakota | dak | Latn | Modelo de script latino |
Douala | Duala | dua | Latn | Modelo de script latino |
Ikɔ Efik | Efik | efi | Latn | Modelo de script latino |
Inglês (britânico) | Inglês | en-GB | Latn; Britânica | en |
Èʋegbe | Ewe | ee | Latn | Modelo de script latino |
føroyskt mál | Faroês | fo | Latn | Modelo de script latino |
Na Vosa Vakaviti | Fijiano | fj | Latn | Modelo de script latino |
fɔ̀ngbè | Fon | fon | Latn | Modelo de script latino |
Français canadien | Francês | fr-CA | Latn; Canadá | fr |
Fulani, Fulah, Peul | Fulah | ff | Latn | Modelo de script latino |
Gã | Ga | gaa | Latn | Modelo de script latino |
Luganda | Ganda | lg | Latn | Modelo de script latino |
Basa Gayo | Gayo | gay | Latn | Modelo de script latino |
Kiribati | Gilbertese | gil | Latn | Modelo de script latino |
Gothic | Gothic | got | Latn | Modelo de script latino |
Guaraní | Guarani | gn | Latn | Modelo de script latino |
Harshen/Halshen Hausa هَرْشَن هَوْسَ | Hauçá | ha | Latn | Modelo de script latino |
ʻŌlelo Hawaiʻi | Havaiano | haw | Latn | Modelo de script latino |
Otjiherero | Herero | hz | Latn | Modelo de script latino |
Ilonggo | Hiligaynon | hil | Latn | Modelo de script latino |
Jaku Iban | Iban | iba | Latn | Modelo de script latino |
Asụsụ Igbo | Igbo | ig | Latn | Modelo de script latino |
Ilokano | Iloko | ilo | Latn | Modelo de script latino |
Taqbaylit | Kabyle | kab | Latn | Modelo de script latino |
Jingpho | Kachin | kac | Latn | Modelo de script latino |
Groenlandês | Groenlandês | kl | Latn | Modelo de script latino |
Kikamba | Kamba | kam | Latn | Modelo de script latino |
Kanuri | Kanuri | kr | Latn | Modelo de script latino |
Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى | Kara-Kalpak | kaa | Cyrl/Latn | Modelo de script Cirílico |
Ka Ktien Khasi | Khasi | kha | Latn | Modelo de script latino |
Gĩkũyũ | Kikuyu | ki | Latn | Modelo de script latino |
Kinyarwanda | Kinyarwanda | rw | Latn | Modelo de script latino |
коми кыв | Komi | kv | Cyrl | Modelo de script Cirílico |
Kikongo | Quicongo | kg | Latn | Modelo de script latino |
Kosraean | Kosraean | kos | Latn | Modelo de script latino |
Oshikwanyama | Kuanyama | kj | Latn | Modelo de script latino |
Ngala | Lingala | ln | Latn | Modelo de script latino |
Plattdütsch, Plattdeutsch, Nedersaksisch | Baixo-alemão | nds | Latn | Modelo de script latino |
siLozi | Lozi | loz | Latn | Modelo de script latino |
Kiluba | Luba-katanga | lu | Latn | Modelo de script latino |
Dholuo | Luo | luo | Latn | Modelo de script latino |
Madhura, Basa Mathura, بَهاسَ مَدورا | Madurês | mad | Latn | Modelo de script latino |
Malgaxe | Malgaxe | mg | Latn | Modelo de script latino |
Mandinka, لغة مندنكا | Mandingo | homem | Latn | Modelo de script latino |
Gaelg, Gailck | Manx | gv | Latn | Modelo de script latino |
Te reo Māori | Maori | mi | Latn | Modelo de script latino |
Ebon | Marshallese | mh | Latn | Modelo de script latino |
Mɛnde yia | Mende | men | Latn | Modelo de script latino |
Inglês médio | Inglês médio | enm | Latn | Modelo de script latino |
Mittelhochdeutsch | Alto-alemão médio | gmh | Latn | Modelo de script latino |
Baso Minangkabau, باسو مينڠكاباو | Minangkabau | min | Latn | Modelo de script latino |
Kanienʼkéha | Mohawk | moh | Latn | Modelo de script latino |
Nkundu | Mongo | lol | Latn | Modelo de script latino |
Nāhuatl | Náuatle | nah | Latn | Modelo de script latino |
Diné bizaad | Navajo | nv | Latn | Modelo de script latino |
Ndonga | Ndonga | ng | Latn | Modelo de script latino |
ko e vagahau Niuē | Niueano | niu | Latn | Modelo de script latino |
Zimbabwe Ndebele | Ndebele do norte | nd | Latn | Modelo de script latino |
Sesotho sa Leboa | Sotho do norte | nso | Latn | Modelo de script latino |
Chichewa, Chinyanja | Nianja | ny | Latn | Modelo de script latino |
Runyankore | Nyankole | nyn | Latn | Modelo de script latino |
Chitonga | Nyasa Tonga | tog | Latn | Modelo de script latino |
Appolo | Nzima | nzi | Latn | Modelo de script latino |
Occitan, lenga d'òc, provençal | Occitano | oc | Latn | Modelo de script latino |
Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ | Ojibwa | oj | Latn | Modelo de script latino |
Ænglisc, Englisc, Anglisc | Inglês antigo | ang | Latn | Modelo de script latino |
Franceis, François, Romanz | Francês antigo | fro | Latn | Modelo de script latino |
Diutisk, Althochdeutsch | Alto alemão antigo | goh | Latn | Modelo de script latino |
Dǫnsk tunga | Norueguês antigo | non | Latn | Modelo de script latino |
Anciano occitano | Provençal antigo | pro | Latn | Modelo de script latino |
ирон ӕвзаг | Ossetic | os | Cyrl | Modelo de script Cirílico |
Kapampangan | Pampanga | pam | Latn | Modelo de script latino |
Salitan Pangasinan | Língua pangasiana | pag | Latn | Modelo de script latino |
Papiamentu | Papiamento | pap | Latn | Modelo de script latino |
Português (Portugal) | Português | pt-PT | Latn; Europeu | pt |
Kechua / Runa Simi | Quíchua | qu | Latn | Modelo de script latino |
Rumantsch | Romanche | rm | Latn | Modelo de script latino |
Romani čhib | Romani | rom | Latn | Modelo de script latino |
Ikirundi | Rundi | rn | Latn | Modelo de script latino |
Sakha | Sakha | sah | Cyrl | Modelo de script Cirílico |
Gagana faʻa Sāmoa | Samoano | sm | Latn | Modelo de script latino |
yângâ tî sängö | Sango | sg | Latn | Modelo de script latino |
(Trança) Escocês, Lallans, Dórico | Escocês | sco | Latn | Modelo de script latino |
Gàidhlig | Gaélico escocês | gd | Latn | Modelo de script latino |
chiShona | Xona | sn | Latn | Modelo de script latino |
Songhay | Songhai | son | Latn | Modelo de script latino |
Sesoto | soto do sul | st | Latn | Modelo de script latino |
Espanhol (América Latina) | Espanhol | es-419 | Latn; América Latina | es |
ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda | Sundanês | su | Latn | Modelo de script latino |
siSwati | Swati | ss | Latn | Modelo de script latino |
Reo Tahiti | Taitiano | ty | Latn | Modelo de script latino |
тоҷикӣ | Tajique | tg | Cyrl | Modelo de script Cirílico |
татар теле | Tártaro | tt | Cyrl/Latn | Modelo de script Cirílico |
KʌThemnɛ | Temne | tem | Latn | Modelo de script latino |
lea faka-Tonga | Tonga | to | Latn | Modelo de script latino |
Xitsonga | Tsonga | ts | Latn | Modelo de script latino |
Setsuana | Tswana | tn | Latn | Modelo de script latino |
Türkmençe | Turcomano | tk | Latn | Modelo de script Cirílico |
удмурт кыл | Udmurte | udm | Cyrl | Modelo de script Cirílico |
Tshivenḓa | Venda | ve | Latn | Modelo de script latino |
Vod | Votic | vot | Cyrl/Latn | Modelo de script Cirílico |
Frysk | Frísio ocidental | fy | Latn | Modelo de script latino |
Wolof | Wolof | wo | Latn | Modelo de script latino |
isiXhosa | Xosa | xh | Latn | Modelo de script latino |
Èdè Yorùbá | Iorubá | yo | Latn | Modelo de script latino |
Diidxazá | Zapotec | zap | Latn | Modelo de script latino |
Scripts de escrita à mão
Os seguintes scripts são compatíveis com o reconhecimento de escrita manual. Consulte as tabelas de linguagens acima para ver os que são usados por cada script.
Tag de script | Nome | Nível de suporte |
---|---|---|
Beng | Bengalês | Experimental |
Cyrl | Cirílico | Experimental |
Deva | Devanágari | Experimental |
Grego | Grego | Experimental |
Hani | Chinês | Experimental |
Japão | Japonês | Compatível |
Kore | Coreano | Compatível |
Latn | Latim | Compatível |
vi | Vietnamita | Experimental |