O recurso de reconhecimento de texto da API Cloud Vision é capaz de detectar uma grande variedade de idiomas, além de detectar vários idiomas dentro de uma única imagem.
Não é preciso fornecer uma dica de idioma para o serviço. No entanto, isso poderá ser feito se houver dificuldade para detectar o idioma usado na imagem.
Com o lançamento do OCR de escrita à mão em disponibilidade geral, as imagens
com manuscritos não precisam mais da sinalização languageHints
ao usar
DOCUMENT_TEXT_DETECTION
.
As dicas de idioma opcionais
são especificadas no
ImageContext
de uma solicitação como uma lista de
languageHints
para uma solicitação TEXT_DETECTION
e DOCUMENT_TEXT_DETECTION
.
Cada parâmetro de código de idioma normalmente consiste em um identificador
BCP-47. Esse parâmetro pode estar
no formato idioma-região, em que a primeira parte é o idioma principal
e a segunda, que é opcional, refere-se à região, geralmente um identificador de país,
de um dialeto específico. Por exemplo, podemos representar
o chinês nas variações simplificado, conforme escrito na China
(zh-Hans
), ou tradicional, conforme escrito em Taiwan (zh-Hant
).
Há três níveis de suporte a idiomas no recurso de reconhecimento de texto:
- Os idiomas compatíveis são aqueles que priorizamos e cujos desempenhos avaliamos regularmente.
- Os idiomas experimentais são os que estão em desenvolvimento ativo, mas não são avaliados regularmente.
- Os idiomas mapeados são aqueles compatíveis com o mapeamento
para outro código de idioma
ou para um reconhecedor geral de caracteres. Por exemplo, "
en-GB
" é compatível, mas não é tratado de forma diferente de "en
" para fins de reconhecimento de texto. Fazemos um esforço para retornar o código de idioma mapeado correto no campo "Localidade da entidade". No entanto, os idiomas mapeados têm mais chance de serem confundidos com idiomas semelhantes do que idiomas com compatibilidade total ou experimental.
A lista de idiomas (com códigos languageHint
associados) compatíveis com
TEXT_DETECTION
e DOCUMENT_TEXT_DETECTION
é mostrada abaixo.
Se a dica de idioma for deixada em branco, tentaremos detectar automaticamente
o idioma mais apropriado. O endpoint TEXT_DETECTION
detectará automaticamente apenas
um subconjunto de idiomas compatíveis, enquanto o endpoint DOCUMENT_TEXT_DETECTION
detectará automaticamente o conjunto completo de idiomas compatíveis.
Idiomas compatíveis
Os idiomas a seguir são priorizados e avaliados regularmente.
Para filtrar por recursos, digite ou selecione diretamente o idioma escolhido no menu suspenso:
Idioma | Idioma (nome em português) | languageHints código |
Script | Observações | |
---|---|---|---|---|---|
Afrikaans | Africâner | af |
Latn |
||
shqip | Albanês | sq |
Latn |
||
العربية | Árabe | ar |
Arab |
Moderno Padrão | |
Հայ | Armênio | hy |
Armn |
||
беларуская | Bielorrusso | be |
Cyrl |
||
বাংলা | Bengalês | bn |
Beng |
||
български | Búlgaro | bg |
Cyrl |
||
Català | Catalão | ca |
Latn |
||
普通话 | Chinês | zh |
Hans/Hant |
||
Hrvatski | Croata | hr |
Latn |
||
Čeština | Tcheco | cs |
Latn |
||
Dansk | Dinamarquês | da |
Latn |
||
Nederlands | Holandês | nl |
Latn |
||
English | Inglês | en |
Latn |
Americano | |
Eesti keel | Estoniano | et |
Latn |
||
Filipino | Filipino | fil |
Latn |
||
Suomi | Finlandês | fi |
Latn |
||
Français | Francês | fr |
Latn |
Europeu | |
Deutsch | Alemão | de |
Latn |
||
Ελληνικά | Grego | el |
Grek |
||
ગુજરાતી | Guzerate | gu |
Gujr |
||
עברית | Hebraico | iw |
Hebr |
||
हिन्दी | Hindi | hi |
Deva |
||
Magyar | Húngaro | hu |
Latn |
||
Íslenska | Islandês | is |
Latn |
||
Bahasa Indonesia | Indonésio | id |
Latn |
||
Italiano | Italiano | it |
Latn |
||
日本語 | Japonês | ja |
Jpan |
||
ಕನ್ನಡ | Canarês | kn |
Knda |
||
ភាសាខ្មែរ | Khmer | km |
Khmr |
||
한국어 | Coreano | ko |
Kore |
||
ລາວ | Laosiano | lo |
Laoo |
||
Latviešu | Letão | lv |
Latn |
||
Lietuvių | Lituano | lt |
Latn |
||
Македонски | Macedônio | mk |
Cyrl |
||
Bahasa Melayu | Malaio | ms |
Latn |
||
മലയാളം | Malaiala | ml |
Mlym |
||
मराठी | Marata | mr |
Deva |
||
नेपाली | Nepalês | ne |
Deva |
||
Norsk | Norueguês | no |
Latn |
Bokmål | |
فارسی | Persa | fa |
Arab |
||
Polski | Polonês | pl |
Latn |
||
Português | Português | pt |
Latn |
Brasileiro | |
ਪੰਜਾਬੀ | Punjabi | pa |
Guru |
Gurmukhi | |
Română | Romeno | ro |
Latn |
||
Русский | Russo | ru |
Cyrl |
||
Русский (старая орфография) | Russo | ru-PETR1708 |
Cyrl |
Ortografia antiga | |
Српски | Sérvio | sr |
Cyrl |
||
Српски (латиница) | Sérvio | sr-Latn |
Latn |
||
Slovenčina | Eslovaco | sk |
Latn |
||
Slovenščina | Esloveno | sl |
Latn |
||
Español | Espanhol | es |
Latn |
Europeu | |
Svenska | Sueco | sv |
Latn |
||
Tagalog | Tagalo | tl |
Latn |
||
தமிழ் | Tâmil | ta |
Taml |
||
తెలుగు | Télugo | te |
Telu |
||
ไทย | Tailandês | th |
Thai |
||
Türkçe | Turco | tr |
Latn |
||
Українська | Ucraniano | uk |
Cyrl |
||
Tiếng Việt | Vietnamese | vi |
Latn |
||
Yiddish | Ídiche | yi |
Hebr |
Idiomas experimentais
Os idiomas a seguir estão em desenvolvimento ativo e ainda não são avaliados regularmente.
Idioma | Idioma (nome em português) | languageHints código |
Script | Observações | |
---|---|---|---|---|---|
አማርኛ | Amárico | am |
Ethi |
||
Αρχαία ελληνικά | grego antigo | grc |
Grek |
||
অসমীয়া | Assamês | as |
Beng |
||
Azərbaycan | Azerbaijano | az |
Latn |
||
Azərbaycan (qədim yazı) | Azerbaijano | az-Cyrl |
Cyrl |
Ortografia antiga | |
Euskara | Basco | eu |
Latn |
||
Bosanski | Bósnio | bs |
Latn |
||
မြန်မာ | Birmanês | my |
Mymr |
||
Cebuano | Cebuano | ceb |
Latn |
||
ᏣᎳᎩ ᎦᏬᏂᎯᏍᏗ | Cheroqui | chr |
Cher |
||
dhivehi, dhivehi-bas | Divehi | dv |
Thaa |
||
རྫོང་ཁ | Dzonkha | dz |
Tibt |
||
Esperanto | Esperanto | eo |
Latn |
||
Galego | Galego | gl |
Latn |
||
ქართული | Georgiano | ka |
Geor |
||
Kreyòl Ayisyen | Creole haitiano | ht |
Latn |
||
Gaeilge | Irlandês | ga |
Latn |
||
Jawa | Javanês | jv |
Latn |
||
Қазақ | Cazaque | kk |
Cyrl |
||
Kirghiz | Quirguiz | ky |
Cyrl |
||
Latine | Latim | la |
Latn |
||
Malti | Maltês | mt |
Latn |
||
Монгол | Mongol | mn |
Cyrl |
||
ଓଡ଼ିଆ | Oriá | or |
Orya |
||
پښتو | Pashto | ps |
Arab |
||
संस्कृतम् | Sânscrito | sa |
Deva |
||
සිංහල | Cingalês | si |
Sinh |
||
Swahili | Suaíli | sw |
Latn |
||
leššānā Suryāyā | Siríaco | syr |
Syriac |
||
བོད་སྐད་ | Tibetano | bo |
Tibt |
||
ትግርኛ | Tigirinya | ti |
Ethi |
||
اردو | Urdu | ur |
Arab |
||
oʻzbekcha | Usbeque | uz |
Latn |
Latim | |
oʻzbekcha | Usbeque | uz-Cyrl |
Cyrl |
Ortografia antiga | |
Cymraeg | Galês | cy |
Latn |
||
IsiZulu | Zulu | zu |
Latn |
Idiomas mapeados
Os idiomas a seguir são mapeados para outro código de idioma ou para um reconhecedor geral de caracteres.
Idioma | Idioma (nome em português) | languageHints código |
Script | Observações | |
---|---|---|---|---|---|
بهسا اچيه | Achém | ace |
Latn |
Modelo latino | |
Lwo | Acholi | ach |
Latn |
Modelo latino | |
Dangme | Adangme | ada |
Latn |
Modelo latino | |
Akan | Akan | ak |
Latn |
Modelo latino | |
Anicinâbemowin | Algonquinian | alg |
Latn |
Modelo latino | |
Mapudungu | Araucanian/Mapuche | arn |
Latn |
Modelo latino | |
Asturianu | Asturiano | ast |
Latn |
Modelo latino | |
Dene | Athabaskan | ath |
Latn |
Modelo latino | |
Aymar aru | Aymara | ay |
Latn |
Modelo latino | |
Bhāṣa Bali | Balinês | ban |
Latn |
Modelo latino | |
Bamanankan | Bambara | bm |
Latn |
Modelo latino | |
Narrow Bantu | Bantu | bnt |
Latn |
Modelo latino | |
башҡорт теле | Bashkir | ba |
Cyrl |
Modelo cirílico | |
Toba–Batak | Batak | btk |
Latn |
Modelo latino | |
Chibemba | Bemba | bem |
Latn |
Modelo latino | |
Bikol Naga | Bikol | bik |
Latn |
Modelo latino | |
Bichelamar | Bislamá | bi |
Latn |
Modelo latino | |
Brezhoneg | Bretão | br |
Latn |
Modelo latino | |
нохчийн мотт / noxçiyn mott | Checheno | ce |
Cyrl |
Modelo cirílico | |
汉语 | Chinês (mandarim, simplificado) | zh-Hans |
Hans |
Modelo chinês | |
漢語 | Chinês (mandarim, tradicional) | zh-Hant |
Hant |
Modelo chinês | |
普通話 | Chinês (mandarim, Hong Kong) | zh-Hant-HK |
Hant |
Modelo chinês | |
Chahta' | Choctaw | cho |
Latn |
Modelo latino | |
Чӑвашла | Chuvache | cv |
Cyrl |
Modelo cirílico | |
Cree–Montagnais–Naskapi | Cree | cr |
Latn |
Modelo latino | |
Mvskoke | Creek | mus |
Latn |
Modelo latino | |
qırımtatar tili, къырымтатар тили | Tártaro da Crimeia | crh |
Latn |
Modelo cirílico | |
Dakhótiyapi, Dakȟótiyapi | Dakota | dak |
Latn |
Modelo latino | |
Douala | Duala | dua |
Latn |
Modelo latino | |
Ikɔ Efik | Efik | efi |
Latn |
Modelo latino | |
English (British) | Inglês (britânico) | en-GB |
Latn |
Modelo latino | |
Èʋegbe | Ewe | ee |
Latn |
Modelo latino | |
føroyskt mál | Faroês | fo |
Latn |
Modelo latino | |
Na Vosa Vakaviti | Fijiano | fj |
Latn |
Modelo latino | |
fɔ̀ngbè | Fon | fon |
Latn |
Modelo latino | |
Français canadien | Francês (Canadá) | fr-CA |
Latn |
Modelo latino | |
Fulani, Fulah, Peul | Fulah | ff |
Latn |
Modelo latino | |
Gã | Ga | gaa |
Latn |
Modelo latino | |
Luganda | Ganda | lg |
Latn |
Modelo latino | |
Basa Gayo | Gayo | gay |
Latn |
Modelo latino | |
Kiribati | Gilbertese | gil |
Latn |
Modelo latino | |
Gothic | Gótico | got |
Latn |
Modelo latino | |
Guaraní | Guarani | gn |
Latn |
Modelo latino | |
Harshen/Halshen Hausa هَرْشَن هَوْسَ | Hauçá | ha |
Latn |
Modelo latino | |
ʻŌlelo Hawaiʻi | Havaiano | haw |
Latn |
Modelo latino | |
Otjiherero | Herero | hz |
Latn |
Modelo latino | |
Ilonggo | Hiligaynon | hil |
Latn |
Modelo latino | |
Jaku Iban | Iban | iba |
Latn |
Modelo latino | |
Asụsụ Igbo | Igbo | ig |
Latn |
Modelo latino | |
Ilokano | Iloko | ilo |
Latn |
Modelo latino | |
Taqbaylit | Kabyle | kab |
Latn |
Modelo latino | |
Jingpho | Kachin | kac |
Latn |
Modelo latino | |
Kalaallisut | Groenlandês | kl |
Latn |
Modelo latino | |
Kikamba | Kamba | kam |
Latn |
Modelo latino | |
Kanuri | Kanuri | kr |
Latn |
Modelo latino | |
Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى | Kara-Kalpak | kaa |
Cyrl/Latn |
Modelo cirílico | |
Ka Ktien Khasi | Khasi | kha |
Latn |
Modelo latino | |
Gĩkũyũ | Kikuyu | ki |
Latn |
Modelo latino | |
Kinyarwanda | Quiniaruanda | rw |
Latn |
Modelo latino | |
коми кыв | Komi | kv |
Cyrl |
Modelo cirílico | |
Kikongo | Quicongo | kg |
Latn |
Modelo latino | |
Kosraean | Kosraean | kos |
Latn |
Modelo latino | |
Oshikwanyama | Kuanyama | kj |
Latn |
Modelo latino | |
Ngala | Lingala | ln |
Latn |
Modelo latino | |
Plattdütsch, Plattdeutsch, Nedersaksisch | Baixo-alemão | nds |
Latn |
Modelo latino | |
siLozi | Lozi | loz |
Latn |
Modelo latino | |
Kiluba | Luba-katanga | lu |
Latn |
Modelo latino | |
Dholuo | Luo | luo |
Latn |
Modelo latino | |
Madhura, Basa Mathura, بَهاسَ مَدورا | Madurês | mad |
Latn |
Modelo latino | |
Malagasy | Malgaxe | mg |
Latn |
Modelo latino | |
Mandinka, لغة مندنكا | Mandingo | man |
Latn |
Modelo latino | |
Gaelg, Gailck | Manx | gv |
Latn |
Modelo latino | |
Te reo Māori | Maori | mi |
Latn |
Modelo latino | |
Ebon | Marshallese | mh |
Latn |
Modelo latino | |
Mɛnde yia | Mende | men |
Latn |
Modelo latino | |
Middle English | Inglês médio | enm |
Latn |
Modelo latino | |
Mittelhochdeutsch | Alto-alemão médio | gmh |
Latn |
Modelo latino | |
Baso Minangkabau, باسو مينڠكاباو | Minangkabau | min |
Latn |
Modelo latino | |
Kanienʼkéha | Mohawk | moh |
Latn |
Modelo latino | |
Nkundu | Mongo | lol |
Latn |
Modelo latino | |
Nāhuatl | Náuatle | nah |
Latn |
Modelo latino | |
Diné bizaad | Navajo | nv |
Latn |
Modelo latino | |
Ndonga | Ndonga | ng |
Latn |
Modelo latino | |
ko e vagahau Niuē | Niueano | niu |
Latn |
Modelo latino | |
Zimbabwe Ndebele | Ndebele do norte | nd |
Latn |
Modelo latino | |
Sesotho sa Leboa | Sotho do norte | nso |
Latn |
Modelo latino | |
Chichewa, Chinyanja | Nianja | ny |
Latn |
Modelo latino | |
Runyankore | Nyankole | nyn |
Latn |
Modelo latino | |
Chitonga | Nyasa Tonga | tog |
Latn |
Modelo latino | |
Appolo | Nzima | nzi |
Latn |
Modelo latino | |
Occitan, lenga d'òc, provençal | Occitânico | oc |
Latn |
Modelo latino | |
Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ | Ojibwa | oj |
Latn |
Modelo latino | |
Ænglisc, Englisc, Anglisc | Inglês antigo | ang |
Latn |
Modelo latino | |
Franceis, François, Romanz | Francês antigo | fro |
Latn |
Modelo latino | |
Diutisk, Althochdeutsch | Alto alemão antigo | goh |
Latn |
Modelo latino | |
Dǫnsk tunga | Norueguês antigo | non |
Latn |
Modelo latino | |
Occitan ancian | Provençal antigo | pro |
Latn |
Modelo latino | |
ирон ӕвзаг | Ossetic | os |
Cyrl |
Modelo cirílico | |
Kapampangan | Pampanga | pam |
Latn |
Modelo latino | |
Salitan Pangasinan | Língua pangasiana | pag |
Latn |
Modelo latino | |
Papiamentu | Papiamento | pap |
Latn |
Modelo latino | |
Português (Portugal) | Português (europeu) | pt-PT |
Latn |
Modelo latino | |
Kechua / Runa Simi | Quíchua | qu |
Latn |
Modelo latino | |
Rumantsch | Romanche | rm |
Latn |
Modelo latino | |
Romani čhib | Romani | rom |
Latn |
Modelo latino | |
Ikirundi | Rundi | rn |
Latn |
Modelo latino | |
Sakha | Sakha | sah |
Cyrl |
Modelo cirílico | |
Gagana faʻa Sāmoa | Samoano | sm |
Latn |
Modelo latino | |
yângâ tî sängö | Sango | sg |
Latn |
Modelo latino | |
(Braid) Scots, Lallans, Doric | Escocês | sco |
Latn |
Modelo latino | |
Gàidhlig | Gaélico escocês | gd |
Latn |
Modelo latino | |
chiShona | Xona | sn |
Latn |
Modelo latino | |
Songhay | Songhai | son |
Latn |
Modelo latino | |
Sesotho | soto do sul | st |
Latn |
Modelo latino | |
Español (Latinoamérica) | Espanhol (América Latina) | es-419 |
Latn |
Modelo latino | |
ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda | Sundanês | su |
Latn |
Modelo latino | |
siSwati | Swati | ss |
Latn |
Modelo latino | |
Reo Tahiti | Taitiano | ty |
Latn |
Modelo latino | |
тоҷикӣ | Tadjique | tg |
Cyrl |
Modelo cirílico | |
татар теле | Tártaro | tt |
Cyrl/Latn |
Modelo cirílico | |
KʌThemnɛ | Temne | tem |
Latn |
Modelo latino | |
lea faka-Tonga | Tonga | to |
Latn |
Modelo latino | |
Xitsonga | Tsonga | ts |
Latn |
Modelo latino | |
Setswana | Tswana | tn |
Latn |
Modelo latino | |
Türkmençe | Turcomano | tk |
Latn |
Modelo cirílico | |
удмурт кыл | Udmurte | udm |
Cyrl |
Modelo cirílico | |
Tshivenḓa | Venda | ve |
Latn |
Modelo latino | |
Vod | Votic | vot |
Cyrl/Latn |
Modelo cirílico | |
Frysk | Frísio ocidental | fy |
Latn |
Modelo latino | |
Wolof | Wolof | wo |
Latn |
Modelo latino | |
isiXhosa | Xhosa | xh |
Latn |
Modelo latino | |
Èdè Yorùbá | Iorubá | yo |
Latn |
Modelo latino | |
Diidxazá | Zapotec | zap |
Latn |
Modelo latino |
Scripts de escrita à mão
Os seguintes scripts são compatíveis com o reconhecimento de escrita manual. Consulte as tabelas de linguagens acima para ver os que são usados por cada script.
Script | Nome | Nível do suporte |
---|---|---|
Beng |
Bengalês | Experimental |
Cyrl |
Cirílico | Experimental |
Deva |
Devanágari | Experimental |
Grek |
Grego | Experimental |
Hani |
Chinês | Experimental |
Jpan |
Japonês | Compatível |
Kore |
Coreano | Compatível |
Latn |
Latim | Compatível |
vi |
Vietnamese | Experimental |