Suporte a idiomas OCR

O recurso de reconhecimento de texto da API Cloud Vision é capaz de detectar uma grande variedade de idiomas, além de detectar vários idiomas dentro de uma única imagem.

Não é preciso fornecer uma dica de idioma para o serviço. No entanto, isso poderá ser feito se houver dificuldade para detectar o idioma usado na imagem.

Com o lançamento do OCR de escrita à mão em disponibilidade geral, as imagens com manuscritos não precisam mais da sinalização languageHints ao usar DOCUMENT_TEXT_DETECTION.

As dicas de idioma opcionais são especificadas no ImageContext de uma solicitação como uma lista de languageHints para uma solicitação TEXT_DETECTION e DOCUMENT_TEXT_DETECTION.

Cada parâmetro de código de idioma normalmente consiste em um identificador BCP-47. Esse parâmetro pode estar no formato idioma-região, em que a primeira parte é o idioma principal e a segunda, que é opcional, refere-se à região, geralmente um identificador de país, de um dialeto específico. Por exemplo, podemos representar o chinês nas variações simplificado, conforme escrito na China (zh-Hans), ou tradicional, conforme escrito em Taiwan (zh-Hant).

Há três níveis de suporte a idiomas no recurso de reconhecimento de texto:

  1. Os idiomas compatíveis são aqueles que priorizamos e cujos desempenhos avaliamos regularmente.
  2. Os idiomas experimentais são os que estão em desenvolvimento ativo, mas não são avaliados regularmente.
  3. Os idiomas mapeados são aqueles compatíveis com o mapeamento para outro código de idioma ou para um reconhecedor geral de caracteres. Por exemplo, "en-GB" é compatível, mas não é tratado de forma diferente de "en" para fins de reconhecimento de texto. Fazemos um esforço para retornar o código de idioma mapeado correto no campo "Localidade da entidade". No entanto, os idiomas mapeados têm mais chance de serem confundidos com idiomas semelhantes do que idiomas com compatibilidade total ou experimental.

A lista de idiomas (com códigos languageHint associados) compatíveis com TEXT_DETECTION e DOCUMENT_TEXT_DETECTION é mostrada abaixo.

Se a dica de idioma for deixada em branco, tentaremos detectar automaticamente o idioma mais apropriado. O endpoint TEXT_DETECTION detectará automaticamente apenas um subconjunto de idiomas compatíveis, enquanto o endpoint DOCUMENT_TEXT_DETECTION detectará automaticamente o conjunto completo de idiomas compatíveis.

Idiomas compatíveis

Os idiomas a seguir são priorizados e avaliados regularmente.

Para filtrar por recursos, digite ou selecione diretamente o idioma escolhido no menu suspenso:

Idioma Idioma (nome em português) languageHints código Script Observações
Afrikaans Africâner af Latn
shqip Albanês sq Latn
العربية Árabe ar Arab Moderno Padrão
Հայ Armênio hy Armn
беларуская Bielorrusso be Cyrl
বাংলা Bengalês bn Beng
български Búlgaro bg Cyrl
Català Catalão ca Latn
普通话 Chinês zh Hans/Hant
Hrvatski Croata hr Latn
Čeština Tcheco cs Latn
Dansk Dinamarquês da Latn
Nederlands Holandês nl Latn
English Inglês en Latn Americano
Eesti keel Estoniano et Latn
Filipino Filipino fil Latn
Suomi Finlandês fi Latn
Français Francês fr Latn Europeu
Deutsch Alemão de Latn
Ελληνικά Grego el Grek
ગુજરાતી Guzerate gu Gujr
עברית Hebraico iw Hebr
हिन्दी Hindi hi Deva
Magyar Húngaro hu Latn
Íslenska Islandês is Latn
Bahasa Indonesia Indonésio id Latn
Italiano Italiano it Latn
日本語 Japonês ja Jpan
ಕನ್ನಡ Canarês kn Knda
ភាសាខ្មែរ Khmer km Khmr
한국어 Coreano ko Kore
ລາວ Laosiano lo Laoo
Latviešu Letão lv Latn
Lietuvių Lituano lt Latn
Македонски Macedônio mk Cyrl
Bahasa Melayu Malaio ms Latn
മലയാളം Malaiala ml Mlym
मराठी Marata mr Deva
नेपाली Nepalês ne Deva
Norsk Norueguês no Latn Bokmål
فارسی Persa fa Arab
Polski Polonês pl Latn
Português Português pt Latn Brasileiro
ਪੰਜਾਬੀ Punjabi pa Guru Gurmukhi
Română Romeno ro Latn
Русский Russo ru Cyrl
Русский (старая орфография) Russo ru-PETR1708 Cyrl Ortografia antiga
Српски Sérvio sr Cyrl
Српски (латиница) Sérvio sr-Latn Latn
Slovenčina Eslovaco sk Latn
Slovenščina Esloveno sl Latn
Español Espanhol es Latn Europeu
Svenska Sueco sv Latn
Tagalog Tagalo tl Latn
தமிழ் Tâmil ta Taml
తెలుగు Télugo te Telu
ไทย Tailandês th Thai
Türkçe Turco tr Latn
Українська Ucraniano uk Cyrl
Tiếng Việt Vietnamese vi Latn
Yiddish Ídiche yi Hebr

Idiomas experimentais

Os idiomas a seguir estão em desenvolvimento ativo e ainda não são avaliados regularmente.

Idioma Idioma (nome em português) languageHints código Script Observações
አማርኛ Amárico am Ethi
Αρχαία ελληνικά grego antigo grc Grek
অসমীয়া Assamês as Beng
Azərbaycan Azerbaijano az Latn
Azərbaycan (qədim yazı) Azerbaijano az-Cyrl Cyrl Ortografia antiga
Euskara Basco eu Latn
Bosanski Bósnio bs Latn
မြန်မာ Birmanês my Mymr
Cebuano Cebuano ceb Latn
ᏣᎳᎩ ᎦᏬᏂᎯᏍᏗ Cheroqui chr Cher
dhivehi, dhivehi-bas Divehi dv Thaa
རྫོང་ཁ Dzonkha dz Tibt
Esperanto Esperanto eo Latn
Galego Galego gl Latn
ქართული Georgiano ka Geor
Kreyòl Ayisyen Creole haitiano ht Latn
Gaeilge Irlandês ga Latn
Jawa Javanês jv Latn
Қазақ Cazaque kk Cyrl
Kirghiz Quirguiz ky Cyrl
Latine Latim la Latn
Malti Maltês mt Latn
Монгол Mongol mn Cyrl
ଓଡ଼ିଆ Oriá or Orya
پښتو Pashto ps Arab
संस्कृतम् Sânscrito sa Deva
සිංහල Cingalês si Sinh
Swahili Suaíli sw Latn
leššānā Suryāyā Siríaco syr Syriac
བོད་སྐད་ Tibetano bo Tibt
ትግርኛ Tigirinya ti Ethi
اردو Urdu ur Arab
oʻzbekcha Usbeque uz Latn Latim
oʻzbekcha Usbeque uz-Cyrl Cyrl Ortografia antiga
Cymraeg Galês cy Latn
IsiZulu Zulu zu Latn

Idiomas mapeados

Os idiomas a seguir são mapeados para outro código de idioma ou para um reconhecedor geral de caracteres.

Idioma Idioma (nome em português) languageHints código Script Observações
بهسا اچيه Achém ace Latn Modelo latino
Lwo Acholi ach Latn Modelo latino
Dangme Adangme ada Latn Modelo latino
Akan Akan ak Latn Modelo latino
Anicinâbemowin Algonquinian alg Latn Modelo latino
Mapudungu Araucanian/Mapuche arn Latn Modelo latino
Asturianu Asturiano ast Latn Modelo latino
Dene Athabaskan ath Latn Modelo latino
Aymar aru Aymara ay Latn Modelo latino
Bhāṣa Bali Balinês ban Latn Modelo latino
Bamanankan Bambara bm Latn Modelo latino
Narrow Bantu Bantu bnt Latn Modelo latino
башҡорт теле Bashkir ba Cyrl Modelo cirílico
Toba–Batak Batak btk Latn Modelo latino
Chibemba Bemba bem Latn Modelo latino
Bikol Naga Bikol bik Latn Modelo latino
Bichelamar Bislamá bi Latn Modelo latino
Brezhoneg Bretão br Latn Modelo latino
нохчийн мотт / noxçiyn mott Checheno ce Cyrl Modelo cirílico
汉语 Chinês (mandarim, simplificado) zh-Hans Hans Modelo chinês
漢語 Chinês (mandarim, tradicional) zh-Hant Hant Modelo chinês
普通話 Chinês (mandarim, Hong Kong) zh-Hant-HK Hant Modelo chinês
Chahta' Choctaw cho Latn Modelo latino
Чӑвашла Chuvache cv Cyrl Modelo cirílico
Cree–Montagnais–Naskapi Cree cr Latn Modelo latino
Mvskoke Creek mus Latn Modelo latino
qırımtatar tili, къырымтатар тили Tártaro da Crimeia crh Latn Modelo cirílico
Dakhótiyapi, Dakȟótiyapi Dakota dak Latn Modelo latino
Douala Duala dua Latn Modelo latino
Ikɔ Efik Efik efi Latn Modelo latino
English (British) Inglês (britânico) en-GB Latn Modelo latino
Èʋegbe Ewe ee Latn Modelo latino
føroyskt mál Faroês fo Latn Modelo latino
Na Vosa Vakaviti Fijiano fj Latn Modelo latino
fɔ̀ngbè Fon fon Latn Modelo latino
Français canadien Francês (Canadá) fr-CA Latn Modelo latino
Fulani, Fulah, Peul Fulah ff Latn Modelo latino
Ga gaa Latn Modelo latino
Luganda Ganda lg Latn Modelo latino
Basa Gayo Gayo gay Latn Modelo latino
Kiribati Gilbertese gil Latn Modelo latino
Gothic Gótico got Latn Modelo latino
Guaraní Guarani gn Latn Modelo latino
Harshen/Halshen Hausa هَرْشَن هَوْسَ Hauçá ha Latn Modelo latino
ʻŌlelo Hawaiʻi Havaiano haw Latn Modelo latino
Otjiherero Herero hz Latn Modelo latino
Ilonggo Hiligaynon hil Latn Modelo latino
Jaku Iban Iban iba Latn Modelo latino
Asụsụ Igbo Igbo ig Latn Modelo latino
Ilokano Iloko ilo Latn Modelo latino
Taqbaylit Kabyle kab Latn Modelo latino
Jingpho Kachin kac Latn Modelo latino
Kalaallisut Groenlandês kl Latn Modelo latino
Kikamba Kamba kam Latn Modelo latino
Kanuri Kanuri kr Latn Modelo latino
Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى Kara-Kalpak kaa Cyrl/Latn Modelo cirílico
Ka Ktien Khasi Khasi kha Latn Modelo latino
Gĩkũyũ Kikuyu ki Latn Modelo latino
Kinyarwanda Quiniaruanda rw Latn Modelo latino
коми кыв Komi kv Cyrl Modelo cirílico
Kikongo Quicongo kg Latn Modelo latino
Kosraean Kosraean kos Latn Modelo latino
Oshikwanyama Kuanyama kj Latn Modelo latino
Ngala Lingala ln Latn Modelo latino
Plattdütsch, Plattdeutsch, Nedersaksisch Baixo-alemão nds Latn Modelo latino
siLozi Lozi loz Latn Modelo latino
Kiluba Luba-katanga lu Latn Modelo latino
Dholuo Luo luo Latn Modelo latino
Madhura, Basa Mathura, بَهاسَ مَدورا Madurês mad Latn Modelo latino
Malagasy Malgaxe mg Latn Modelo latino
Mandinka, لغة مندنكا Mandingo man Latn Modelo latino
Gaelg, Gailck Manx gv Latn Modelo latino
Te reo Māori Maori mi Latn Modelo latino
Ebon Marshallese mh Latn Modelo latino
Mɛnde yia Mende men Latn Modelo latino
Middle English Inglês médio enm Latn Modelo latino
Mittelhochdeutsch Alto-alemão médio gmh Latn Modelo latino
Baso Minangkabau, باسو مينڠكاباو Minangkabau min Latn Modelo latino
Kanienʼkéha Mohawk moh Latn Modelo latino
Nkundu Mongo lol Latn Modelo latino
Nāhuatl Náuatle nah Latn Modelo latino
Diné bizaad Navajo nv Latn Modelo latino
Ndonga Ndonga ng Latn Modelo latino
ko e vagahau Niuē Niueano niu Latn Modelo latino
Zimbabwe Ndebele Ndebele do norte nd Latn Modelo latino
Sesotho sa Leboa Sotho do norte nso Latn Modelo latino
Chichewa, Chinyanja Nianja ny Latn Modelo latino
Runyankore Nyankole nyn Latn Modelo latino
Chitonga Nyasa Tonga tog Latn Modelo latino
Appolo Nzima nzi Latn Modelo latino
Occitan, lenga d'òc, provençal Occitânico oc Latn Modelo latino
Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ Ojibwa oj Latn Modelo latino
Ænglisc, Englisc, Anglisc Inglês antigo ang Latn Modelo latino
Franceis, François, Romanz Francês antigo fro Latn Modelo latino
Diutisk, Althochdeutsch Alto alemão antigo goh Latn Modelo latino
Dǫnsk tunga Norueguês antigo non Latn Modelo latino
Occitan ancian Provençal antigo pro Latn Modelo latino
ирон ӕвзаг Ossetic os Cyrl Modelo cirílico
Kapampangan Pampanga pam Latn Modelo latino
Salitan Pangasinan Língua pangasiana pag Latn Modelo latino
Papiamentu Papiamento pap Latn Modelo latino
Português (Portugal) Português (europeu) pt-PT Latn Modelo latino
Kechua / Runa Simi Quíchua qu Latn Modelo latino
Rumantsch Romanche rm Latn Modelo latino
Romani čhib Romani rom Latn Modelo latino
Ikirundi Rundi rn Latn Modelo latino
Sakha Sakha sah Cyrl Modelo cirílico
Gagana faʻa Sāmoa Samoano sm Latn Modelo latino
yângâ tî sängö Sango sg Latn Modelo latino
(Braid) Scots, Lallans, Doric Escocês sco Latn Modelo latino
Gàidhlig Gaélico escocês gd Latn Modelo latino
chiShona Xona sn Latn Modelo latino
Songhay Songhai son Latn Modelo latino
Sesotho soto do sul st Latn Modelo latino
Español (Latinoamérica) Espanhol (América Latina) es-419 Latn Modelo latino
ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda Sundanês su Latn Modelo latino
siSwati Swati ss Latn Modelo latino
Reo Tahiti Taitiano ty Latn Modelo latino
тоҷикӣ Tadjique tg Cyrl Modelo cirílico
татар теле Tártaro tt Cyrl/Latn Modelo cirílico
KʌThemnɛ Temne tem Latn Modelo latino
lea faka-Tonga Tonga to Latn Modelo latino
Xitsonga Tsonga ts Latn Modelo latino
Setswana Tswana tn Latn Modelo latino
Türkmençe Turcomano tk Latn Modelo cirílico
удмурт кыл Udmurte udm Cyrl Modelo cirílico
Tshivenḓa Venda ve Latn Modelo latino
Vod Votic vot Cyrl/Latn Modelo cirílico
Frysk Frísio ocidental fy Latn Modelo latino
Wolof Wolof wo Latn Modelo latino
isiXhosa Xhosa xh Latn Modelo latino
Èdè Yorùbá Iorubá yo Latn Modelo latino
Diidxazá Zapotec zap Latn Modelo latino

Scripts de escrita à mão

Os seguintes scripts são compatíveis com o reconhecimento de escrita manual. Consulte as tabelas de linguagens acima para ver os que são usados por cada script.

Script Nome Nível do suporte
Beng Bengalês Experimental
Cyrl Cirílico Experimental
Deva Devanágari Experimental
Grek Grego Experimental
Hani Chinês Experimental
Jpan Japonês Compatível
Kore Coreano Compatível
Latn Latim Compatível
vi Vietnamese Experimental