Suporte de idiomas do OCR

A funcionalidade de reconhecimento de texto da Cloud Vision API consegue detetar uma grande variedade de idiomas e pode detetar vários idiomas numa única imagem.

Não é necessário fornecer uma sugestão de idioma ao serviço, mas pode fazê-lo se o serviço tiver problemas em detetar o idioma usado na sua imagem.

Com o lançamento da DG de OCR de escrita manual, as imagens com escrita manual já não requerem uma languageHints flag de escrita manual quando usam DOCUMENT_TEXT_DETECTION.

As sugestões de idioma opcionais são especificadas no ImageContext de um pedido como uma lista de languageHints para um pedido de TEXT_DETECTION e DOCUMENT_TEXT_DETECTION.

Normalmente, cada parâmetro de código de idioma consiste num identificador BCP-47. Este parâmetro pode ter o formato language-region, em que language se refere ao idioma principal e o region opcional refere-se a uma região (normalmente, um identificador de país) de um dialeto específico. Por exemplo, o chinês pode ser representado como chinês simplificado, como é escrito na República Popular da China (zh-Hans), ou chinês tradicional, como é escrito em Taiwan (zh-Hant).

Existem três níveis de suporte de idiomas na funcionalidade de reconhecimento de texto:

  1. Os idiomas suportados são aqueles aos quais damos prioridade e em relação aos quais avaliamos regularmente o desempenho.
  2. Os idiomas experimentais são aqueles que estão em desenvolvimento ativo, mas não são avaliados regularmente.
  3. Os idiomas mapeados são os que são suportados através do respetivo mapeamento para outro código de idioma ou para um reconhecedor de carateres geral. Por exemplo, "en-GB" é suportado, mas não é tratado de forma diferente de "en" para efeitos de reconhecimento de texto. Fazemos o nosso melhor para devolver o código do idioma mapeado correto no campo de localidade da entidade, mas é mais provável que os idiomas mapeados do que os idiomas totalmente suportados ou suportados experimentalmente sejam identificados incorretamente como um idioma semelhante.

A lista de idiomas (com os códigos languageHint associados) suportados pelo TEXT_DETECTION e DOCUMENT_TEXT_DETECTION é apresentada abaixo.

Se a sugestão de idioma for deixada em branco, vamos tentar detetar automaticamente o idioma mais adequado. O ponto final TEXT_DETECTION deteta automaticamente apenas um subconjunto de idiomas suportados, enquanto o ponto final DOCUMENT_TEXT_DETECTION deteta automaticamente o conjunto completo de idiomas suportados.

Idiomas suportados

Os seguintes idiomas são prioritários e avaliados regularmente.

Para filtrar por funcionalidades, escreva ou selecione diretamente o idioma pretendido no menu pendente:

Idioma Idioma (nome em inglês) Código languageHints Script Notas
Afrikaans Afrikaans af Latn
shqip Albanês sq Latn
العربية Árabe ar Arab Modern Standard
Հայ Arménio hy Armn
беларуская Bielorrusso be Cyrl
বাংলা Bengali bn Beng
български Búlgaro bg Cyrl
Català Catalão ca Latn
普通话 Chinês zh Hans/Hant
Hrvatski Croata hr Latn
Čeština Checo cs Latn
Dansk Dinamarquês da Latn
Nederlands Neerlandês nl Latn
English Inglês en Latn Americano
Eesti keel Estónio et Latn
Filipino Filipino fil Latn
Suomi Finlandês fi Latn
Français Francês fr Latn Europeu
Deutsch Alemão de Latn
Ελληνικά Grego el Grek
ગુજરાતી Gujarati gu Gujr
עברית Hebraico iw Hebr
हिन्दी Hindi hi Deva
Magyar Húngaro hu Latn
Íslenska Islandês is Latn
Bahasa Indonesia Indonésio id Latn
Italiano Italiano it Latn
日本語 Japonês ja Jpan
ಕನ್ನಡ Canará kn Knda
ភាសាខ្មែរ Khmer km Khmr
한국어 Coreano ko Kore
ລາວ Laociano lo Laoo
Latviešu Letão lv Latn
Lietuvių Lituano lt Latn
Македонски Macedónio mk Cyrl
Bahasa Melayu Malaio ms Latn
മലയാളം Malaiala ml Mlym
मराठी Marati mr Deva
नेपाली Nepalês ne Deva
Norsk Norueguês no Latn Bokmål
فارسی Persa fa Arab
Polski Polaco pl Latn
Português Português pt Latn Brasileiro
ਪੰਜਾਬੀ Punjabi pa Guru Gurmukhi
Română Romeno ro Latn
Русский Russo ru Cyrl
Русский (старая орфография) Russo ru-PETR1708 Cyrl Ortografia antiga
Српски Sérvio sr Cyrl
Српски (латиница) Sérvio sr-Latn Latn
Slovenčina Eslovaco sk Latn
Slovenščina Esloveno sl Latn
Español Espanhol es Latn Europeu
Svenska Sueco sv Latn
Tagalog Tagalo tl Latn
தமிழ் Tamil ta Taml
తెలుగు Telugu te Telu
ไทย Tailandês th Thai
Türkçe Turco tr Latn
Українська Ucraniano uk Cyrl
Tiếng Việt Vietnamita vi Latn
Yiddish Iídiche yi Hebr

Idiomas experimentais

Os seguintes idiomas estão em desenvolvimento ativo e ainda não são avaliados regularmente.

Idioma Idioma (nome em inglês) Código languageHints Script Notas
አማርኛ Amárico am Ethi
Αρχαία ελληνικά Grego antigo grc Grek
অসমীয়া Assamês as Beng
Azərbaycan Azeri az Latn
Azərbaycan (qədim yazı) Azeri az-Cyrl Cyrl Ortografia antiga
Euskara Basco eu Latn
Bosanski Bósnio bs Latn
မြန်မာ Birmanês my Mymr
Cebuano Cebuano ceb Latn
ᏣᎳᎩ ᎦᏬᏂᎯᏍᏗ Cherokee chr Cher
dhivehi, dhivehi-bas Divehi dv Thaa
རྫོང་ཁ Dzonkha dz Tibt
Esperanto Esperanto eo Latn
Galego Galego gl Latn
ქართული Georgiana ka Geor
Kreyòl Ayisyen Crioulo haitiano ht Latn
Gaeilge Irlandês ga Latn
Jawa Javanês jv Latn
Қазақ Cazaque kk Cyrl
Kirghiz Quirguiz ky Cyrl
Latine Latim la Latn
Malti Maltês mt Latn
Монгол Mongol mn Cyrl
ଓଡ଼ିଆ Oriya or Orya
پښتو Pastó ps Arab
संस्कृतम् Sânscrito sa Deva
සිංහල Cingalês si Sinh
Swahili Suaíli sw Latn
leššānā Suryāyā Siríaco syr Syriac
བོད་སྐད་ Tibetano bo Tibt
ትግርኛ Tigrinya ti Ethi
اردو Urdu ur Arab
oʻzbekcha Usbeque uz Latn Latim
oʻzbekcha Usbeque uz-Cyrl Cyrl Ortografia antiga
Cymraeg Galês cy Latn
IsiZulu Zulu zu Latn

Idiomas mapeados

Os seguintes idiomas estão mapeados para outro código de idioma ou para um reconhecedor de carateres geral.

Idioma Idioma (nome em inglês) Código languageHints Script Notas
بهسا اچيه Achém ace Latn Modelo latino
Lwo Acholi ach Latn Modelo latino
Dangme Adangme ada Latn Modelo latino
Akan Akan ak Latn Modelo latino
Anicinâbemowin Algonquino alg Latn Modelo latino
Mapudungu Araucano/mapuche arn Latn Modelo latino
Asturianu Asturiano ast Latn Modelo latino
Dene Athabaskan ath Latn Modelo latino
Aymar aru Aimará ay Latn Modelo latino
Bhāṣa Bali Balinês ban Latn Modelo latino
Bamanankan Bambara bm Latn Modelo latino
Narrow Bantu Bantu bnt Latn Modelo latino
башҡорт теле Bashkir ba Cyrl Modelo cirílico
Toba–Batak Bataque btk Latn Modelo latino
Chibemba Bemba bem Latn Modelo latino
Bikol Naga Bikol bik Latn Modelo latino
Bichelamar Bislama bi Latn Modelo latino
Brezhoneg Bretão br Latn Modelo latino
нохчийн мотт / noxçiyn mott Checheno ce Cyrl Modelo cirílico
汉语 Chinês (mandarim, simplificado) zh-Hans Hans Modelo chinês
漢語 Chinês (mandarim, tradicional) zh-Hant Hant Modelo chinês
普通話 Chinês (mandarim, Hong Kong) zh-Hant-HK Hant Modelo chinês
Chahta' Choctaw cho Latn Modelo latino
Чӑвашла Chuvache cv Cyrl Modelo cirílico
Cree–Montagnais–Naskapi Cree cr Latn Modelo latino
Mvskoke Riacho mus Latn Modelo latino
qırımtatar tili, къырымтатар тили Tártaro da Crimeia crh Latn Modelo cirílico
Dakhótiyapi, Dakȟótiyapi Dakota dak Latn Modelo latino
Douala Duala dua Latn Modelo latino
Ikɔ Efik Efik efi Latn Modelo latino
English (British) Inglês (Reino Unido) en-GB Latn Modelo latino
Èʋegbe Ewe ee Latn Modelo latino
føroyskt mál Faroé fo Latn Modelo latino
Na Vosa Vakaviti Fijiano fj Latn Modelo latino
fɔ̀ngbè Fon fon Latn Modelo latino
Français canadien Francês (Canadá) fr-CA Latn Modelo latino
Fulani, Fulah, Peul Fula ff Latn Modelo latino
Ga gaa Latn Modelo latino
Luganda Ganda lg Latn Modelo latino
Basa Gayo Gayo gay Latn Modelo latino
Kiribati Gilbertês gil Latn Modelo latino
Gothic Gótico got Latn Modelo latino
Guaraní Guarani gn Latn Modelo latino
Harshen/Halshen Hausa هَرْشَن هَوْسَ Haúça ha Latn Modelo latino
ʻŌlelo Hawaiʻi Havaiano haw Latn Modelo latino
Otjiherero Herero hz Latn Modelo latino
Ilonggo Hiligaynon hil Latn Modelo latino
Jaku Iban Iban iba Latn Modelo latino
Asụsụ Igbo Igbo ig Latn Modelo latino
Ilokano Iloko ilo Latn Modelo latino
Taqbaylit Kabyle kab Latn Modelo latino
Jingpho Kachin kac Latn Modelo latino
Kalaallisut Kalaallisut kl Latn Modelo latino
Kikamba Kikamba kam Latn Modelo latino
Kanuri Kanuri kr Latn Modelo latino
Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى Caracalpaque kaa Cyrl/Latn Modelo cirílico
Ka Ktien Khasi Khasi kha Latn Modelo latino
Gĩkũyũ Kikuyu ki Latn Modelo latino
Kinyarwanda Kinyarwanda rw Latn Modelo latino
коми кыв Komi kv Cyrl Modelo cirílico
Kikongo Conguês kg Latn Modelo latino
Kosraean Kosraean kos Latn Modelo latino
Oshikwanyama Cuanhama kj Latn Modelo latino
Ngala Lingala ln Latn Modelo latino
Plattdütsch, Plattdeutsch, Nedersaksisch Baixo-alemão nds Latn Modelo latino
siLozi Lozi loz Latn Modelo latino
Kiluba Luba-katanga lu Latn Modelo latino
Dholuo Luo luo Latn Modelo latino
Madhura, Basa Mathura, بَهاسَ مَدورا Madurês mad Latn Modelo latino
Malagasy Malgaxe mg Latn Modelo latino
Mandinka, لغة مندنكا Mandingo man Latn Modelo latino
Gaelg, Gailck Manquês gv Latn Modelo latino
Te reo Māori Maori mi Latn Modelo latino
Ebon Marshalês mh Latn Modelo latino
Mɛnde yia Mende men Latn Modelo latino
Middle English Inglês médio enm Latn Modelo latino
Mittelhochdeutsch Alto-alemão médio gmh Latn Modelo latino
Baso Minangkabau, باسو مينڠكاباو Minangkabau min Latn Modelo latino
Kanienʼkéha Mohawk moh Latn Modelo latino
Nkundu Mongo lol Latn Modelo latino
Nāhuatl Nauatle nah Latn Modelo latino
Diné bizaad Navajo nv Latn Modelo latino
Ndonga Ndonga ng Latn Modelo latino
ko e vagahau Niuē Niueano niu Latn Modelo latino
Zimbabwe Ndebele Ndebele do norte nd Latn Modelo latino
Sesotho sa Leboa Soto do Norte nso Latn Modelo latino
Chichewa, Chinyanja Nianja ny Latn Modelo latino
Runyankore Nyankole nyn Latn Modelo latino
Chitonga Nyasa tonga tog Latn Modelo latino
Appolo Nzima nzi Latn Modelo latino
Occitan, lenga d'òc, provençal Occitânico oc Latn Modelo latino
Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ Ojíbua oj Latn Modelo latino
Ænglisc, Englisc, Anglisc Inglês antigo ang Latn Modelo latino
Franceis, François, Romanz Francês antigo fro Latn Modelo latino
Diutisk, Althochdeutsch Alto-alemão antigo goh Latn Modelo latino
Dǫnsk tunga Nórdico antigo non Latn Modelo latino
Occitan ancian Provençal antigo pro Latn Modelo latino
ирон ӕвзаг Osseta os Cyrl Modelo cirílico
Kapampangan Pampanga pam Latn Modelo latino
Salitan Pangasinan Pangasinês pag Latn Modelo latino
Papiamentu Papiamento pap Latn Modelo latino
Português (Portugal) Português (europeu) pt-PT Latn Modelo latino
Kechua / Runa Simi Quíchua qu Latn Modelo latino
Rumantsch Romanche rm Latn Modelo latino
Romani čhib Romani rom Latn Modelo latino
Ikirundi Rundi rn Latn Modelo latino
Sakha Sakha sah Cyrl Modelo cirílico
Gagana faʻa Sāmoa Samoano sm Latn Modelo latino
yângâ tî sängö Sango sg Latn Modelo latino
(Braid) Scots, Lallans, Doric Escocês sco Latn Modelo latino
Gàidhlig Gaélico Escocês gd Latn Modelo latino
chiShona Shona sn Latn Modelo latino
Songhay Songai son Latn Modelo latino
Sesotho Sesoto st Latn Modelo latino
Español (Latinoamérica) Espanhol (latino-americano) es-419 Latn Modelo latino
ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda Sundanês su Latn Modelo latino
siSwati Suazi ss Latn Modelo latino
Reo Tahiti Taitiano ty Latn Modelo latino
тоҷикӣ Tajique tg Cyrl Modelo cirílico
татар теле Tártaro tt Cyrl/Latn Modelo cirílico
KʌThemnɛ Temne tem Latn Modelo latino
lea faka-Tonga Tonga to Latn Modelo latino
Xitsonga Tsonga ts Latn Modelo latino
Setswana Tsuana tn Latn Modelo latino
Türkmençe Turcomenistão tk Latn Modelo cirílico
удмурт кыл Udmurte udm Cyrl Modelo cirílico
Tshivenḓa Venda ve Latn Modelo latino
Vod Vótico vot Cyrl/Latn Modelo cirílico
Frysk Frísico ocidental fy Latn Modelo latino
Wolof Jalofo wo Latn Modelo latino
isiXhosa Xhosa xh Latn Modelo latino
Èdè Yorùbá Iorubá yo Latn Modelo latino
Diidxazá Zapotec zap Latn Modelo latino

Scripts de escrita manual

Os seguintes scripts são suportados para o reconhecimento de escrita manual. Consulte as tabelas de idiomas acima para ver os idiomas que usam cada script.

Script Nome Nível de apoio técnico
Beng Bengali Experimental
Cyrl Cirílico Experimental
Deva Devanagari Experimental
Grek Grego Experimental
Hani Chinês Experimental
Jpan Japonês Suportado
Kore Coreano Suportado
Latn Latim Suportado
vi Vietnamita Experimental