Suporte a idiomas OCR

O recurso de reconhecimento de texto da API Cloud Vision é capaz de detectar uma grande variedade de idiomas, além de detectar vários idiomas dentro de uma única imagem.

Não é preciso fornecer uma dica de idioma para o serviço. No entanto, isso poderá ser feito se houver dificuldade para detectar o idioma usado na imagem.

Com o lançamento do OCR de escrita à mão em disponibilidade geral, as imagens com manuscritos não precisam mais da sinalização languageHints ao usar DOCUMENT_TEXT_DETECTION.

As dicas de idioma opcionais são especificadas no ImageContext de uma solicitação como uma lista de languageHints para uma solicitação TEXT_DETECTION e DOCUMENT_TEXT_DETECTION.

Cada parâmetro de código de idioma normalmente consiste em um identificador BCP-47. Esse parâmetro pode estar no formato idioma-região, em que a primeira parte é o idioma principal e a segunda, que é opcional, refere-se à região, geralmente um identificador de país, de um dialeto específico. Por exemplo, podemos representar o chinês nas variações simplificado, conforme escrito na China (zh-Hans), ou tradicional, conforme escrito em Taiwan (zh-Hant).

Há três níveis de suporte a idiomas no recurso de reconhecimento de texto:

  1. Os idiomas compatíveis são aqueles que priorizamos e cujos desempenhos avaliamos regularmente.
  2. Os idiomas experimentais são os que estão em desenvolvimento ativo, mas não são avaliados regularmente.
  3. Os idiomas mapeados são aqueles compatíveis com o mapeamento para outro código de idioma ou para um reconhecedor geral de caracteres. Por exemplo, "en-GB" é compatível, mas não é tratado de forma diferente de "en" para fins de reconhecimento de texto. Fazemos um esforço para retornar o código de idioma mapeado correto no campo "Localidade da entidade". No entanto, os idiomas mapeados têm mais chance de serem confundidos com idiomas semelhantes do que idiomas com compatibilidade total ou experimental.

A lista de idiomas (com códigos languageHint associados) compatíveis com TEXT_DETECTION e DOCUMENT_TEXT_DETECTION é mostrada abaixo.

Se a dica de idioma for deixada em branco, tentaremos detectar automaticamente o idioma mais apropriado. O endpoint TEXT_DETECTION detectará automaticamente apenas um subconjunto de idiomas compatíveis, enquanto o endpoint DOCUMENT_TEXT_DETECTION detectará automaticamente o conjunto completo de idiomas compatíveis.

Idiomas compatíveis

Os idiomas a seguir são priorizados e avaliados regularmente.

Para filtrar por recursos, digite ou selecione diretamente o idioma escolhido no menu suspenso:

Idioma Idioma (nome em português) Código languageHints Script / observações
Africâner Africâner af Latn
shqip Albanês sq Latn
العربية Árabe ar Arabrabe; Padrão moderno
Հայ Armênio hy Armn
беларускі Bielorrusso be Cyrl
বাংলা Bengalês bn Beng
български Búlgaro bg Cyrl
Catalão Catalão ca Latn
普通话 Chinês zh Hans/Hant
Hrvatski Croata h Latn
Čeština Tcheco cs Latn
Dansk Dinamarquês da Latn
Nederlands Holandês nl Latn
Inglês Inglês en Latn; Americano
Eesti keel Estoniano et Latn
Filipino Filipino fil ou tl Latn
Suomi Finlandês fi Latn
Français Francês fr Latn; Europeu
Deutsch Alemão de Latn
Ελληνικά Grego el Grego
ગુજરાતી Gujarati gu Gujr
עברית Hebraico iw Hebr
हिन्दी Hindi oi Deva
Magyar Húngaro hu Latn
Íslenska Islandês representa Latn
Bahasa Indonesia Indonésio id Latn
Italiano Italiano it Latn
日本語 Japonês ja Japão
ಕನ್ನಡ Canarês kn Knda
ភាសាខ្មែរ Khmer km Khmr
한국어 Coreano ko Kore
ລາວ Laosiano lo Laoo
Latviešu Letão lv Latn
Lietuvių Lituano lt Latn
Македонски Macedônio mk Cyrl
Bahasa Melayu Malaio ms Latn
മലയാളം Malaiala ml Mlym
मराठी Marata mr Deva
नेपाली Nepalês ne Deva
Norsk Norueguês não Latn; Bokmål
فارسی Persa fa Arab
Polski Polonês pl Latn
Português Português pt Latn; Brasileiro
ਪੰਜਾਬੀ punjabi pa Guru; Gurmukhi
Română Romeno ro Latn
Pусский Russo ru Cyrl
Русский (старая орфография) Russo ru-PETR1708 Cyrl; Ortografia antiga
Српски Sérvio sr Cyrl & Latn
Српски (латиница) Sérvio sr-Latn Latn
Slovenčina Slovak sk Latn
Slovenščina Esloveno sl Latn
Español Espanhol es Latn; Europeu
Svenska Sueco sv Latn
தமிழ் Tâmil ta Taml
తెలుగు Télugo te Telu
ไทย Tailandês th Tailandês
Türkçe Turco tr Latn
Українськa Ucraniano uk Cyrl
Tiếng Việt Vietnamita vi Latn
Ídiche Ídiche yi Hebr

Idiomas experimentais

Os idiomas a seguir estão em desenvolvimento ativo e ainda não são avaliados regularmente.

Idioma Idioma (nome em português) languageHints código Script / observações
አማርኛ Amárico da manhã Ethi
Αρχαία ελληνικά grego antigo GRC Grego
অসমীয়া Assamês as Beng
Azərbaycan Azerbaijano az Latn
Azərbaycan (qədim yazı) Azerbaijano az-Cyrl Cyrl; ortografia antiga
Euskara Basco eu Latn
Bosanski Bósnio bs Latn
မြန်မာ Birmanês my Mymr
Cebuano Cebuano ceb Latn
ᏣᎳᎩ ᎦᏬᏂᎯᏍᏗ Cheroqui chr Cher
dhivehi, dhivehi-bas Divehi dv Thaa
རྫོང་ཁ Dzonkha dz Tibt
Esperanto Esperanto eo Latn
Galego galega gl Latn
ქართული Georgiano ka Geor
Kreyòl Ayisyen Creole haitiano ht Latn
Gaeilge Irlandês ga Latn
Jawa Javanês jv Latn
Қазақ Cazaque kk Cyrl
Quirguiz Quirguiz ky Cyrl
Latim Latim la Latn
Malti Maltês mt Latn
Монгол Mongol mn Cyrl
ଓଡ଼ିଆ Oriá ou Orya
پښتو Pachto ps Arab
संस्कृतम् Sânscrito sa Deva
සිංහල Cingalês si Sinh
Suaíli Suaíli sw Latn
leššānā Suryāyā Siríaco syr Siríaco
བོད་སྐད་ Tibetano bo Tibt
ትግርኛ Tigirinya ti Ethi
اردو Urdu ur Arab
oʻzbekcha Uzbeque uz Latn; Latim
oʻzbekcha Uzbeque uz-Cyrl Cyrl; ortografia antiga
Cymraeg Galês cy Latn
IsiZulu Zulu zu Latn

Idiomas mapeados

Os idiomas a seguir são mapeados para outro código de idioma ou para um reconhecedor geral de caracteres.

Idioma Idioma (nome em português) Código languageHints Script / observações Mapeado para
بهسا Achém ace Latn Modelo de script latino
Lwo Acholi ach Latn Modelo de script latino
Dangme Adangme ada Latn Modelo de script latino
Akan Akan ak Latn Modelo de script latino
Anicinâbemowin Algonquinian alg Latn Modelo de script latino
Mapudungu Araucanian/Mapuche arn Latn Modelo de script latino
Asturianu Asturiano ast Latn Modelo de script latino
Dene Athabaskan ath Latn Modelo de script latino
Aymar aru Aymara ay Latn Modelo de script latino
Bhāṣa Bali Balinês ban Latn Modelo de script latino
Bamanankan Bambara bm Latn Modelo de script latino
Narrow Bantu Bantu bnt Latn Modelo de script latino
башҡорт теле Bashkir ba Cyrl Modelo de script Cirílico
Toba–Batak Batak btk Latn Modelo de script latino
Chibemba Bemba bem Latn Modelo de script latino
Bikol Naga Bikol bik Latn Modelo de script latino
Bichelamar Bislamá bi Latn Modelo de script latino
Brezhoneg Bretão br Latn Modelo de script latino
нохчийн мотт / noxçiyn mott Checheno ce Cyrl Modelo de script Cirílico
汉语 Chinês zh-Hans Hans Simplificado Mandarim zh
漢語 Chinês zh-Hant Hant Tradicional Mandarim zh
普通話 Chinês zh_Hant_HK Hant; Mandarim; Hong Kong zh
Chahta' Choctaw cho Latn Modelo de script latino
Чӑвашла Chuvache cv Cyrl Modelo de script Cirílico
Cree–Montagnais–Naskapi Cree cr Latn Modelo de script latino
Mvskoke Creek mus Latn Modelo de script latino
qırımtatar tili, къырымтатар тили Tártaro da Crimeia crh Latn Modelo de script Cirílico
Dakhótiyapi, Dakȟótiyapi Dakota dak Latn Modelo de script latino
Douala Duala dua Latn Modelo de script latino
Ikɔ Efik Efik efi Latn Modelo de script latino
Inglês (britânico) Inglês en-GB Latn; Britânica en
Èʋegbe Ewe ee Latn Modelo de script latino
føroyskt mál Faroês fo Latn Modelo de script latino
Na Vosa Vakaviti Fijiano fj Latn Modelo de script latino
fɔ̀ngbè Fon fon Latn Modelo de script latino
Français canadien Francês fr-CA Latn; Canadá fr
Fulani, Fulah, Peul Fulah ff Latn Modelo de script latino
Ga gaa Latn Modelo de script latino
Luganda Ganda lg Latn Modelo de script latino
Basa Gayo Gayo gay Latn Modelo de script latino
Kiribati Gilbertese gil Latn Modelo de script latino
Gothic Gothic got Latn Modelo de script latino
Guaraní Guarani gn Latn Modelo de script latino
Harshen/Halshen Hausa هَرْشَن هَوْسَ Hauçá ha Latn Modelo de script latino
ʻŌlelo Hawaiʻi Havaiano haw Latn Modelo de script latino
Otjiherero Herero hz Latn Modelo de script latino
Ilonggo Hiligaynon hil Latn Modelo de script latino
Jaku Iban Iban iba Latn Modelo de script latino
Asụsụ Igbo Igbo ig Latn Modelo de script latino
Ilokano Iloko ilo Latn Modelo de script latino
Taqbaylit Kabyle kab Latn Modelo de script latino
Jingpho Kachin kac Latn Modelo de script latino
Groenlandês Groenlandês kl Latn Modelo de script latino
Kikamba Kamba kam Latn Modelo de script latino
Kanuri Kanuri kr Latn Modelo de script latino
Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى Kara-Kalpak kaa Cyrl/Latn Modelo de script Cirílico
Ka Ktien Khasi Khasi kha Latn Modelo de script latino
Gĩkũyũ Kikuyu ki Latn Modelo de script latino
Kinyarwanda Kinyarwanda rw Latn Modelo de script latino
коми кыв Komi kv Cyrl Modelo de script Cirílico
Kikongo Quicongo kg Latn Modelo de script latino
Kosraean Kosraean kos Latn Modelo de script latino
Oshikwanyama Kuanyama kj Latn Modelo de script latino
Ngala Lingala ln Latn Modelo de script latino
Plattdütsch, Plattdeutsch, Nedersaksisch Baixo-alemão nds Latn Modelo de script latino
siLozi Lozi loz Latn Modelo de script latino
Kiluba Luba-katanga lu Latn Modelo de script latino
Dholuo Luo luo Latn Modelo de script latino
Madhura, Basa Mathura, بَهاسَ مَدورا Madurês mad Latn Modelo de script latino
Malgaxe Malgaxe mg Latn Modelo de script latino
Mandinka, لغة مندنكا Mandingo homem Latn Modelo de script latino
Gaelg, Gailck Manx gv Latn Modelo de script latino
Te reo Māori Maori mi Latn Modelo de script latino
Ebon Marshallese mh Latn Modelo de script latino
Mɛnde yia Mende men Latn Modelo de script latino
Inglês médio Inglês médio enm Latn Modelo de script latino
Mittelhochdeutsch Alto-alemão médio gmh Latn Modelo de script latino
Baso Minangkabau, باسو مينڠكاباو Minangkabau min Latn Modelo de script latino
Kanienʼkéha Mohawk moh Latn Modelo de script latino
Nkundu Mongo lol Latn Modelo de script latino
Nāhuatl Náuatle nah Latn Modelo de script latino
Diné bizaad Navajo nv Latn Modelo de script latino
Ndonga Ndonga ng Latn Modelo de script latino
ko e vagahau Niuē Niueano niu Latn Modelo de script latino
Zimbabwe Ndebele Ndebele do norte nd Latn Modelo de script latino
Sesotho sa Leboa Sotho do norte nso Latn Modelo de script latino
Chichewa, Chinyanja Nianja ny Latn Modelo de script latino
Runyankore Nyankole nyn Latn Modelo de script latino
Chitonga Nyasa Tonga tog Latn Modelo de script latino
Appolo Nzima nzi Latn Modelo de script latino
Occitan, lenga d'òc, provençal Occitano oc Latn Modelo de script latino
Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ Ojibwa oj Latn Modelo de script latino
Ænglisc, Englisc, Anglisc Inglês antigo ang Latn Modelo de script latino
Franceis, François, Romanz Francês antigo fro Latn Modelo de script latino
Diutisk, Althochdeutsch Alto alemão antigo goh Latn Modelo de script latino
Dǫnsk tunga Norueguês antigo non Latn Modelo de script latino
Anciano occitano Provençal antigo pro Latn Modelo de script latino
ирон ӕвзаг Ossetic os Cyrl Modelo de script Cirílico
Kapampangan Pampanga pam Latn Modelo de script latino
Salitan Pangasinan Língua pangasiana pag Latn Modelo de script latino
Papiamentu Papiamento pap Latn Modelo de script latino
Português (Portugal) Português pt-PT Latn; Europeu pt
Kechua / Runa Simi Quíchua qu Latn Modelo de script latino
Rumantsch Romanche rm Latn Modelo de script latino
Romani čhib Romani rom Latn Modelo de script latino
Ikirundi Rundi rn Latn Modelo de script latino
Sakha Sakha sah Cyrl Modelo de script Cirílico
Gagana faʻa Sāmoa Samoano sm Latn Modelo de script latino
yângâ tî sängö Sango sg Latn Modelo de script latino
(Trança) Escocês, Lallans, Dórico Escocês sco Latn Modelo de script latino
Gàidhlig Gaélico escocês gd Latn Modelo de script latino
chiShona Xona sn Latn Modelo de script latino
Songhay Songhai son Latn Modelo de script latino
Sesoto soto do sul st Latn Modelo de script latino
Espanhol (América Latina) Espanhol es-419 Latn; América Latina es
ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda Sundanês su Latn Modelo de script latino
siSwati Swati ss Latn Modelo de script latino
Reo Tahiti Taitiano ty Latn Modelo de script latino
тоҷикӣ Tajique tg Cyrl Modelo de script Cirílico
татар теле Tártaro tt Cyrl/Latn Modelo de script Cirílico
KʌThemnɛ Temne tem Latn Modelo de script latino
lea faka-Tonga Tonga to Latn Modelo de script latino
Xitsonga Tsonga ts Latn Modelo de script latino
Setsuana Tswana tn Latn Modelo de script latino
Türkmençe Turcomano tk Latn Modelo de script Cirílico
удмурт кыл Udmurte udm Cyrl Modelo de script Cirílico
Tshivenḓa Venda ve Latn Modelo de script latino
Vod Votic vot Cyrl/Latn Modelo de script Cirílico
Frysk Frísio ocidental fy Latn Modelo de script latino
Wolof Wolof wo Latn Modelo de script latino
isiXhosa Xosa xh Latn Modelo de script latino
Èdè Yorùbá Iorubá yo Latn Modelo de script latino
Diidxazá Zapotec zap Latn Modelo de script latino