Suporte a idiomas OCR

O recurso de reconhecimento de texto da API Cloud Vision é capaz de detectar uma grande variedade de idiomas, além de detectar vários idiomas dentro de uma única imagem.

Não é preciso fornecer uma dica de idioma para o serviço. No entanto, isso poderá ser feito se houver dificuldade para detectar o idioma usado na imagem.

Com o lançamento do OCR de escrita à mão em disponibilidade geral, as imagens com manuscritos não precisam mais da sinalização languageHints ao usar DOCUMENT_TEXT_DETECTION.

As dicas de idioma opcionais são especificadas no ImageContext de uma solicitação como uma lista de languageHints para uma solicitação TEXT_DETECTION e DOCUMENT_TEXT_DETECTION.

Cada parâmetro de código de idioma normalmente consiste em um identificador BCP-47. Esse parâmetro pode estar no formato idioma-região, em que a primeira parte é o idioma principal e a segunda, que é opcional, refere-se à região, geralmente um identificador de país, de um dialeto específico. Por exemplo, podemos representar o chinês nas variações simplificado, conforme escrito na China (zh-Hans), ou tradicional, conforme escrito em Taiwan (zh-Hant).

Há três níveis de suporte a idiomas no recurso de reconhecimento de texto:

  1. Os idiomas compatíveis são aqueles que priorizamos e cujos desempenhos avaliamos regularmente.
  2. Os idiomas experimentais são os que estão em desenvolvimento ativo, mas não são avaliados regularmente.
  3. Os idiomas mapeados são aqueles compatíveis com o mapeamento para outro código de idioma ou para um reconhecedor geral de caracteres. Por exemplo, "en-GB" é compatível, mas não é tratado de forma diferente de "en" para fins de reconhecimento de texto. Fazemos um esforço para retornar o código de idioma mapeado correto no campo "Localidade da entidade". No entanto, os idiomas mapeados têm mais chance de serem confundidos com idiomas semelhantes do que idiomas com compatibilidade total ou experimental.

A lista de idiomas (com códigos languageHint associados) compatíveis com TEXT_DETECTION e DOCUMENT_TEXT_DETECTION é mostrada abaixo.

Se a dica de idioma for deixada em branco, tentaremos detectar automaticamente o idioma mais apropriado. O endpoint TEXT_DETECTION detectará automaticamente apenas um subconjunto de idiomas compatíveis, enquanto o endpoint DOCUMENT_TEXT_DETECTION detectará automaticamente o conjunto completo de idiomas compatíveis.

Idiomas compatíveis

Os idiomas a seguir são priorizados e avaliados regularmente.

Para filtrar por recursos, digite ou selecione diretamente o idioma escolhido no menu suspenso:

Idioma Idioma (nome em português) languageHints Script / notas
Africâner Africâner af Lântano
shqip Albanês sq Lântano
العربية Árabe ar Música árabe Padrão moderno
Հայ Armênio hy Arma
беларускі Belo Horizonte be Ciclone
বাংলা Bengalês bn Bengal
български Búlgaro bg Ciclone
Català Catalão ca Lântano
普通话 Chinês zh Hans/hant
Hrvatski Croata h Lântano
Čeítina Tcheco cs Lântano
Dansk Dinamarquês da Lântano
Nederlands Holandês nl Lântano
Inglês Inglês en Lacto; Americano
Eesti keel Estoniano et Lântano
Filipino Filipino fil (ou tl) Lântano
Suomi Finlandês fi Lântano
Français Francês fr Lacto; Europeia
Deutsch Alemão de Lântano
Ελληνικά Grego el Gravata
ગુજરાતી Gujarati gu Gujjar
עברית Hebraico iw Hebro
हिन्दी Hindi oi Deva
Magyar Húngaro hu Lântano
lenslenska Islandês representa Lântano
Bahasa Indonesia Indonésio id Lântano
Italiano Italiano it Lântano
日本語 Japonês ja Japão
ಕನ್ನಡ Canarês kn Knda
ភាសាខ្មែរ Khmer km Kmr
한국어 Coreano ko Kore
ລາວ Laosiano lo Laoo
Latviešu Letão lv Lântano
Lietuvių Lituano lt Lântano
Македонски Macedônio mk Ciclone
Bahasa Melayu Malaio ms Lântano
മലയാളം Malaiala ml Mula
मराठी Marata mr Deva
नेपाली Nepalês ne Deva
Norsk Norueguês no Lacto; Bokmål
فارسی Persa fa Música árabe
Polski Polonês pl Lântano
Português Português pt Lacto; brasileiro
ਪੰਜਾਬੀ punjabi pa Guru; Gurmukhi
Román Romeno ro Lântano
Pусский Russo ru Ciclone
Русский (старая орфография) Russo ru-PETR1708 Ciclos; Ortografia antiga
Српски Sérvio sr Ciclone e Latr
Српски (латиница) Sérvio sr-Latn Lântano
Slovenčina Slovak sk Lântano
Slovenščina Esloveno sl Lântano
Español Espanhol es Lacto; Europeia
Svenska Sueco sv Lântano
தமிழ் Tâmil ta Música em tâmil
తెలుగు Télugo te Tul
ไทย Tailandês th Tailandês
Türkçe Turco tr Lântano
Українськa Ucraniano uk Ciclone
Tiếng Việt Vietnamita vi Lântano
Ídiche Ídiche yi Hebro

Idiomas experimentais

Os idiomas a seguir estão em desenvolvimento ativo e ainda não são avaliados regularmente.

Idioma Idioma (nome em português) Código do languageHints Script / notas
አማርኛ Amárico da manhã Ethi
Αρχαία Grego antigo GRU Gravata
অসমীয়া Assamês as Bengal
Azərbaycan Azerbaijano az Lântano
Azərbaycan (qədim yazı) Azerbaijano Az-Cyr Ciclos; Ortografia antiga
Elusa Basco eu Lântano
Bosanski Bósnio bs Lântano
မြန်မာ Birmanês my Mim
Cebuano Cebuano ceb Lântano
ᏣᎳᎩ Cheroqui Chr Cher
dhivehi, dhivehi-bas Divehi VS Thaa
རྫོང་ཁ Dzonga DJ Tibt
Esperanto Esperanto eo Lântano
Galgo galega gl Lântano
ქართული Georgiano ka Geor
Kreyòl Ayisyen Creole haitiano ht Lântano
Gaílico Irlandês ga Lântano
Jawa Javanês jv Lântano
Қазақ Cazaque kk Ciclone
Quirguiz Quirguiz ky Ciclone
Latina Latim la Lântano
Malti Maltês mt Lântano
Монгол Mongol mn Ciclone
ଓଡ଼ିଆ Oriá ou Orya
پښتو Pachto ps Música árabe
संस्कृतम् Sânscrito sa Deva
සිංහල Cingalês si Sinim
Suaíli Suaíli sw Lântano
Leānā Suryāyā Siríaco senhor Siríaco
བོད་སྐད་ Tibetano bo Tibt
ትግርኛ Tigiriya ti Ethi
اردو Urdu ur Música árabe
Oʻzbekcha Uzbeque uz Lacto; Música latina
Oʻzbekcha Uzbeque uz-cirro Ciclos; Ortografia antiga
Ciclone Galês cy Lântano
Izuú Zulu zu Lântano

Idiomas mapeados

Os idiomas a seguir são mapeados para outro código de idioma ou para um reconhecedor geral de caracteres.

Idioma Idioma (nome em português) languageHints Script / notas Mapeado para
بهسا Achém culto Lântano Modelo de script latino
OK Acholi andar Lântano Modelo de script latino
Dangme Adangme Ada Lântano Modelo de script latino
Akan Akan ak Lântano Modelo de script latino
Antiâbemowin Algonquiciano alg Lântano Modelo de script latino
Mapudungu Araucaniano/Mapuche Arn Lântano Modelo de script latino
Asturiano Asturiano Ast Lântano Modelo de script latino
Dene Athabaskan ath Lântano Modelo de script latino
Aymar aru Aimará y Lântano Modelo de script latino
Bhāṣa Bali Balinês banir Lântano Modelo de script latino
Bamananque Bambara Bm Lântano Modelo de script latino
Bantu de estreito Bantu cnt Lântano Modelo de script latino
башҡорт Bashkir ba Ciclone Modelo de script cirílico
Tobaíba Batak btk Lântano Modelo de script latino
Chibamba Bemba cama Lântano Modelo de script latino
bikol Naga bikol Bik Lântano Modelo de script latino
Bichenamar Bislamá bi Lântano Modelo de script latino
Brezhoneg Bretão br Lântano Modelo de script latino
нохчийн мотт / noxçiyn mott Checheno c Ciclone Modelo de script cirílico
汉语 Chinês zh-Gans Hans; Simplificada Mandarim zh
漢語 Chinês zh-Hant Hant; Tradicional; Mandarim zh
普通話 Chinês zh-Hant-HK Hant; Mandarim Hong Kong zh
Chahta Choctaw chorão Lântano Modelo de script latino
Чӑвашла Chuvache PC Ciclone Modelo de script cirílico
Cree – Montagnais–Neskapi Cree cr Lântano Modelo de script latino
Mvskoke Creek mus Lântano Modelo de script latino
qırımtatar tili, къырымтатар тили Tártaro da Crimeia cruz Lântano Modelo de script cirílico
Dakhótiyapi, Dakȟótiyapi Dakota pato Lântano Modelo de script latino
Douala Duala Dua Lântano Modelo de script latino
Ikɔ Efik Efik Efi Lântano Modelo de script latino
Inglês (Reino Unido) Inglês en-GB Lacto; Britisa en
Èʋegbe Ewe en Lântano Modelo de script latino
Féroyskt mál Faroês fo Lântano Modelo de script latino
Na Vosa Vakaviti Fijiano fj Lântano Modelo de script latino
fɔ̀ngbè Fon fondu Lântano Modelo de script latino
François canadien Francês fr-CA Lacto; Canadense fr
Fulani (Flah, Peul) Fula ff Lântano Modelo de script latino
AL Gaa gaa Lântano Modelo de script latino
Luganda Ganda lg Lântano Modelo de script latino
Basa Gayo Gayo gay Lântano Modelo de script latino
Kiribati Gilbertês dourado Lântano Modelo de script latino
Gótico Gótico ficou Lântano Modelo de script latino
Guarani Guarani g Lântano Modelo de script latino
Harshen/Halshen Hausa هَرْشَن هَوْسَ Hauçá ha Lântano Modelo de script latino
Halelo hawaiʻi Havaiano haw Lântano Modelo de script latino
Otjiherero Hereró z Lântano Modelo de script latino
Ilonggo Hiligaynon Hail Lântano Modelo de script latino
Jaku Iban Iban oi Lântano Modelo de script latino
Assé Igbo Igbo ig Lântano Modelo de script latino
Ilokano Iloko Ilo Lântano Modelo de script latino
Taqbaylit Kabyle kab Lântano Modelo de script latino
Jingpho Kachin KC Lântano Modelo de script latino
Groenlandês Groenlandês kl Lântano Modelo de script latino
Quikamba Kamba Kamm Lântano Modelo de script latino
Kanuri Kanuri kr Lântano Modelo de script latino
Qaraqalpq tili, Қарақалпақ тили, قاراقالپاق تىلى Kara-Kalpak kaa Cyr/Latn Modelo de script cirílico
Ka Ktien Khasi Khasi kha Lântano Modelo de script latino
Gĩkũy Kikuyu ki Lântano Modelo de script latino
Kinyarwanda Kinyarwanda r Lântano Modelo de script latino
коми Komi Kv Ciclone Modelo de script cirílico
Quicongo Quicongo kg Lântano Modelo de script latino
Kosraean Kosraean Kos Lântano Modelo de script latino
Oshikwanyama Kuanyama kj Lântano Modelo de script latino
Ngala Lingala ln Lântano Modelo de script latino
Plattdütsch, Plattdeutsch, Nedersaksisch (em inglês) Baixo alemão de Lântano Modelo de script latino
SiLoz Lozi loz Lântano Modelo de script latino
Quiruba Luba-katanga lu Lântano Modelo de script latino
Dunho Luo luo Lântano Modelo de script latino
Madhura, Basa Matura, بَهاسَ مَدورا Madurês mamãe Lântano Modelo de script latino
Malgaxe Malgaxe mg Lântano Modelo de script latino
Manmandaka, لغة مندنكا Mandingo (em inglês) homem Lântano Modelo de script latino
Gelele Manx gvT Lântano Modelo de script latino
Te reo māori Maori mi Lântano Modelo de script latino
Eagon Marshall m Lântano Modelo de script latino
Mɛnde yia Mende men Lântano Modelo de script latino
Inglês central Inglês central im Lântano Modelo de script latino
Miteltelhdeutsch Alto alemão alemão Gm Lântano Modelo de script latino
Baso Minangkabau, باسو مينڠكاباو Minangkabau min Lântano Modelo de script latino
Kanienʼkéha Moicano moh Lântano Modelo de script latino
Nkundu Mongo lol Lântano Modelo de script latino
Náhuatl Náuatle Nah Lântano Modelo de script latino
Dina Babload Navajo N Lântano Modelo de script latino
Ndonga Ndonga ng Lântano Modelo de script latino
Ko e Vaigahau Niuē Niueano nua Lântano Modelo de script latino
Ndebele do Zimbábue Ndebele do norte nd Lântano Modelo de script latino
Sesotho sa Leboa Sotho do norte Naso Lântano Modelo de script latino
Chichewa, Chinyanja Nianja ny Lântano Modelo de script latino
Runyankore Niankole Lântano Modelo de script latino
Chitonga Tongaa Nyasa tot Lântano Modelo de script latino
Appolo Nzima zigue Lântano Modelo de script latino
Occitant, lenga d'òc, provençal Occitano oc Lântano Modelo de script latino
Anislinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ Ojíbua Oj Lântano Modelo de script latino
Ænglisc, Englisc, Anglisc Inglês antigo ango Lântano Modelo de script latino
Frances, François, Romanz Francês antigo fro Lântano Modelo de script latino
Diutisk, Althochdeutsch Alemão alemão Goh Lântano Modelo de script latino
Tunga Dǫnsk nórdico antigo fora Lântano Modelo de script latino
Antocânico provençal antigo profissional Lântano Modelo de script latino
ирон Ossetic os Ciclone Modelo de script cirílico
Kapampangan Pampanga pam Lântano Modelo de script latino
Salita Pangasinan Língua pangasiana paginação Lântano Modelo de script latino
Papiádu Papiamento pa Lântano Modelo de script latino
Português (Portugal) Português pt-PT Lacto; Europeia pt
Kechua / Runa Simi Quíchua qu. Lântano Modelo de script latino
Rumtsch Romanche rm Lântano Modelo de script latino
Romani čhib Romani MM Lântano Modelo de script latino
Ikirundi Rundi rn Lântano Modelo de script latino
Sakha Sakha Sah Ciclone Modelo de script cirílico
Gabana Faāa Sāmoa Samoano sm Lântano Modelo de script latino
a tuâ tu tî säng Sango sg Lântano Modelo de script latino
Scots, lapela Escocês Sco Lântano Modelo de script latino
Gàidhlig Gaélico escocês gd Lântano Modelo de script latino
ChiShona Xona sn Lântano Modelo de script latino
Songhay Songai filho Lântano Modelo de script latino
Sesoto soto do sul st Lântano Modelo de script latino
Español (Latinoamérica) Espanhol es-419 Lacto; Espanhol (América Latina) es
ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda Sundanês su Lântano Modelo de script latino
Siswati Swati ss Lântano Modelo de script latino
Reo Taiti Taitiano tty Lântano Modelo de script latino
тоҷикӣ Tajique tg Ciclone Modelo de script cirílico
татар Tártaro tt Cyr/Latn Modelo de script cirílico
KʌThemɛ Temne Tema Lântano Modelo de script latino
Lea faka-Tonga Tonga to Lântano Modelo de script latino
Xitsonga Tsonga ts Lântano Modelo de script latino
Setsuana Tswana Neu Lântano Modelo de script latino
Türkmençe Turcomano tk Lântano Modelo de script cirílico
удмурт Udmurte lama Ciclone Modelo de script cirílico
Tashivena Venda ve Lântano Modelo de script latino
Votação Vótico Vot Cyr/Latn Modelo de script cirílico
Frysk Frísio ocidental fy Lântano Modelo de script latino
Wolof Wolof au Lântano Modelo de script latino
IsXhosa Xosa xh Lântano Modelo de script latino
É Noodè Iorubá yo Lântano Modelo de script latino
Diidxazá Zapoteca Zap Lântano Modelo de script latino