Compatibilidad del OCR con distintos idiomas

La característica de reconocimiento de texto de la API de Cloud Vision puede detectar una gran variedad de idiomas, incluso en una sola imagen.

No es necesario proporcionar una sugerencia de idioma al servicio, pero es posible hacerlo si este tiene problemas para detectar el lenguaje que se usa en tu imagen.

Con el lanzamiento de OCR de escritura a mano disponible al público general, las imágenes que tienen escritura a mano ya no requieren una marca de escritura a mano languageHints cuando se usa DOCUMENT_TEXT_DETECTION.

Las sugerencias de idioma opcionales se especifican en el ImageContext de una solicitud como una lista de languageHints para una solicitud DOCUMENT_TEXT_DETECTION y TEXT_DETECTION.

Por lo general, cada parámetro del código de idioma consta de un identificador BCP-47. Este parámetro puede tener el formato idioma-región, en el que el idioma se refiere al idioma principal, y la región opcional se refiere a una región (por lo general, un identificador de país) con un dialecto determinado. Por ejemplo, el chino puede representarse como chino simplificado, que se usa en la República Popular China (zh-Hans), o como chino tradicional, que se usa en Taiwán (zh-Hant).

Existen tres niveles de compatibilidad de idiomas en la función de reconocimiento de texto:

  1. Los idiomas compatibles son los que priorizamos y con los que evaluamos el rendimiento de forma periódica.
  2. Los idiomas experimentales son aquellos que se encuentran en desarrollo activo, pero que no se evalúan con regularidad.
  3. Los idiomas asignados son aquellos que pueden asignarse a otro código de idioma o a un reconocedor de caracteres general. Por ejemplo, “en-GB” es compatible, pero no se trata de manera diferente a “en” para reconocer texto. Nos esforzamos por mostrar el código de idioma asignado correcto en el campo de configuración regional de la entidad, pero los idiomas asignados tienen más probabilidades de identificarse de manera errónea como idiomas similares que los completamente admitidos o los experimentales.

A continuación, se muestra la lista de idiomas (con códigos languageHint asociados) compatibles con TEXT_DETECTION y DOCUMENT_TEXT_DETECTION.

Si la sugerencia de idioma se deja en blanco, intentaremos detectar de forma automática el idioma más apropiado. El extremo TEXT_DETECTION detectará de manera automática solo un subconjunto de idiomas compatibles, mientras que el extremo DOCUMENT_TEXT_DETECTION detectará automáticamente el conjunto completo de idiomas compatibles.

Idiomas compatibles

Los siguientes idiomas se priorizan y evalúan con regularidad.

Para filtrar por características, escribe o selecciona directamente el idioma deseado en el menú desplegable:

Lenguaje Idioma (nombre en español) Código languageHints Guion Notas
Afrikaans Afrikáans af Latn
shqip Albanés sq Latn
العربية Árabe ar Arab Estándar moderno
Հայ Armenio hy Armn
беларуская Bielorruso be Cyrl
বাংলা Bengalí bn Beng
български Búlgaro bg Cyrl
Català Catalán ca Latn
普通话 Chino zh Hans/Hant
Hrvatski Croata hr Latn
Čeština Checo cs Latn
Dansk Danés da Latn
Nederlands Holandés nl Latn
English Inglés en Latn Estadounidense
Eesti keel Estonio et Latn
Filipino Filipino fil Latn
Suomi Finés fi Latn
Français Francés fr Latn Europeo
Deutsch Alemán de Latn
Ελληνικά Griego el Grek
ગુજરાતી Guyaratí gu Gujr
עברית Hebreo iw Hebr
हिन्दी Hindi hi Deva
Magyar Húngaro hu Latn
Íslenska Islandés is Latn
Bahasa Indonesia Indonesio id Latn
Italiano Italiano it Latn
日本語 Japonés ja Jpan
ಕನ್ನಡ Canarés kn Knda
ភាសាខ្មែរ Jemer km Khmr
한국어 Corean ko Kore
ລາວ Lao lo Laoo
Latviešu Letón lv Latn
Lietuvių Lituano lt Latn
Македонски Macedonio mk Cyrl
Bahasa Melayu Malayo ms Latn
മലയാളം Malayalam ml Mlym
मराठी Marathi mr Deva
नेपाली Nepalí ne Deva
Norsk Noruego no Latn Bokmal noruego
فارسی Persa fa Arab
Polski Polaco pl Latn
Português Portugués pt Latn Brasilero
ਪੰਜਾਬੀ Punjabi pa Guru Gurmukhi
Română Rumano ro Latn
Русский Ruso ru Cyrl
Русский (старая орфография) Ruso ru-PETR1708 Cyrl Ortografía antigua
Српски Serbio sr Cyrl
Српски (латиница) Serbio sr-Latn Latn
Slovenčina Eslov sk Latn
Slovenščina Esloveno sl Latn
Español Español es Latn Europeo
Svenska Sueco sv Latn
Tagalog Tagalog tl Latn
தமிழ் Tamil ta Taml
తెలుగు Telugu te Telu
ไทย Tailandés th Thai
Türkçe Turco tr Latn
Українська Ucraniano uk Cyrl
Tiếng Việt Tiếng Việt vi Latn
Yiddish Yiddish yi Hebr

Idiomas experimentales

Los siguientes idiomas están en desarrollo activo y aún no se evalúan con regularidad.

Lenguaje Idioma (nombre en español) Código languageHints Guion Notas
አማርኛ Amhár am Ethi
Αρχαία ελληνικά Griego antiguo grc Grek
অসমীয়া Asamés as Beng
Azərbaycan Azerbaiyano az Latn
Azərbaycan (qədim yazı) Azerbaiyano az-Cyrl Cyrl Ortografía antigua
Euskara Vasco eu Latn
Bosanski Bosnio bs Latn
မြန်မာ Birmano my Mymr
Cebuano Cebuano ceb Latn
ᏣᎳᎩ ᎦᏬᏂᎯᏍᏗ Cheroqui chr Cher
dhivehi, dhivehi-bas Dhivehi dv Thaa
རྫོང་ཁ Dzonkha dz Tibt
Esperanto Esperanto eo Latn
Galego Gallego gl Latn
ქართული Georgiano ka Geor
Kreyòl Ayisyen Criollo haitiano ht Latn
Gaeilge Irlan ga Latn
Jawa Javanés jv Latn
Қазақ Kazajo kk Cyrl
Kirghiz Kirguís ky Cyrl
Latine Latín la Latn
Malti Maltés mt Latn
Монгол Mongol mn Cyrl
ଓଡ଼ିଆ Oriya or Orya
پښتو Pashto ps Arab
संस्कृतम् Sánscr sa Deva
සිංහල Cingalés si Sinh
Swahili Swahili sw Latn
leššānā Suryāyā Sirio syr Syriac
བོད་སྐད་ Tibetano bo Tibt
ትግርኛ Tigirinya ti Ethi
اردو Urdu ur Arab
oʻzbekcha Uzbeko uz Latn Latín
oʻzbekcha Uzbeko uz-Cyrl Cyrl Ortografía antigua
Cymraeg Galés cy Latn
IsiZulu Zulú zu Latn

Idiomas asignados

Los siguientes idiomas se asignan a otro código de idioma o a un reconocedor de caracteres general.

Lenguaje Idioma (nombre en español) Código languageHints Guion Notas
بهسا اچيه Achenés ace Latn Modelo latino
Lwo Acholí ach Latn Modelo latino
Dangme Adangme ada Latn Modelo latino
Akan Akan ak Latn Modelo latino
Anicinâbemowin Algonquinian alg Latn Modelo latino
Mapudungu Araucano/Mapuche arn Latn Modelo latino
Asturianu Asturiano ast Latn Modelo latino
Dene Atabascano ath Latn Modelo latino
Aymar aru Aimara ay Latn Modelo latino
Bhāṣa Bali Balinés ban Latn Modelo latino
Bamanankan Bambara bm Latn Modelo latino
Narrow Bantu Bantú bnt Latn Modelo latino
башҡорт теле Baskir ba Cyrl Modelo cirílico
Toba–Batak Batak btk Latn Modelo latino
Chibemba Bemba bem Latn Modelo latino
Bikol Naga Bikol bik Latn Modelo latino
Bichelamar Bislama bi Latn Modelo latino
Brezhoneg Bretón br Latn Modelo latino
нохчийн мотт / noxçiyn mott Checheno ce Cyrl Modelo cirílico
汉语 Chino (mandarín, simplificado) zh-Hans Hans Modelo chino
漢語 Chino (mandarín, tradicional) zh-Hant Hant Modelo chino
普通話 Chino (mandarín, Hong Kong) zh-Hant-HK Hant Modelo chino
Chahta' Choctaw cho Latn Modelo latino
Чӑвашла Chuvasio cv Cyrl Modelo cirílico
Cree–Montagnais–Naskapi Cree cr Latn Modelo latino
Mvskoke Creek mus Latn Modelo latino
qırımtatar tili, къырымтатар тили Tártaro de Crimea crh Latn Modelo cirílico
Dakhótiyapi, Dakȟótiyapi Dakota dak Latn Modelo latino
Douala Duala dua Latn Modelo latino
Ikɔ Efik Efik efi Latn Modelo latino
English (British) Inglés (británico) en-GB Latn Modelo latino
Èʋegbe Ewe ee Latn Modelo latino
føroyskt mál Faroés fo Latn Modelo latino
Na Vosa Vakaviti Fiyiano fj Latn Modelo latino
fɔ̀ngbè Fon fon Latn Modelo latino
Français canadien Francés (canadiense) fr-CA Latn Modelo latino
Fulani, Fulah, Peul Fulah ff Latn Modelo latino
ga gaa Latn Modelo latino
Luganda luganda lg Latn Modelo latino
Basa Gayo Gayo gay Latn Modelo latino
Kiribati Gilbertés gil Latn Modelo latino
Gothic Gótico got Latn Modelo latino
Guaraní Guaraní gn Latn Modelo latino
Harshen/Halshen Hausa هَرْشَن هَوْسَ Hausa ha Latn Modelo latino
ʻŌlelo Hawaiʻi Hawaiano haw Latn Modelo latino
Otjiherero Herero hz Latn Modelo latino
Ilonggo Hiligainón hil Latn Modelo latino
Jaku Iban Iban iba Latn Modelo latino
Asụsụ Igbo Igbo ig Latn Modelo latino
Ilokano Iloko ilo Latn Modelo latino
Taqbaylit Kabyle kab Latn Modelo latino
Jingpho Kachin kac Latn Modelo latino
Kalaallisut Kalaallisut kl Latn Modelo latino
Kikamba Kamba kam Latn Modelo latino
Kanuri Kanuri kr Latn Modelo latino
Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى Kara-Kalpak kaa Cyrl/Latn Modelo cirílico
Ka Ktien Khasi Khasi kha Latn Modelo latino
Gĩkũyũ Kikuyu ki Latn Modelo latino
Kinyarwanda Kiñaruanda rw Latn Modelo latino
коми кыв Komi kv Cyrl Modelo cirílico
Kikongo Congo kg Latn Modelo latino
Kosraean Kosraeano kos Latn Modelo latino
Oshikwanyama Kuanyama kj Latn Modelo latino
Ngala Lingala ln Latn Modelo latino
Plattdütsch, Plattdeutsch, Nedersaksisch Bajo alemán nds Latn Modelo latino
siLozi lozi loz Latn Modelo latino
Kiluba Luba-Katanga lu Latn Modelo latino
Dholuo Luo luo Latn Modelo latino
Madhura, Basa Mathura, بَهاسَ مَدورا Madurés mad Latn Modelo latino
Malagasy Malgache mg Latn Modelo latino
Mandinka, لغة مندنكا Mandingo man Latn Modelo latino
Gaelg, Gailck Manés gv Latn Modelo latino
Te reo Māori Maorí mi Latn Modelo latino
Ebon Marshallese mh Latn Modelo latino
Mɛnde yia Mendé men Latn Modelo latino
Middle English Inglés medio enm Latn Modelo latino
Mittelhochdeutsch Alto alemán medio gmh Latn Modelo latino
Baso Minangkabau, باسو مينڠكاباو Minangkabau min Latn Modelo latino
Kanienʼkéha Mohawk moh Latn Modelo latino
Nkundu Mongo lol Latn Modelo latino
Nāhuatl Náhuatl nah Latn Modelo latino
Diné bizaad Navajo nv Latn Modelo latino
Ndonga Ndonga ng Latn Modelo latino
ko e vagahau Niuē Niuano niu Latn Modelo latino
Zimbabwe Ndebele North Ndebele nd Latn Modelo latino
Sesotho sa Leboa Sotho norteño nso Latn Modelo latino
Chichewa, Chinyanja Nyanja ny Latn Modelo latino
Runyankore nyankole nyn Latn Modelo latino
Chitonga Nyasa Tonga tog Latn Modelo latino
Appolo Nzima nzi Latn Modelo latino
Occitan, lenga d'òc, provençal Occitan oc Latn Modelo latino
Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ Ojibwa oj Latn Modelo latino
Ænglisc, Englisc, Anglisc Inglés antiguo ang Latn Modelo latino
Franceis, François, Romanz Francés antiguo fro Latn Modelo latino
Diutisk, Althochdeutsch Alto alemán antiguo goh Latn Modelo latino
Dǫnsk tunga Nórdico antiguo non Latn Modelo latino
Occitan ancian Provenzal antiguo pro Latn Modelo latino
ирон ӕвзаг Ossetic os Cyrl Modelo cirílico
Kapampangan Pampanga pam Latn Modelo latino
Salitan Pangasinan Pangasinán pag Latn Modelo latino
Papiamentu Papiamento pap Latn Modelo latino
Português (Portugal) Portugués (Europa) pt-PT Latn Modelo latino
Kechua / Runa Simi Quechua qu Latn Modelo latino
Rumantsch Romanche rm Latn Modelo latino
Romani čhib Romaní rom Latn Modelo latino
Ikirundi Kirundi rn Latn Modelo latino
Sakha Saja sah Cyrl Modelo cirílico
Gagana faʻa Sāmoa Samoano sm Latn Modelo latino
yângâ tî sängö Sango sg Latn Modelo latino
(Braid) Scots, Lallans, Doric Escocés sco Latn Modelo latino
Gàidhlig Gaélico escocés gd Latn Modelo latino
chiShona Shona sn Latn Modelo latino
Songhay Songhai son Latn Modelo latino
Sesotho sesotho meridional st Latn Modelo latino
Español (Latinoamérica) Español (latinoamericano) es-419 Latn Modelo latino
ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda Sundanés su Latn Modelo latino
siSwati Suazi ss Latn Modelo latino
Reo Tahiti Tahitiano ty Latn Modelo latino
тоҷикӣ Tayiko tg Cyrl Modelo cirílico
татар теле Tártaro tt Cyrl/Latn Modelo cirílico
KʌThemnɛ Temné tem Latn Modelo latino
lea faka-Tonga Tongano to Latn Modelo latino
Xitsonga Tsonga ts Latn Modelo latino
Setswana Setsuana tn Latn Modelo latino
Türkmençe Turcom tk Latn Modelo cirílico
удмурт кыл Udmurto udm Cyrl Modelo cirílico
Tshivenḓa Venda ve Latn Modelo latino
Vod Votic vot Cyrl/Latn Modelo cirílico
Frysk Fiyiano occidental fy Latn Modelo latino
Wolof Wólof wo Latn Modelo latino
isiXhosa Xhosa xh Latn Modelo latino
Èdè Yorùbá Yoruba yo Latn Modelo latino
Diidxazá zapoteco zap Latn Modelo latino

Secuencias de comandos de escritura a mano

Las siguientes secuencias de comandos son compatibles con el reconocimiento de escritura a mano. Consulta las tablas de idiomas anteriores para conocer los idiomas que usan cada secuencia de comandos.

Guion Nombre Nivel de asistencia
Beng Bengalí Experimental
Cyrl Cirílico Experimental
Deva Devanagari Experimental
Grek Grieg Experimental
Hani Chino Experimental
Jpan Japonés Admitido
Kore Corean Admitido
Latn Latín Admitido
vi Tiếng Việt Experimental