Compatibilidad del OCR con distintos idiomas

La característica de reconocimiento de texto de la API de Cloud Vision puede detectar una gran variedad de idiomas, incluso en una sola imagen.

No es necesario proporcionar una sugerencia de idioma al servicio, pero es posible hacerlo si este tiene problemas para detectar el lenguaje que se usa en tu imagen.

Con el lanzamiento de OCR de escritura a mano disponible al público general, las imágenes que tienen escritura a mano ya no requieren una marca de escritura a mano languageHints cuando se usa DOCUMENT_TEXT_DETECTION.

Las sugerencias de idioma opcionales se especifican en el ImageContext de una solicitud como una lista de languageHints para una solicitud DOCUMENT_TEXT_DETECTION y TEXT_DETECTION.

Por lo general, cada parámetro del código de idioma consta de un identificador BCP-47. Este parámetro puede tener el formato idioma-región, en el que el idioma se refiere al idioma principal, y la región opcional se refiere a una región (por lo general, un identificador de país) con un dialecto determinado. Por ejemplo, el chino puede representarse como chino simplificado, que se usa en la República Popular China (zh-Hans), o como chino tradicional, que se usa en Taiwán (zh-Hant).

Existen tres niveles de compatibilidad de idiomas en la función de reconocimiento de texto:

  1. Los idiomas compatibles son los que priorizamos y con los que evaluamos el rendimiento de forma periódica.
  2. Los idiomas experimentales son aquellos que se encuentran en desarrollo activo, pero que no se evalúan con regularidad.
  3. Los idiomas asignados son aquellos que pueden asignarse a otro código de idioma o a un reconocedor de caracteres general. Por ejemplo, “en-GB” es compatible, pero no se trata de manera diferente a “en” para reconocer texto. Nos esforzamos por mostrar el código de idioma asignado correcto en el campo de configuración regional de la entidad, pero los idiomas asignados tienen más probabilidades de identificarse de manera errónea como idiomas similares que los completamente admitidos o los experimentales.

A continuación, se muestra la lista de idiomas (con códigos languageHint asociados) compatibles con TEXT_DETECTION y DOCUMENT_TEXT_DETECTION.

Si la sugerencia de idioma se deja en blanco, intentaremos detectar de forma automática el idioma más apropiado. El extremo TEXT_DETECTION detectará de manera automática solo un subconjunto de idiomas compatibles, mientras que el extremo DOCUMENT_TEXT_DETECTION detectará automáticamente el conjunto completo de idiomas compatibles.

Idiomas compatibles

Los siguientes idiomas se priorizan y evalúan con regularidad.

Para filtrar por características, escribe o selecciona directamente el idioma deseado en el menú desplegable:

Idioma Idioma (nombre en español) Código de languageHints Guion / notas
Afrikáans Afrikáans af Ríg.
seipa Albanés sq Ríg.
العربية Árabe ar Arabrabe Estándar moderno
Հայ Armenio hy Armada
беларускі Bengala be Circuito
বাংলা Bengalí bn Beng
български Búlgaro bg Circuito
Català Catalán ca Ríg.
普通话 Chino zh Hans/Hant
Hrvatski Croata h Ríg.
Čeština República Checa cs Ríg.
Dansk (danés) Danés da Ríg.
Nederlands Neerlandés nl Ríg.
Inglés Inglés en marca de servicio Estadounidense
Eleste Estonio et Ríg.
Filipino Filipino fil (o tl) Ríg.
Suomi Finés fi Ríg.
Français Francés fr marca de servicio Europa
Deutsch Alemán de Ríg.
Ελληνικά Griego el Gris
ગુજરાતી Guyaratí gu Gujar
עברית Hebreo iw Hebra
हिन्दी Hindi hi Desarrollo
Magyar Húngaro hu Ríg.
lenslenska Islandés es Ríg.
Indonesio Indonesio id Ríg.
Italiano Italiano it Ríg.
日本語 Japonés ja Jpan
ಕನ್ನಡ Canarés kn Knda
ភាសាខ្មែរ Jemer km Khr
한국어 Coreano ko Kore
ລາວ Laosiano lo Laosiano
Latviešu Letón lv Ríg.
Lietuvių Lituano lt Ríg.
Македонски Macedonio mk Circuito
Indonesio Malayo ms Ríg.
മലയാളം Malabar ml Mlym
मराठी Maratí mr Desarrollo
नेपाली Nepalí ne Desarrollo
Norsk Noruego No marca de servicio Bokmål
فارسی Persa fa Arabrabe
Polski Polaco pl Ríg.
Português Portugués pt marca de servicio la comida brasileña
ਪੰਜਾਬੀ Punyabí pa Gurú Gurmukhi
Română Rumano ro Ríg.
Русский Ruso ru Circuito
Русский (старая орфография) Ruso ru-PETR1708 Circuito Ortografía antigua
Српски Serbio sr Girl y Latn
Српски (латиница) Serbio sr-Latn Ríg.
eslovena - slovenčina Eslov sk Ríg.
eslovena - slovenščina Esloveno sl Ríg.
Español Español es marca de servicio Europa
Svenska Sueco sv Ríg.
தமிழ் Tamil ta Tamil
తెలుగు Télugu te Telu
ไทย Tailandés th Tailandés
Türkçe Turco tr Ríg.
Українська Ucraniano uk Circuito
Tiếng Việt Vietnamita vi Ríg.
Yidis Yidis yi Hebra

Idiomas experimentales

Los siguientes idiomas están en desarrollo activo y aún no se evalúan con regularidad.

Idioma Idioma (nombre en español) Código languageHints Guion / notas
አማርኛ Amhár a.m. Ethi
ελληνικά Griego antiguo GRP Gris
অসমীয়া Asamés as Beng
Azərbaycán Azerí az Ríg.
Azúrbaycán (qədim yazı) Azerí az-Cyrl Circuito Ortografía antigua
Eukara Vasco eu Ríg.
Sanán Bosnio bs Ríg.
မြန်မာ Birmano my Milr
Cebuano Cebuano ceb Ríg.
ᎦᏬᏂᎯᏍᏗ Cheroqui par Animación
hhivehi, hhivehi-bas Dhivehi DJ
རྫོང་ཁ Dzonkha oC Tíbet
Esperanto Esperanto eo Ríg.
Galego (gallego) Galego gl Ríg.
ქართული Georgiano ka Genérico
Kyòl Ayisyen Criollo haitiano ht Ríg.
gaélico Irlan ga Ríg.
Jawa Javanés jv Ríg.
Қазақ Kazajo kk Circuito
Kirguís Kirguís ky Circuito
Latín Latín la Ríg.
Malti Maltés mt Ríg.
Монгол Mongol mn Circuito
ଓଡ଼ିଆ Oriya o Oya
پښتو Pastún ps Arabrabe
संस्कृतम् Sánscrito sa Desarrollo
සිංහල Cingalés si Singh
Suajili Suajili sw Ríg.
leššāyāyāyā Sirio mar Sirio
བོད་སྐད་ Tibetano je Tíbet
ትግርኛ Tatirinaya ti Ethi
اردو Urdu ur Arabrabe
oʻzbekcha Uzbeko uz marca de servicio Latín
oʻzbekcha Uzbeko uz Circuito Ortografía antigua
Ciclorama Galés cy Ríg.
Itizulú Zulú zu Ríg.

Idiomas asignados

Los siguientes idiomas se asignan a otro código de idioma o a un reconocedor de caracteres general.

Idioma Idioma (nombre en español) Código de languageHints Guion / notas Asignado a
اچيه Achenés as Ríg. Modelo de alfabeto latino
Llama Acholí an Ríg. Modelo de alfabeto latino
Dangme Adangme Ada Ríg. Modelo de alfabeto latino
Akan Akan ak Ríg. Modelo de alfabeto latino
Aicinâbemowin Algonquino alg Ríg. Modelo de alfabeto latino
Creador de mapas Araucano/mapuche galón Ríg. Modelo de alfabeto latino
Asturiano Asturiano asado Ríg. Modelo de alfabeto latino
Ecón Atabascano oso Ríg. Modelo de alfabeto latino
Aymar Aru Aimara AA Ríg. Modelo de alfabeto latino
Bhāṣa Bali Balinés bloquear Ríg. Modelo de alfabeto latino
Bamanakan Bambara bm Ríg. Modelo de alfabeto latino
Bulto estrecho Bantú pan Ríg. Modelo de alfabeto latino
теле Baskir ba Circuito Modelo de secuencia de comandos cirílico
Tobaíbak Batak btq Ríg. Modelo de alfabeto latino
Chibemba Bemba cinturón Ríg. Modelo de alfabeto latino
Nagama Bisgal blik Ríg. Modelo de alfabeto latino
Bielenmar Bislama bisexual Ríg. Modelo de alfabeto latino
Brezhone Bretón al Ríg. Modelo de alfabeto latino
нохчийн мотт / noxçiyn mott Checheno ce Circuito Modelo de secuencia de comandos cirílico
汉语 Chino zh-Hans Hans; Simplificado Mandarín zh
漢語 Chino zh-Hant Han Tradicional; Mandarín zh
普通話 Chino zh-Hant-HK Han Mandarín Hong Kong zh
Chahta Choctaw eco Ríg. Modelo de alfabeto latino
Чӑвашла Chuvasio CF Circuito Modelo de secuencia de comandos cirílico
Cree (Montagnais–Naskapi) Cree cr Ríg. Modelo de alfabeto latino
Mvskoke Arroyo m Ríg. Modelo de alfabeto latino
qırımttar tili, къырымтатар тили Tártaro de Crimea RP Ríg. Modelo de secuencia de comandos cirílico
Dakhótiyapi, Dakȟótiyapi Dakota seda Ríg. Modelo de alfabeto latino
Douala Dual du Ríg. Modelo de alfabeto latino
Ikɔ Efik Efik efi Ríg. Modelo de alfabeto latino
Inglés (británico) Inglés en-GB marca de servicio Británica en
Èʋebe Ewe mar Ríg. Modelo de alfabeto latino
føroyskt mál Feroés color Ríg. Modelo de alfabeto latino
Na Vosa Vakaviti Fiyiano Fj Ríg. Modelo de alfabeto latino
Fɔ̀ngbè Fon fon Ríg. Modelo de alfabeto latino
Français canadien Francés fr-CA marca de servicio Canadiense fr
Fula (Fulah, Peul) Fula ff Ríg. Modelo de alfabeto latino
P ga gaga Ríg. Modelo de alfabeto latino
Luganda luganda LG Ríg. Modelo de alfabeto latino
Basa Gayo Gayo gay/homosexual Ríg. Modelo de alfabeto latino
Kiribati Gilbertés iglús Ríg. Modelo de alfabeto latino
Gótico Gótico conseguido Ríg. Modelo de alfabeto latino
Guaraní Guaraní gn Ríg. Modelo de alfabeto latino
Harshen/Haraldh هَرْشَن a Hausa ha Ríg. Modelo de alfabeto latino
Halelo Hawaiʻi Hawaiano haw Ríg. Modelo de alfabeto latino
Otjiaquíro Fijo Hz Ríg. Modelo de alfabeto latino
Ilonggo Hiligainón holga Ríg. Modelo de alfabeto latino
Jaku Iban Iban iba Ríg. Modelo de alfabeto latino
Asós Igbo Igbo ig Ríg. Modelo de alfabeto latino
Ilokano Iloko óleo Ríg. Modelo de alfabeto latino
Taqbaylit Cabilio kab Ríg. Modelo de alfabeto latino
Jingpo Cacha KB Ríg. Modelo de alfabeto latino
Kalaallisut Kalaallisut kl Ríg. Modelo de alfabeto latino
Kikamba Kamba KB Ríg. Modelo de alfabeto latino
Kanuri Kanuri SEK Ríg. Modelo de alfabeto latino
Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى Kara-Kalpak Kaka Cril/Latn Modelo de secuencia de comandos cirílico
Kat Ktien Khasi Khasi kha Ríg. Modelo de alfabeto latino
Gĩkũyũ Kikuyu ki Ríg. Modelo de alfabeto latino
Kiñaruanda Kiñaruanda rw Ríg. Modelo de alfabeto latino
кыв Komi Kv Circuito Modelo de secuencia de comandos cirílico
Kikongo Congo kg Ríg. Modelo de alfabeto latino
Kosraeano Kosraeano kos Ríg. Modelo de alfabeto latino
Oshikaanya Kuanyama KJ Ríg. Modelo de alfabeto latino
Ngalá Lingala ln Ríg. Modelo de alfabeto latino
Plattdütsch, Plattdeutsch, Nedersaksisch Bajo alemán segundo Ríg. Modelo de alfabeto latino
SiLozi lozi Loz Ríg. Modelo de alfabeto latino
Kiluba Luba-Katanga Lun Ríg. Modelo de alfabeto latino
Dahouo Luo Lun Ríg. Modelo de alfabeto latino
Madhura, Basa Mathura, بَهاسَ مَدورا Madurés loco Ríg. Modelo de alfabeto latino
Malgache Malgache mg Ríg. Modelo de alfabeto latino
Mandanka, لغة مندنكا Mandinká hombre Ríg. Modelo de alfabeto latino
Gaelg (Gailck) Manés gv Ríg. Modelo de alfabeto latino
Te Reo Māori Maorí mi Ríg. Modelo de alfabeto latino
Ebol Marshalés h Ríg. Modelo de alfabeto latino
Mɛndie yia Mendé hombres Ríg. Modelo de alfabeto latino
Inglés medio Inglés medio enm Ríg. Modelo de alfabeto latino
Mittechechdeutsch Alto alemán medio ghm Ríg. Modelo de alfabeto latino
Baso Minangkabau, باسو مينڠكاباو Minangkabau min Ríg. Modelo de alfabeto latino
Kanikenʼ Mohawk meses Ríg. Modelo de alfabeto latino
Distrito de Nkundau Mongo lol Ríg. Modelo de alfabeto latino
Náhuatl Náhuatl nah Ríg. Modelo de alfabeto latino
Día de Pascua Navajo nv Ríg. Modelo de alfabeto latino
Ndonga Ndonga ng Ríg. Modelo de alfabeto latino
ko e vagahau Niuē Niuano niu Ríg. Modelo de alfabeto latino
Zimbabue Núpele Ndebele del norte Dakota del Norte Ríg. Modelo de alfabeto latino
Sesotho Sa Leboa Sotho norteño Nso Ríg. Modelo de alfabeto latino
Chichewa (chinyanja) Nyanja ny Ríg. Modelo de alfabeto latino
Runyankore nyankole nalón Ríg. Modelo de alfabeto latino
Chitonga Tongano (Nyasa) libro Ríg. Modelo de alfabeto latino
Aplausos Nzema zinza Ríg. Modelo de alfabeto latino
Occitano, len d'òc, comprobado Occitan oct Ríg. Modelo de alfabeto latino
Aishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ Ojibba DO Ríg. Modelo de alfabeto latino
Ænglisc, Englisc y Anglisc Inglés antiguo angular Ríg. Modelo de alfabeto latino
Franciais, François, Romanz Francés antiguo noviembre Ríg. Modelo de alfabeto latino
Diutik, Althodeutsch Alto alemán antiguo Gogo Ríg. Modelo de alfabeto latino
Dungnsk tunga Nórdico antiguo no Ríg. Modelo de alfabeto latino
Accitan Provenzal antiguo pro Ríg. Modelo de alfabeto latino
ӕвзаг Osetio os Circuito Modelo de secuencia de comandos cirílico
Pampango Pampea pam Ríg. Modelo de alfabeto latino
Salitán Pangasinán Pangasinán pago Ríg. Modelo de alfabeto latino
Papiamento Padiamento Pap Ríg. Modelo de alfabeto latino
Português (Portugal) Portugués pt-PT marca de servicio Europa pt
Kechua / Runa Simi Quechua qu Ríg. Modelo de alfabeto latino
Rumantsh Romanche rm Ríg. Modelo de alfabeto latino
ihib Romaní sem Ríg. Modelo de alfabeto latino
Ikirandi Kirundi rn Ríg. Modelo de alfabeto latino
Saja Saja ceniza Circuito Modelo de secuencia de comandos cirílico
Gagaa Fa a Sāmo Samoano sm Ríg. Modelo de alfabeto latino
Yângâ tî sángö Sango sG Ríg. Modelo de alfabeto latino
(Braid) Scotts, Laans, dórico Escocés escocés Ríg. Modelo de alfabeto latino
Gàidhlig Gaélico escocés gd Ríg. Modelo de alfabeto latino
Chiza Shona sn Ríg. Modelo de alfabeto latino
Año Nuevo Año Nuevo tailandés hijo Ríg. Modelo de alfabeto latino
Sesoto sesotho meridional st Ríg. Modelo de alfabeto latino
Español (Latinoamérica) Español es-419 marca de servicio Latinoamericano es
ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda Sundanés su Ríg. Modelo de alfabeto latino
Swai Suazi ss Ríg. Modelo de alfabeto latino
Reo Tahití Tahitiano tim Ríg. Modelo de alfabeto latino
тоҷикӣ Tayiko tg Circuito Modelo de secuencia de comandos cirílico
теле Tártaro con Cril/Latn Modelo de secuencia de comandos cirílico
KmThemnɛ Temné meses Ríg. Modelo de alfabeto latino
lef faka-Tonga Tongano a Ríg. Modelo de alfabeto latino
Xitonga Tsonga ts Ríg. Modelo de alfabeto latino
Setswana Setsuana tn. Ríg. Modelo de alfabeto latino
Türkmençe Turcomano TK Ríg. Modelo de secuencia de comandos cirílico
кыл Udmurto por favor Circuito Modelo de secuencia de comandos cirílico
Thashivena Venda ve Ríg. Modelo de alfabeto latino
Vod Votic vota Cril/Latn Modelo de secuencia de comandos cirílico
Frysk Fiyiano occidental fy Ríg. Modelo de alfabeto latino
Wólof Wólof wo Ríg. Modelo de alfabeto latino
iXosa Xhosa xh Ríg. Modelo de alfabeto latino
Èódèsóbù Yoruba yo Ríg. Modelo de alfabeto latino
Diidxazú Zapoteco zap Ríg. Modelo de alfabeto latino