Compatibilité avec les langues de la reconnaissance optique des caractères

Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.

La fonctionnalité de reconnaissance de texte de l'API Cloud Vision peut détecter une grande variété de langues, et plusieurs langues au sein d'une même image.

Il n'est pas nécessaire de fournir un indicateur de langue au service, mais vous pouvez le faire si ce dernier ne parvient pas à détecter la langue utilisée dans votre image.

Avec le lancement de l'écriture manuscrite (OCR) en phase de disponibilité générale, il n'est pas nécessaire de définir l'option languageHints pour les images en cas d'utilisation de DOCUMENT_TEXT_DETECTION.

Les indicateurs de langue facultatifs sont spécifiés dans le champ ImageContext d'une requête en tant que liste de languageHints pour les requêtes TEXT_DETECTION et DOCUMENT_TEXT_DETECTION.

Chaque paramètre de code de langue se compose d'un identifiant BCP 47. Ce paramètre peut se présenter sous la forme langue-région, langue faisant référence à la langue principale et région (facultatif) renvoyant à la zone géographique (généralement désignée par l'identificateur d'un pays) où est parlé le dialecte en question. Par exemple, le chinois peut être représenté par le chinois simplifié tel qu'il est écrit en République populaire de Chine (zh-Hans) ou en chinois traditionnel tel qu'il est écrit à Taïwan (zh-Hant).

La fonctionnalité de reconnaissance de texte prend en charge trois niveaux :

  1. Les langues acceptées sont celles que nous priorisons et évaluons régulièrement par rapport aux performances.
  2. Les langues expérimentales sont celles qui sont en phase de développement actif, mais pas évaluées régulièrement.
  3. Les langues mappées sont celles qui sont compatibles avec un autre code de langue ou un outil de reconnaissance de caractères général. Par exemple, la langue "en-GB" est acceptée, mais n'est pas traitée différemment de "en" dans le cadre de la reconnaissance de texte. Nous nous efforçons de renvoyer le code de langue mappé correct dans le champ des paramètres régionaux d'entité, mais les langues mappées sont davantage susceptibles d'être prises pour une langue similaire que les langues entièrement ou expérimentalement acceptées.

La liste des langues (avec les codes languageHint associés) acceptées par TEXT_DETECTION et DOCUMENT_TEXT_DETECTION est indiquée ci-dessous.

Si l'indicateur de langue n'est pas renseigné, nous essaierons de détecter automatiquement la langue la plus appropriée. Le point de terminaison TEXT_DETECTION détecte automatiquement un sous-ensemble de langues acceptées, tandis que le point de terminaison DOCUMENT_TEXT_DETECTION détecte automatiquement l'ensemble des langues acceptées.

Langues acceptées

Les langues suivantes sont classées par ordre de priorité et régulièrement évaluées.

Pour filtrer par fonctionnalité, saisissez ou sélectionnez directement la langue souhaitée dans le menu déroulant :

Langue Langue (nom français) Code languageHints Script / Remarques
Afrikaans Afrikaans af Latn
shqip Albanais sq Latn
العربية Arabe ar Arab; Modern Standard
Հայ Arménien hy Armn
беларуская Biélorusse be Cyrl
বাংলা Bengalî bn Beng
български Bulgare bg Cyrl
Català Catalan ca Latn
普通话 Chinois zh Hans/Hant
Hrvatski Croate hr Latn
Čeština Tchèque cs Latn
Dansk Danois da Latn
Nederlands Néerlandais nl Latn
English Anglais en Latn; American
Eesti keel Estonien et Latn
Filipino Philippin fil (or tl) Latn
Suomi Finnois fi Latn
Français Français fr Latn; European
Deutsch Allemand de Latn
Ελληνικά Grec el Grek
ગુજરાતી Gujarâtî gu Gujr
עברית Hébreu iw Hebr
हिन्दी Hindi hi Deva
Magyar Hongrois hu Latn
Íslenska Islandais is Latn
Bahasa Indonesia Indonésien id Latn
Italiano Italien it Latn
日本語 Japonais ja Jpan
ಕನ್ನಡ Kannara kn Knda
ភាសាខ្មែរ Khmer km Khmr
한국어 Coréen ko Kore
ລາວ Laotien lo Laoo
Latviešu Letton lv Latn
Lietuvių Lituanien lt Latn
Македонски Macédonien mk Cyrl
Bahasa Melayu Malaisien ms Latn
മലയാളം Malayâlam ml Mlym
मराठी Marathi mr Deva
नेपाली Népalais ne Deva
Norsk Norvégien no Latn; Bokmål
فارسی Persan fa Arab
Polski Polonais pl Latn
Português Portugais pt Latn; Brazilian
ਪੰਜਾਬੀ Panjabi pa Guru; Gurmukhi
Română Roumain ro Latn
Русский Russe ru Cyrl
Русский (старая орфография) Russe ru-PETR1708 Cyrl; Old Orthography
Српски Serbe sr Cyrl & Latn
Српски (латиница) Serbe sr-Latn Latn
Slovenčina Slovaque sk Latn
Slovenščina Slovène sl Latn
Español Espagnol es Latn; European
Svenska Suédois sv Latn
தமிழ் Tamoul ta Taml
తెలుగు Télougou te Telu
ไทย Thaï th Thai
Türkçe Turc tr Latn
Українська Ukrainien uk Cyrl
Tiếng Việt Vietnamien vi Latn
Yiddish Yiddish yi Hebr

Langues expérimentales

Les langues suivantes sont en phase de développement actif et n'ont pas encore été évaluées régulièrement.

Langage Langue (nom français) Code languageHints Script / Remarques
አማርኛ Amharique am Ethi
Αρχαία ελληνικά Grec ancien grc Grek
অসমীয়া Assamais as Beng
Azərbaycan Azéri az Latn
Azərbaycan (qədim yazı) Azéri az-Cyrl Cyrl; Ancienne orthographe
Euskara Basque eu Latn
Bosanski Bosniaque bs Latn
မြန်မာ Birman my Mymr
Cebuano Cebuano ceb Latn
ᏣᎳᎩ ᎦᏬᏂᎯᏍᏗ Cherokee chr Cher
dhivehi, dhivehi-bas Divéhi dv Thaa
རྫོང་ཁ Dzonkha dz Tibt
Esperanto Espéranto eo Latn
Galego Galicien gl Latn
ქართული Géorgien ka Geor
Kreyòl Ayisyen Créole haïtien ht Latn
Gaeilge Irlandais ga Latn
Jawa Javanais jv Latn
Қазақ Kazakh kk Cyrl
Kirghiz Kirghiz ky Cyrl
Latine Latin la Latn
Malti Maltais mt Latn
Монгол Mongol mn Cyrl
ଓଡ଼ିଆ Oriyâ or Orya
پښتو Pachtô ps Arab
संस्कृतम् Sanskrit sa Deva
සිංහල Cingalais si Sinh
Swahili Swahili sw Latn
leššānā Suryāyā Syriaque syr Syriac
བོད་སྐད་ Tibétain bo Tibt
ትግርኛ Tigirinya ti Ethi
اردو Ourdou ur Arab
oʻzbekcha Ouzbek uz Latn; Latin
oʻzbekcha Ouzbek uz-Cyrl Cyrl; Ancienne orthographe
Cymraeg Gallois cy Latn
IsiZulu Zoulou zu Latn

Langues mappées

Les langues suivantes sont mappées à un autre code de langue ou mappées à un outil de reconnaissance de caractères général.

Langage Langue (nom français) Code languageHints Script / Remarques Associé à
بهسا اچيه Aceh ace Latn Modèle de script latin
Lwo Acholi ach Latn Modèle de script latin
Dangme Adangme ada Latn Modèle de script latin
Akan Akan ak Latn Modèle de script latin
Anicinâbemowin Algonquien alg Latn Modèle de script latin
Mapudungu Araucan/Mapuche arn Latn Modèle de script latin
Asturianu Asturien ast Latn Modèle de script latin
Dene Athapascan ath Latn Modèle de script latin
Aymar aru Aymara ay Latn Modèle de script latin
Bhāṣa Bali Balinais ban Latn Modèle de script latin
Bamanankan Bambara bm Latn Modèle de script latin
Narrow Bantu Bantu bnt Latn Modèle de script latin
башҡорт теле Bachkir ba Cyrl Modèle de script cyrillique
Toba–Batak Batak btk Latn Modèle de script latin
Chibemba Bemba bem Latn Modèle de script latin
Bikol Naga Bicol bik Latn Modèle de script latin
Bichelamar Bislama bi Latn Modèle de script latin
Brezhoneg Breton br Latn Modèle de script latin
нохчийн мотт / noxçiyn mott Tchétchène ce Cyrl Modèle de script cyrillique
汉语 Chinois zh-Hans Hans; Mandarin, simplifié Modèle de script chinois
漢語 Chinois zh-Hant Hant; Mandarin, traditionnel Modèle de script chinois
普通話 Chinois zh-Hant-HK Hant; Mandarin, Hong Kong Modèle de script chinois
Chahta' Choctaw cho Latn Modèle de script latin
Чӑвашла Tchouvache cv Cyrl Modèle de script cyrillique
Cree–Montagnais–Naskapi Cri cr Latn Modèle de script latin
Mvskoke Creek mus Latn Modèle de script latin
qırımtatar tili, къырымтатар тили Tatar de Crimée crh Latn Modèle de script cyrillique
Dakhótiyapi, Dakȟótiyapi Dakota dak Latn Modèle de script latin
Douala Douala dua Latn Modèle de script latin
Ikɔ Efik Efik efi Latn Modèle de script latin
English (British) Français en-GB Latn; British Modèle de script latin
Èʋegbe Ewe ee Latn Modèle de script latin
føroyskt mál Féroé fo Latn Modèle de script latin
Na Vosa Vakaviti Fidjien fj Latn Modèle de script latin
fɔ̀ngbè Fon fon Latn Modèle de script latin
Français canadien Français fr-CA Latn; Canadian Modèle de script latin
Fulani, Fulah, Peul Peul ff Latn Modèle de script latin
ga gaa Latn Modèle de script latin
Luganda ganda lg Latn Modèle de script latin
Basa Gayo Gayo gay Latn Modèle de script latin
Kiribati Gilbertin gil Latn Modèle de script latin
Gothic Gothique got Latn Modèle de script latin
Guaraní Guarani gn Latn Modèle de script latin
Harshen/Halshen Hausa هَرْشَن هَوْسَ Haoussa ha Latn Modèle de script latin
ʻŌlelo Hawaiʻi Hawaïen haw Latn Modèle de script latin
Otjiherero Héréro hz Latn Modèle de script latin
Ilonggo Hiligaïnon hil Latn Modèle de script latin
Jaku Iban Iban iba Latn Modèle de script latin
Asụsụ Igbo Igbo ig Latn Modèle de script latin
Ilokano Ilocano ilo Latn Modèle de script latin
Taqbaylit Kabyle kab Latn Modèle de script latin
Jingpho Kachin kac Latn Modèle de script latin
Kalaallisut Kalaallisut kl Latn Modèle de script latin
Kikamba Kamba kam Latn Modèle de script latin
Kanuri Kanuri kr Latn Modèle de script latin
Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى Karakalpaks kaa Cyrl/Latn Modèle de script cyrillique
Ka Ktien Khasi Khasi kha Latn Modèle de script latin
Gĩkũyũ Kikuyu ki Latn Modèle de script latin
Kinyarwanda Kinyarwanda rw Latn Modèle de script latin
коми кыв Komi kv Cyrl Modèle de script cyrillique
Kikongo Kongo kg Latn Modèle de script latin
Kosraean Kosrae kos Latn Modèle de script latin
Oshikwanyama Kuanyama kj Latn Modèle de script latin
Ngala Lingala ln Latn Modèle de script latin
Plattdütsch, Plattdeutsch, Nedersaksisch Bas allemand nds Latn Modèle de script latin
siLozi lozi loz Latn Modèle de script latin
Kiluba Luba-katanga lu Latn Modèle de script latin
Dholuo Luo luo Latn Modèle de script latin
Madhura, Basa Mathura, بَهاسَ مَدورا Madurais mad Latn Modèle de script latin
Malagasy Malgache mg Latn Modèle de script latin
Mandinka, لغة مندنكا Mandingue man Latn Modèle de script latin
Gaelg, Gailck Manx gv Latn Modèle de script latin
Te reo Māori Maori mi Latn Modèle de script latin
Ebon Marshallais mh Latn Modèle de script latin
Mɛnde yia Mendé men Latn Modèle de script latin
Middle English Moyen anglais enm Latn Modèle de script latin
Mittelhochdeutsch Moyen haut-allemand gmh Latn Modèle de script latin
Baso Minangkabau, باسو مينڠكاباو Minangkabau min Latn Modèle de script latin
Kanienʼkéha Mohawk moh Latn Modèle de script latin
Nkundu Mongo lol Latn Modèle de script latin
Nāhuatl Nahuatl nah Latn Modèle de script latin
Diné bizaad Navajo nv Latn Modèle de script latin
Ndonga Ndonga ng Latn Modèle de script latin
ko e vagahau Niuē Niuéen niu Latn Modèle de script latin
Zimbabwe Ndebele Ndébélé du Nord nd Latn Modèle de script latin
Sesotho sa Leboa Sotho du Nord nso Latn Modèle de script latin
Chichewa, Chinyanja Chichewa ny Latn Modèle de script latin
Runyankore nyankolé nyn Latn Modèle de script latin
Chitonga Nyasa Tonga tog Latn Modèle de script latin
Appolo Nzema nzi Latn Modèle de script latin
Occitan, lenga d'òc, provençal Occitan oc Latn Modèle de script latin
Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ Ojibwa oj Latn Modèle de script latin
Ænglisc, Englisc, Anglisc Vieil anglais ang Latn Modèle de script latin
Franceis, François, Romanz Ancien français fro Latn Modèle de script latin
Diutisk, Althochdeutsch Vieux haut-allemand goh Latn Modèle de script latin
Dǫnsk tunga Vieux norrois non Latn Modèle de script latin
Occitan ancian Provençal ancien pro Latn Modèle de script latin
ирон ӕвзаг Ossète os Cyrl Modèle de script cyrillique
Kapampangan Pampanga pam Latn Modèle de script latin
Salitan Pangasinan Pangasinan pag Latn Modèle de script latin
Papiamentu Papiamento pap Latn Modèle de script latin
Português (Portugal) Portugais pt-PT Latn; European Modèle de script latin
Kechua / Runa Simi Quechua qu Latn Modèle de script latin
Rumantsch Romanche rm Latn Modèle de script latin
Romani čhib Romani rom Latn Modèle de script latin
Ikirundi Rundi rn Latn Modèle de script latin
Sakha Sakha sah Cyrl Modèle de script cyrillique
Gagana faʻa Sāmoa Samoan sm Latn Modèle de script latin
yângâ tî sängö Sango sg Latn Modèle de script latin
(Braid) Scots, Lallans, Doric Écossais sco Latn Modèle de script latin
Gàidhlig Gaélique écossais gd Latn Modèle de script latin
chiShona Shona sn Latn Modèle de script latin
Songhay Songhaï son Latn Modèle de script latin
Sesotho sesotho st Latn Modèle de script latin
Español (Latinoamérica) Espagnol es-419 Latn; Latin American Modèle de script latin
ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda Soundanais su Latn Modèle de script latin
siSwati Swati ss Latn Modèle de script latin
Reo Tahiti Tahitien ty Latn Modèle de script latin
тоҷикӣ Tadjik tg Cyrl Modèle de script cyrillique
татар теле Tatar tt Cyrl/Latn Modèle de script cyrillique
KʌThemnɛ Temne tem Latn Modèle de script latin
lea faka-Tonga Tongien to Latn Modèle de script latin
Xitsonga Tsonga ts Latn Modèle de script latin
Setswana Tswana tn Latn Modèle de script latin
Türkmençe Turkmène tk Latn Modèle de script cyrillique
удмурт кыл Oudmourte udm Cyrl Modèle de script cyrillique
Tshivenḓa Venda ve Latn Modèle de script latin
Vod Vote vot Cyrl/Latn Modèle de script cyrillique
Frysk Frison occidental fy Latn Modèle de script latin
Wolof Wolof wo Latn Modèle de script latin
isiXhosa Xhosa xh Latn Modèle de script latin
Èdè Yorùbá Yoruba yo Latn Modèle de script latin
Diidxazá Zapotèque zap Latn Modèle de script latin

Scripts d'écriture manuscrite

Les scripts suivants sont compatibles avec la reconnaissance de l'écriture manuscrite. Consultez les tableaux de langues ci-dessus pour connaître les langues utilisant chaque script.

Tag du script Nom Niveau d'assistance
Beng Bengalî Expérimentation
Cyrl Cyrillique Expérimentation
Deva Dévanâgarî Expérimentation
Grek Grec Expérimentation
Hani Chinois Expérimentation
Jpan Japonais Compatible
Kore Coréen Compatible
Latn Latin Compatible
vi Vietnamien Test