Compatibilité avec les langues de la reconnaissance optique des caractères

La fonctionnalité de reconnaissance de texte de l'API Cloud Vision peut détecter une grande variété de langues, et plusieurs langues au sein d'une même image.

Il n'est pas nécessaire de fournir un indicateur de langue au service, mais vous pouvez le faire si ce dernier ne parvient pas à détecter la langue utilisée dans votre image.

Avec le lancement de l'écriture manuscrite (OCR) en phase de disponibilité générale, il n'est pas nécessaire de définir l'option languageHints pour les images en cas d'utilisation de DOCUMENT_TEXT_DETECTION.

Les indicateurs de langue facultatifs sont spécifiés dans le champ ImageContext d'une requête en tant que liste de languageHints pour les requêtes TEXT_DETECTION et DOCUMENT_TEXT_DETECTION.

Chaque paramètre de code de langue se compose d'un identifiant BCP 47. Ce paramètre peut se présenter sous la forme langue-région, langue faisant référence à la langue principale et région (facultatif) renvoyant à la zone géographique (généralement désignée par l'identificateur d'un pays) où est parlé le dialecte en question. Par exemple, le chinois peut être représenté par le chinois simplifié tel qu'il est écrit en République populaire de Chine (zh-Hans) ou en chinois traditionnel tel qu'il est écrit à Taïwan (zh-Hant).

La fonctionnalité de reconnaissance de texte prend en charge trois niveaux :

  1. Les langues acceptées sont celles que nous priorisons et évaluons régulièrement par rapport aux performances.
  2. Les langues expérimentales sont celles qui sont en phase de développement actif, mais pas évaluées régulièrement.
  3. Les langues mappées sont celles qui sont compatibles avec un autre code de langue ou un outil de reconnaissance de caractères général. Par exemple, la langue "en-GB" est acceptée, mais n'est pas traitée différemment de "en" dans le cadre de la reconnaissance de texte. Nous nous efforçons de renvoyer le code de langue mappé correct dans le champ des paramètres régionaux d'entité, mais les langues mappées sont davantage susceptibles d'être prises pour une langue similaire que les langues entièrement ou expérimentalement acceptées.

La liste des langues (avec les codes languageHint associés) acceptées par TEXT_DETECTION et DOCUMENT_TEXT_DETECTION est indiquée ci-dessous.

Si l'indicateur de langue n'est pas renseigné, nous essaierons de détecter automatiquement la langue la plus appropriée. Le point de terminaison TEXT_DETECTION détecte automatiquement un sous-ensemble de langues acceptées, tandis que le point de terminaison DOCUMENT_TEXT_DETECTION détecte automatiquement l'ensemble des langues acceptées.

Langues acceptées

Les langues suivantes sont classées par ordre de priorité et régulièrement évaluées.

Pour filtrer par fonctionnalité, saisissez ou sélectionnez directement la langue souhaitée dans le menu déroulant :

Langue Langue (nom français) Code languageHints Script / Notes
Afrikaans Afrikaans af Latn
shqip Albanais sq Latn
العربية Arabe ar Arabe standard moderne
Հայ Arménien hy Armn
беларускі Biélorusse be Cyrl
বাংলা Bengalî bn Beng
български Bulgare bg Cyrl
Català Catalan ca Latn
普通话 Chinois zh Hans/Hant
Hrvatski Croate hr Latn
Čeština Tchèque cs Latn
Dansk Danois da Latn
Nederlands Néerlandais nl Latn
Anglais Anglais fr Latn ; Américain
Eesti keel Estonien et Latn
Philippin Philippin fil (ou tl) Latn
Suomi Finnois fi Latn
Français Français fr Latn ; Européen
Deutsch Allemand de Latn
Ελληνικά Grec el Grek
ગુજરાતી Gujarâtî gu Gujr
עברית Hébreu iw Hebr
हिन्दी Hindi hi Deva
Magyar Hongrois hu Latn
Íslenska Islandais est Latn
Bahasa Indonesia Indonésien id Latn
Italiano Italien it Latn
日本語 Japonais ja Jpan
ಕನ್ನಡ Kannada kn Knda
ភាសាខ្មែរ Khmer km Khmr
한국어 Coréen ko Kore
ລາວ Laotien lo Laoo
Latviešu Letton lv Latn
Lietuvių Lituanien lt Latn
Македонски Macédonien mk Cyrl
Malaisien Malais ms Latn
മലയാളം Malayâlam ml Mlym
मराठी Marathi mr Deva
नेपाली Népalais ne Deva
Norsk Norvégien no Latn ; Bokmål
فارسی Perse fa Arabe
Polski Polonais pl Latn
Português Portugais pt Latn ; Brésilien
ਪੰਜਾਬੀ Panjabi pa Guru ; Gurmukhi
Română Roumain ro Latn
Pусский Russe ru Cyrl
Русский (старая орфография) Russe ru-PETR1708 Cyrl ; Ancien orthographe
Српски Serbe sr Cyrl et Latn
Српски (латиница) Serbe sr-Latn Latn
Slovenčina Slovak sk Latn
Slovenščina Slovène sl Latn
Español Espagnol es Latn ; Européen
Svenska Suédois sv Latn
தமிழ் Tamoul ta Taml
తెలుగు Télougou te Télou
ไทย Thaï th Thaï
Türkçe Turc tr Latn
Українська Ukrainien uk Cyrl
Tiếng Việt Vietnamien vi Latn
Yiddish Yiddish yi Hebr

Langues expérimentales

Les langues suivantes sont en phase de développement actif et n'ont pas encore été évaluées régulièrement.

Langage Langue (nom français) Code languageHints Script / Notes
አማርኛ Amharique am Ethi
Αρχαία ελληνικά Grec ancien grc Grek
অসমীয়া Assamais as Beng
Azərbaycan Azéri az Latn
Azərbaycan (qədim yazı) Azéri az-Cyrl Cyrl ; ancien orthographe
Euskara Basque eu Latn
Bosanski Bosnien bs Latn
မြန်မာ Birman my Mymr
Cebuano Cebuano ceb Latn
ᏣᎳᎩ ᎦᏬᏂᎯᏍᏗ Cherokee chr Cher
dhivehi, dhivehi-bas Divéhi dv Thaa
རྫོང་ཁ Dzonkha dz Tibt
Espéranto Espéranto eo Latn
Galego Galicien gl Latn
ქართული Géorgien ka Geor
Kreyòl Ayisyen Créole haïtien ht Latn
Gaeilge Irlandais ga Latn
Jawa Javanais jv Latn
Қазақ Kazakh kk Cyrl
Kirghiz Kirghiz ky Cyrl
Latine Latin la Latn
Malti Maltais mt Latn
Монгол Mongol mn Cyrl
ଓଡ଼ିଆ Oriya ou Orya
پښتو Pachtô ps Arabe
संस्कृतम् Sanskrit sa Deva
සිංහල Cingalais si Sinh
Swahili Swahili sw Latn
leššānā Suryāyā Syriaque syr Syriaque
བོད་སྐད་ Tibétain bo Tibt
ትግርኛ Tigirinya ti Ethi
اردو Urdu ur Arabe
oʻzbekcha Ouzbek uz Latn ; latin
oʻzbekcha Ouzbek uz-Cyrl Cyrl ; ancien orthographe
Cymraeg Gallois cy Latn
IsiZulu Zulu zu Latn

Langues mappées

Les langues suivantes sont mappées à un autre code de langue ou mappées à un outil de reconnaissance de caractères général.

Langage Langue (nom français) Code languageHints Script / Notes Associé à
اچيه اچيه Aceh ace Latn Modèle de script latin
Lwo Acholi ach Latn Modèle de script latin
Adangme Adangme ada Latn Modèle de script latin
Akan Akan ak Latn Modèle de script latin
Anicinâbemowin Algonquien alg Latn Modèle de script latin
Mapudungu Araucan/Mapuche arn Latn Modèle de script latin
Asturien Asturien ast Latn Modèle de script latin
Dene Athapascan Ath Latn Modèle de script latin
Aymar aru Aymara ay Latn Modèle de script latin
Bhāṣa Bali Balinais ban Latn Modèle de script latin
Bamanankan Bambara bm Latn Modèle de script latin
Bantu au sens étroit Bantu bnt Latn Modèle de script latin
башҡорт теле Bachkir ba Cyrl Modèle de script cyrillique
Toba–Batak Batak btk Latn Modèle de script latin
Chibemba Bemba bem Latn Modèle de script latin
Bikol Naga Bicol bik Latn Modèle de script latin
Bichelamar Bislama bi Latn Modèle de script latin
Brezhoneg Breton Latn Modèle de script latin
нохчийн мотт / noxçiyn mott Tchétchène ce Cyrl Modèle de script cyrillique
汉语 Chinois zh-Hans Hans ; Simplifié ; Mandarin zh
漢語 Chinois zh-Hant Hant ; Traditionnel ; Mandarin zh
普通話 Chinois zh_Hant_HK Hant ; Mandarin ; Hong Kong zh
Chahta' Choctaw cho Latn Modèle de script latin
Чӑвашла Tchouvache cv Cyrl Modèle de script cyrillique
Cree–Montagnais–Naskapi Cri cr Latn Modèle de script latin
Mvskoke Creek mus Latn Modèle de script latin
qırımtatar tili, къырымтатар тили Tatar de Crimée crh Latn Modèle de script cyrillique
Dakhótiyapi, Dakȟótiyapi Dakota dak Latn Modèle de script latin
Douala Douala dua Latn Modèle de script latin
Ikɔ Efik Efik efi Latn Modèle de script latin
Anglais (britannique) Anglais en-GB Latn ; Anglais fr
Èʋegbe Ewe ee Latn Modèle de script latin
føroyskt mál Féroé fo Latn Modèle de script latin
Na Vosa Vakaviti Fidjien fj Latn Modèle de script latin
fɔ̀ngbè Fon fon Latn Modèle de script latin
Français canadien Français fr-CA Latn ; Canadien fr
Fulani, Fulah, Peul Peul ff Latn Modèle de script latin
ga gaa Latn Modèle de script latin
Luganda ganda lg Latn Modèle de script latin
Basa Gayo Gayo gay Latn Modèle de script latin
Kiribati Gilbertin gil Latn Modèle de script latin
Gothique Gothique got Latn Modèle de script latin
Guaraní Guarani gn Latn Modèle de script latin
Harshen/Halshen Hausa هَرْشَن هَوْسَ Haoussa ha Latn Modèle de script latin
'Ōlelo Hawai'i Hawaïen haw Latn Modèle de script latin
Otjiherero Héréro hz Latn Modèle de script latin
Ilonggo Hiligaïnon hil Latn Modèle de script latin
Jaku Iban Iban iba Latn Modèle de script latin
Asụsụ Igbo Igbo ig Latn Modèle de script latin
Ilokano Ilocano ilo Latn Modèle de script latin
Taqbaylit Kabyle kab Latn Modèle de script latin
Jingpho Kachin kac Latn Modèle de script latin
Kalaallisut Kalaallisut kl Latn Modèle de script latin
Kikamba Kamba kam Latn Modèle de script latin
Kanuri Kanuri kr Latn Modèle de script latin
Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى Karakalpaks kaa Cyrl/Latn Modèle de script cyrillique
Ka Ktien Khasi Khasi kha Latn Modèle de script latin
Gĩkũyũ Kikuyu ki Latn Modèle de script latin
Kinyarwanda Kinyarwanda rw Latn Modèle de script latin
коми кыв Komi kv Cyrl Modèle de script cyrillique
Kikongo Kongo kg Latn Modèle de script latin
Kosrae Kosrae kos Latn Modèle de script latin
Oshikwanyama Kuanyama kj Latn Modèle de script latin
Ngala Lingala ln Latn Modèle de script latin
Plattdütsch, Plattdeutsch, Nedersaksisch Bas allemand nds Latn Modèle de script latin
siLozi lozi loz Latn Modèle de script latin
Kiluba Luba-katanga lu Latn Modèle de script latin
Dholuo Luo Luo Latn Modèle de script latin
Madhoura, Basa Mathura, بَهاسَ مَدورا Madurais mad Latn Modèle de script latin
Malgache Malgache mg Latn Modèle de script latin
Mandinka, لغة مندنكا Mandingue man Latn Modèle de script latin
Gaelg, Gailck Manx gv Latn Modèle de script latin
Te reo Māori Maori mi Latn Modèle de script latin
Ebon Marshallais mh Latn Modèle de script latin
Mɛnde yia Mendé men Latn Modèle de script latin
Moyen anglais Moyen anglais enm Latn Modèle de script latin
Mittelhochdeutsch Moyen haut-allemand gmh Latn Modèle de script latin
Baso Minangkabau, باسو مينڠكاباو Minangkabau min Latn Modèle de script latin
Kanienʼkéha Mohawk moh Latn Modèle de script latin
Nkundu Mongo lol Latn Modèle de script latin
Nāhuatl Nahuatl nah Latn Modèle de script latin
Diné bizaad Navajo nv Latn Modèle de script latin
Ndonga Ndonga ng Latn Modèle de script latin
ko e vagahau Niuē Niuéen niu Latn Modèle de script latin
Zimbabwe Ndebele Ndébélé du Nord nd Latn Modèle de script latin
Sesotho sa Leboa Sotho du Nord nso Latn Modèle de script latin
Chichewa, Chinyanja Chichewa ny Latn Modèle de script latin
Runyankore nyankolé nyn Latn Modèle de script latin
Chitonga Nyasa Tonga tog Latn Modèle de script latin
Appolo Nzema nzi Latn Modèle de script latin
Occitan, lenga d'òc, provençal Occitan oc Latn Modèle de script latin
Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ Ojibwa oj Latn Modèle de script latin
Ænglisc, Englsc, Anglsc Vieil anglais ang Latn Modèle de script latin
Franceis, François, Romanz Ancien français fro Latn Modèle de script latin
Diutisk, Althochdeutsch Vieux haut-allemand goh Latn Modèle de script latin
Dǫnsk tunga Vieux norrois non Latn Modèle de script latin
Occitan ancian Provençal ancien pro Latn Modèle de script latin
ирон ӕвзаг Ossète os Cyrl Modèle de script cyrillique
Pampangan Pampanga pam Latn Modèle de script latin
Pangasinan salitan Pangasinan pag Latn Modèle de script latin
Papiamentu Papiamento pap Latn Modèle de script latin
Português (Portugal) Portugais pt-PT Latn ; Européen pt
Kechua / Runa Simi Quechua qu Latn Modèle de script latin
Rumantsch Romanche rm Latn Modèle de script latin
Romani čhib Romani rom Latn Modèle de script latin
Ikirundi Rundi rn Latn Modèle de script latin
Sakha Sakha sah Cyrl Modèle de script cyrillique
Gagana faʻa Sāmoa Samoan sm Latn Modèle de script latin
yângâ tî sängö Sango sg Latn Modèle de script latin
(Braid) Scots, Lallans, Doric Écossais sco Latn Modèle de script latin
Gàidhlig Gaélique écossais gd Latn Modèle de script latin
chiShona Shona sn Latn Modèle de script latin
Songhay Songhaï son Latn Modèle de script latin
Sesotho sesotho st Latn Modèle de script latin
Español (Latinoamérica) Espagnol es-419 Latn ; Amérique latine es
ᮞᮥᮔ᮪ᮓ ᮞᮥᮔ᮪ᮓ , Basa Sunda Soundanais su Latn Modèle de script latin
siSwati Swati ss Latn Modèle de script latin
Reo Tahiti Tahitien ty Latn Modèle de script latin
тоҷикӣ Tadjik tg Cyrl Modèle de script cyrillique
татар теле Tatar tt Cyrl/Latn Modèle de script cyrillique
KʌThemnɛ Temne tem Latn Modèle de script latin
lea faka-Tonga Tongien to Latn Modèle de script latin
Xitsonga Tsonga ts Latn Modèle de script latin
Setswana Tswana tn Latn Modèle de script latin
Türkmençe Turkmène tk Latn Modèle de script cyrillique
удмурт кыл Oudmourte udm Cyrl Modèle de script cyrillique
Tshivenḓa Venda ve Latn Modèle de script latin
Vod Vote vot Cyrl/Latn Modèle de script cyrillique
Frysk Frison occidental fy Latn Modèle de script latin
Wolof Wolof wo Latn Modèle de script latin
isiXhosa Xhosa xh Latn Modèle de script latin
Èdè Yorùbá Yoruba yo Latn Modèle de script latin
Diidxazá Zapotèque Zap Latn Modèle de script latin