Compatibilité avec les langues de la reconnaissance optique des caractères

La fonctionnalité de reconnaissance de texte de l'API Cloud Vision peut détecter une grande variété de langues, et plusieurs langues au sein d'une même image.

Il n'est pas nécessaire de fournir un indicateur de langue au service, mais vous pouvez le faire si ce dernier ne parvient pas à détecter la langue utilisée dans votre image.

Avec le lancement de l'écriture manuscrite (OCR) en phase de disponibilité générale, il n'est pas nécessaire de définir l'option languageHints pour les images en cas d'utilisation de DOCUMENT_TEXT_DETECTION.

Les indicateurs de langue facultatifs sont spécifiés dans le champ ImageContext d'une requête en tant que liste de languageHints pour les requêtes TEXT_DETECTION et DOCUMENT_TEXT_DETECTION.

Chaque paramètre de code de langue se compose d'un identifiant BCP 47. Ce paramètre peut se présenter sous la forme langue-région, langue faisant référence à la langue principale et région (facultatif) renvoyant à la zone géographique (généralement désignée par l'identificateur d'un pays) où est parlé le dialecte en question. Par exemple, le chinois peut être représenté par le chinois simplifié tel qu'il est écrit en République populaire de Chine (zh-Hans) ou en chinois traditionnel tel qu'il est écrit à Taïwan (zh-Hant).

La fonctionnalité de reconnaissance de texte prend en charge trois niveaux :

  1. Les langues acceptées sont celles que nous priorisons et évaluons régulièrement par rapport aux performances.
  2. Les langues expérimentales sont celles qui sont en phase de développement actif, mais pas évaluées régulièrement.
  3. Les langues mappées sont celles qui sont compatibles avec un autre code de langue ou un outil de reconnaissance de caractères général. Par exemple, la langue "en-GB" est acceptée, mais n'est pas traitée différemment de "en" dans le cadre de la reconnaissance de texte. Nous nous efforçons de renvoyer le code de langue mappé correct dans le champ des paramètres régionaux d'entité, mais les langues mappées sont davantage susceptibles d'être prises pour une langue similaire que les langues entièrement ou expérimentalement acceptées.

La liste des langues (avec les codes languageHint associés) acceptées par TEXT_DETECTION et DOCUMENT_TEXT_DETECTION est indiquée ci-dessous.

Si l'indicateur de langue n'est pas renseigné, nous essaierons de détecter automatiquement la langue la plus appropriée. Le point de terminaison TEXT_DETECTION détecte automatiquement un sous-ensemble de langues acceptées, tandis que le point de terminaison DOCUMENT_TEXT_DETECTION détecte automatiquement l'ensemble des langues acceptées.

Langues acceptées

Les langues suivantes sont classées par ordre de priorité et régulièrement évaluées.

Pour filtrer par fonctionnalité, saisissez ou sélectionnez directement la langue souhaitée dans le menu déroulant :

Langage Langue (nom français) code languageHints Script / Remarques
Afrikaans Afrikaans af Décollage
Shqip Albanais sq Décollage
العربية Arabe ar arabe, Standard moderne
Հայ Arménien hy Arnaux
беларускі Belorusien b Cylol
বাংলা Bengalî bn Bengue
български Bulgare bg Cylol
Català Catalan ca Décollage
普通话 Chinois zh Hants/Halloween
Hrvatski Croate hr Décollage
Čeština Tchèque cs Décollage
Danois Danois da Décollage
Nederlands Néerlandais nl Décollage
Anglais Anglais fr Lanc ; Américains
Eesti keel Estonien et Décollage
Philippin Philippin filique (ou tl) Décollage
Souomi Finnois fi Décollage
Français Français fr Lanc ; Europe
Deutsch Allemand de Décollage
Ελληνικά Grec el Grec
ગુજરાતી Gujarâtî gu Gujr
עברית Hébreu iw Hebr
हिन्दी Hindi salut Deva
Magyar Hongrois hu Décollage
Íslenska Islandais est Décollage
Indonésien Indonésien id Décollage
Italiano Italien it Décollage
日本語 Japonais ja Jpan
ಕನ್ನಡ Kannara kn Knda
ភាសាខ្មែរ Khmer km Khm
한국어 Coréen ko Kore
ລາວ Laotien lo Laos
Latviešu Letton lv Décollage
Lietuvių Lituanien lt Décollage
Македонски Macédonien mk Cylol
Bahasa Melayu Malais ms Décollage
മലയാളം Malayâlam ml Mym
मराठी Marathi mr Deva
नेपाली Népalais ne Deva
Norvégien Norvégien no Lanc ; Bokmål
فارسی Perse fa Arabe
Polski Polonais pl Décollage
Português Portugais pt Lanc ; brésilien
ਪੰਜਾਬੀ Panjabi pa Expert ; Gurmukhi
Română Roumain ro Décollage
Русский Russe ru Cylol
Русский (старая орфография) Russe ru-PETR1708 Cyrl; Ancienne orthographie
Српски Serbe sr Cyrl et Latn
Српски (латиница) Serbe sr-Amérique Décollage
Slovenčina Slovak sk Décollage
Slovenščina Slovène sl Décollage
Español Espagnol es Lanc ; Europe
Svenska Suédois sv Décollage
தமிழ் Tamoul ta Tamoul
తెలుగు Télougou te Telu
ไทย Thaï th Thaï
Türkçe Turc tr Décollage
Українська Ukrainien uk Cylol
Tiếng Việt Vietnamien vi Décollage
Yiddish Yiddish yi Hebr

Langues expérimentales

Les langues suivantes sont en phase de développement actif et n'ont pas encore été évaluées régulièrement.

Langage Langue (nom français) Code languageHints Script / Remarques
አማርኛ Amharique a.m. Ethi
Αρχαία ελληνικά Grec ancien Grc Grec
অসমীয়া Assamais as Bengue
Azérirque Azéri az Décollage
Azərbaycan (qədim yazı) Azéri Az-Cyrl Cyrl; orthographie
Euska Basque eu Décollage
Bosanski Bosnien bs Décollage
မြန်မာ Birman my Imp
Cebuano Cebuano cebe Décollage
ᏣᎳᎩ ᎦᏬᏂᎯᏍᏗ Cherokee chr Cher
Drhchi Divéhi dv Tha
རྫོང་ཁ Dzongkha DZ Tibet
Espéranto Espéranto eo Décollage
Galégo Galicien gl Décollage
ქართული Géorgien ka Géomarquer
Kreyòl Ayisyen Créole haïtien ht Décollage
Gailge Irlandais ga Décollage
Jawa Javanais jv Décollage
Қазақ Kazakh kk Cylol
Kirghiz Kirghiz ky Cylol
Latino-américain Latin la Décollage
Malti Maltais mt Décollage
Монгол Mongol mn Cylol
ଓଡ଼ିଆ Oriya ou Oraya
پښتو Pachtô ps Arabe
संस्कृतम् Sanskrit sa Deva
සිංහල Cingalais si Sin
Swahili Swahili sw Décollage
Leššānā Suryāyā Syriaque seigle Syriaque
བོད་སྐད་ Tibétain bo Tibet
ትግርኛ Tigirinay ti Ethi
اردو Urdu ur Arabe
oʻzbekcha Ouzbek uz Lanc ; Latino
oʻzbekcha Ouzbek ouaz Cyrl; orthographie
Cymurag Gallois cy Décollage
IziZulu Zulu zu Décollage

Langues mappées

Les langues suivantes sont mappées à un autre code de langue ou mappées à un outil de reconnaissance de caractères général.

Langage Langue (nom français) code languageHints Script / Remarques Mappé sur
بهسا اچيه Aceh as Décollage Modèle de script latin
Nwo Acholi ach. Décollage Modèle de script latin
Adangme Adangme Ada Décollage Modèle de script latin
Akan Akan k Décollage Modèle de script latin
Anicnâbemowin Algonquin alg Décollage Modèle de script latin
Mapudung Araucan/Mapuche Arn Décollage Modèle de script latin
Asturien Asturien Aset Décollage Modèle de script latin
Dune Athabaskan Ath Décollage Modèle de script latin
Aymar aru Aymara Ay Décollage Modèle de script latin
Bhāṣa Bali Balinais interdire Décollage Modèle de script latin
Bamanankan Bambara Bm Décollage Modèle de script latin
Étroite Bantu Bantu Bnt Décollage Modèle de script latin
башҡорт теле Bachkir ba Cylol Modèle de script cyrillique
Toba-Batak Batak gi Décollage Modèle de script latin
Chibemba Bemba Bem Décollage Modèle de script latin
Steveal Naga Bicolano béki Décollage Modèle de script latin
Bichelamar Bislama bi Décollage Modèle de script latin
Brejoneg Breton Décollage Modèle de script latin
нохчийн //noxçiyn mott Tchétchène ce Cylol Modèle de script cyrillique
汉语 Chinois zh-Hans Hanse Simplifié Mandarin zh
漢語 Chinois zh-Hant Hant. Traditionnel Mandarin zh
普通話 Chinois zh-Hant-HK Hant. Mandarin Hong Kong zh
Chahta Choctaw Cho Décollage Modèle de script latin
Чӑвашла Tchouvache TV Cylol Modèle de script cyrillique
Cri–Montagnais–Naskapi Cri cre Décollage Modèle de script latin
Mvskoke Littoral Muse Décollage Modèle de script latin
qırımtatar tili, къырымтатар тили Tatar de Crimée grh Décollage Modèle de script cyrillique
Dakhótiyapi, Dakȟótiyapi Dakota ba Décollage Modèle de script latin
Douala Duaala Dua Décollage Modèle de script latin
Ikɔ Efik Efik efi Décollage Modèle de script latin
Anglais (Royaume-Uni) Anglais en-GB Lanc ; Britanniques fr
Èʋegbe Ewe élé Décollage Modèle de script latin
føroyskt mál Féroé fo Décollage Modèle de script latin
Na Vosa Vakaviti Fidjien fj Décollage Modèle de script latin
fɔ̀ngbè Fon Fon Décollage Modèle de script latin
François Canatien Français fr-CA Lanc ; Canadienne fr
Peul, Fulah, Peul Fula ff Décollage Modèle de script latin
ga gaa Décollage Modèle de script latin
Luganda ganda LG Décollage Modèle de script latin
Basa Gayo Gayo gay Décollage Modèle de script latin
Kiribati Gilbert Gras Décollage Modèle de script latin
Gothique Gothique obtenu Décollage Modèle de script latin
Guaraní Guarani G Décollage Modèle de script latin
Harshen/Halsh Ha Hausa هَرْشَن هَوْسَ Haoussa ha Décollage Modèle de script latin
ʻŌlelo Hawai'i Hawaïen Haw Décollage Modèle de script latin
Otjihereoro Héréro Hz Décollage Modèle de script latin
Ilonggo Hiligaïnon nil Décollage Modèle de script latin
Jaku Iban Iban Iba Décollage Modèle de script latin
Assụ Igbo Igbo ig Décollage Modèle de script latin
Ilokano Iloko Ilo Décollage Modèle de script latin
Taqbaylit Kabyle Kab Décollage Modèle de script latin
Jingpho Kachin Kac Décollage Modèle de script latin
Kalaallisut Kalaallisut kl Décollage Modèle de script latin
Kikamba Kamba jam Décollage Modèle de script latin
Kanuri Kanuri kr Décollage Modèle de script latin
Qliqalpaq, Қарақалпақ тили, قاراقالپاق تىلى Kara-Kalpak Kaa Cyrl/Latn Modèle de script cyrillique
Ka Ktien Khasi kha Décollage Modèle de script latin
Gĩkũyũ Kikuyu ki Décollage Modèle de script latin
Kinyarwanda Kinyarwanda r Décollage Modèle de script latin
коми кыв Komi kv Cylol Modèle de script cyrillique
Kikongo Kongo kg Décollage Modèle de script latin
Kosrae Kosrae Kos Décollage Modèle de script latin
Oshikwanyama Kuanyama kj Décollage Modèle de script latin
Ngala Lingala n Décollage Modèle de script latin
Plattdütsch, Platdeutsch, Nedersaksisch Bas-allemand seconde Décollage Modèle de script latin
Si Lozi lozi loz Décollage Modèle de script latin
Kilbou Luba-katanga Lu Décollage Modèle de script latin
Dolouo Luo Luo Décollage Modèle de script latin
Madhura, Basa Mathura, بَهاسَ مَدورا Madurais fou Décollage Modèle de script latin
Malgache Malgache mg Décollage Modèle de script latin
Mandinine, لغة مندنكا Mandingue homme Décollage Modèle de script latin
Gaelg (Gailck) Manx gv Décollage Modèle de script latin
Te reo Māori Maori mi Décollage Modèle de script latin
Ebonn Marshall Mh Décollage Modèle de script latin
Mɛnde Yia Mendé men Décollage Modèle de script latin
Moyen anglais Moyen anglais Emm Décollage Modèle de script latin
Mittelhochdeutsch Haut-allemand gham Décollage Modèle de script latin
Baso Minangkabau, باسو مينڠكاباو Minangkabau min Décollage Modèle de script latin
Kanien-kéha Mohawk mois Décollage Modèle de script latin
Nkundu Mongo lol Décollage Modèle de script latin
Nāhuatl Nahuatl sans façon Décollage Modèle de script latin
Portrait de Diné Navajo nv Décollage Modèle de script latin
Ndonga Ndonga s Décollage Modèle de script latin
ko e Vagahau Niuē Niuéen Niu Décollage Modèle de script latin
Ndébélé du Zimbabwe Ndébélé du Nord l Décollage Modèle de script latin
Sosoho sa Leboa Sotho du Nord Nso Décollage Modèle de script latin
Chichewa, Chinyanja Chichewa ny Décollage Modèle de script latin
Runyankore nyankolé Nyn Décollage Modèle de script latin
Chitonga Tonga nyaa tog Décollage Modèle de script latin
Appolo Nzima Zzi Décollage Modèle de script latin
Occitan, lyna d'òc, éprouvée Occitan oct. Décollage Modèle de script latin
Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ Ojibwa Oj Décollage Modèle de script latin
Ænglisc, Englisc, Anglissc Ancien anglais ang Décollage Modèle de script latin
Frances, François, Romanz Vieux français frisé Décollage Modèle de script latin
Diutisk (Athochdeutsch) Vieux allemand Goh Décollage Modèle de script latin
Tunga du Dǫnsk Vieux-Nord non Décollage Modèle de script latin
Acique Ancien provençal professionnel Décollage Modèle de script latin
ирон ӕвзаг Ossétique os Cylol Modèle de script cyrillique
Pampangan Pampanga Pam Décollage Modèle de script latin
Salitan Pisgasinan Pangasinan pagination Décollage Modèle de script latin
Papiamentu Papimento pap Décollage Modèle de script latin
Português (Portugal) Portugais pt-PT Lanc ; Europe pt
Kechua / Runa Simi Quechua Qua Décollage Modèle de script latin
Rumant Romanche rm Décollage Modèle de script latin
Romani čhib Romani rom Décollage Modèle de script latin
Ikirundi Rundi r Décollage Modèle de script latin
Sakha Sakha salut Cylol Modèle de script cyrillique
Gagana faʻa Sāmoa Samoan sm Décollage Modèle de script latin
yângâ tî sängä Sango sg Décollage Modèle de script latin
(Braid) Scots, Lallans, Dric Écossais Sco Décollage Modèle de script latin
Gàidhlig Gaélique écossais gd Décollage Modèle de script latin
Chihona Shona sn Décollage Modèle de script latin
Songhay Songhahai fils Décollage Modèle de script latin
Sesotho sesotho st Décollage Modèle de script latin
Español (Latinoamérica) Espagnol es-419 Lanc ; Espagnol (Amérique latine) es
ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Suda Soundanais su Décollage Modèle de script latin
Siwati Swati ss Décollage Modèle de script latin
Reo Tahiti Tahitien a Décollage Modèle de script latin
тоҷикӣ Tadjik tg Cylol Modèle de script cyrillique
татар теле Tatar point Cyrl/Latn Modèle de script cyrillique
KʌThemnɛ Temne Tem Décollage Modèle de script latin
Lea faka-Tonga Tongien à Décollage Modèle de script latin
Xitsonga Tsonga ts Décollage Modèle de script latin
Tswana Tswana tn Décollage Modèle de script latin
Türkmène Turkmène tk Décollage Modèle de script cyrillique
удмурт кыл Oudmourte Um Cylol Modèle de script cyrillique
Tssidnḓa Venda ve Décollage Modèle de script latin
Vodif Voyique Vott Cyrl/Latn Modèle de script cyrillique
Frysk Frison occidental fy Décollage Modèle de script latin
Wolof Wolof wo Décollage Modèle de script latin
IsXhosa Xhosa xh Décollage Modèle de script latin
DÈ Yorùbá Yoruba yo Décollage Modèle de script latin
Diidxazá Zapotèque Zap Décollage Modèle de script latin