Cette page a été traduite par l'API Cloud Translation.

Langues compatibles avec l'OCR

La fonctionnalité de reconnaissance de texte de l'API Cloud Vision peut détecter une grande variété de langues, et plusieurs langues au sein d'une même image.

Il n'est pas nécessaire de fournir un indicateur de langue au service, mais vous pouvez le faire si ce dernier ne parvient pas à détecter la langue utilisée dans votre image.

Avec le lancement de l'écriture manuscrite (OCR) en phase de disponibilité générale, il n'est pas nécessaire de définir l'option languageHints pour les images en cas d'utilisation de DOCUMENT_TEXT_DETECTION.

Les indicateurs de langue facultatifs sont spécifiés dans le champ ImageContext d'une requête en tant que liste de languageHints pour les requêtes TEXT_DETECTION et DOCUMENT_TEXT_DETECTION.

Chaque paramètre de code de langue se compose d'un identifiant BCP 47. Ce paramètre peut se présenter sous la forme langue-région, langue faisant référence à la langue principale et région (facultatif) renvoyant à la zone géographique (généralement désignée par l'identificateur d'un pays) où est parlé le dialecte en question. Par exemple, le chinois peut être représenté par le chinois simplifié tel qu'il est écrit en République populaire de Chine (zh-Hans) ou en chinois traditionnel tel qu'il est écrit à Taïwan (zh-Hant).

La fonctionnalité de reconnaissance de texte prend en charge trois niveaux :

Les langues acceptées sont celles que nous priorisons et évaluons régulièrement par rapport aux performances.
Les langues expérimentales sont celles qui sont en phase de développement actif, mais pas évaluées régulièrement.
Les langues mappées sont celles qui sont compatibles avec un autre code de langue ou un outil de reconnaissance de caractères général. Par exemple, la langue "en-GB" est acceptée, mais n'est pas traitée différemment de "en" dans le cadre de la reconnaissance de texte. Nous nous efforçons de renvoyer le code de langue mappé correct dans le champ des paramètres régionaux d'entité, mais les langues mappées sont davantage susceptibles d'être prises pour une langue similaire que les langues entièrement ou expérimentalement acceptées.

La liste des langues (avec les codes languageHint associés) acceptées par TEXT_DETECTION et DOCUMENT_TEXT_DETECTION est indiquée ci-dessous.

Si l'indicateur de langue n'est pas renseigné, nous essaierons de détecter automatiquement la langue la plus appropriée. Le point de terminaison TEXT_DETECTION détecte automatiquement un sous-ensemble de langues acceptées, tandis que le point de terminaison DOCUMENT_TEXT_DETECTION détecte automatiquement l'ensemble des langues acceptées.

Langues acceptées

Les langues suivantes sont classées par ordre de priorité et régulièrement évaluées.

Pour filtrer par fonctionnalité, saisissez ou sélectionnez directement la langue souhaitée dans le menu déroulant :

Langue	Langue (nom français)	Code `languageHints`	Script	Remarques
Afrikaans	Afrikaans	`af`	`Latn`
shqip	Albanais	`sq`	`Latn`
العربية	Arabe	`ar`	`Arab`	Standard moderne
Հայ	Arménien	`hy`	`Armn`
беларуская	Biélorusse	`be`	`Cyrl`
বাংলা	Bengalî	`bn`	`Beng`
български	Bulgare	`bg`	`Cyrl`
Català	Catalan	`ca`	`Latn`
普通话	Chinois	`zh`	`Hans/Hant`
Hrvatski	Croate	`hr`	`Latn`
Čeština	Tchèque	`cs`	`Latn`
Dansk	Danois	`da`	`Latn`
Nederlands	Néerlandais	`nl`	`Latn`
English	Français	`en`	`Latn`	Américain
Eesti keel	Estonien	`et`	`Latn`
Filipino	Philippin	`fil`	`Latn`
Suomi	Finnois	`fi`	`Latn`
Français	Français	`fr`	`Latn`	Européen
Deutsch	Allemand	`de`	`Latn`
Ελληνικά	Grec	`el`	`Grek`
ગુજરાતી	Gujarati	`gu`	`Gujr`
עברית	Hébreu	`iw`	`Hebr`
हिन्दी	Hindi	`hi`	`Deva`
Magyar	Hongrois	`hu`	`Latn`
Íslenska	Islandais	`is`	`Latn`
Bahasa Indonesia	Indonésien	`id`	`Latn`
Italiano	Italien	`it`	`Latn`
日本語	Japonais	`ja`	`Jpan`
ಕನ್ನಡ	Kannara	`kn`	`Knda`
ភាសាខ្មែរ	Khmer	`km`	`Khmr`
한국어	Coréen	`ko`	`Kore`
ລາວ	Laotien	`lo`	`Laoo`
Latviešu	Letton	`lv`	`Latn`
Lietuvių	Lituanien	`lt`	`Latn`
Македонски	Macédonien	`mk`	`Cyrl`
Bahasa Melayu	Malaisien	`ms`	`Latn`
മലയാളം	Malayalam	`ml`	`Mlym`
मराठी	Marathi	`mr`	`Deva`
नेपाली	Népalais	`ne`	`Deva`
Norsk	Norvégien	`no`	`Latn`	Bokmål
فارسی	Persan	`fa`	`Arab`
Polski	Polonais	`pl`	`Latn`
Português	Portugais	`pt`	`Latn`	Brésilien
ਪੰਜਾਬੀ	Panjabi	`pa`	`Guru`	Gurmukhī
Română	Roumain	`ro`	`Latn`
Русский	Russe	`ru`	`Cyrl`
Русский (старая орфография)	Russe	`ru-PETR1708`	`Cyrl`	Ancienne orthographe
Српски	Serbe	`sr`	`Cyrl`
Српски (латиница)	Serbe	`sr-Latn`	`Latn`
Slovenčina	Slovaque	`sk`	`Latn`
Slovenščina	Slovène	`sl`	`Latn`
Español	Espagnol	`es`	`Latn`	Européen
Svenska	Suédois	`sv`	`Latn`
Tagalog	Tagalog	`tl`	`Latn`
தமிழ்	Tamoul	`ta`	`Taml`
తెలుగు	Telugu	`te`	`Telu`
ไทย	Thaï	`th`	`Thai`
Türkçe	Turc	`tr`	`Latn`
Українська	Ukrainien	`uk`	`Cyrl`
Tiếng Việt	Vietnamien	`vi`	`Latn`
Yiddish	Yiddish	`yi`	`Hebr`

Langues expérimentales

Les langues suivantes sont en phase de développement actif et n'ont pas encore été évaluées régulièrement.

Langue	Langue (nom français)	Code `languageHints`	Script	Remarques
አማርኛ	Amharique	`am`	`Ethi`
Αρχαία ελληνικά	Grec ancien	`grc`	`Grek`
অসমীয়া	Assamais	`as`	`Beng`
Azərbaycan	Azéri	`az`	`Latn`
Azərbaycan (qədim yazı)	Azéri	`az-Cyrl`	`Cyrl`	Ancienne orthographe
Euskara	Basque	`eu`	`Latn`
Bosanski	Bosniaque	`bs`	`Latn`
မြန်မာ	Birman	`my`	`Mymr`
Cebuano	Cebuano	`ceb`	`Latn`
ᏣᎳᎩ ᎦᏬᏂᎯᏍᏗ	Cherokee	`chr`	`Cher`
dhivehi, dhivehi-bas	Divéhi	`dv`	`Thaa`
རྫོང་ཁ	Dzonkha	`dz`	`Tibt`
Esperanto	Espéranto	`eo`	`Latn`
Galego	Galicien	`gl`	`Latn`
ქართული	Géorgien	`ka`	`Geor`
Kreyòl Ayisyen	Créole haïtien	`ht`	`Latn`
Gaeilge	Irlandais	`ga`	`Latn`
Jawa	Javanais	`jv`	`Latn`
Қазақ	Kazakh	`kk`	`Cyrl`
Kirghiz	Kirghiz	`ky`	`Cyrl`
Latine	Latin	`la`	`Latn`
Malti	Maltais	`mt`	`Latn`
Монгол	Mongol	`mn`	`Cyrl`
ଓଡ଼ିଆ	Oriyâ	`or`	`Orya`
پښتو	Pachtô	`ps`	`Arab`
संस्कृतम्	Sanskrit	`sa`	`Deva`
සිංහල	Cingalais	`si`	`Sinh`
Swahili	Swahili	`sw`	`Latn`
leššānā Suryāyā	Syriaque	`syr`	`Syriac`
བོད་སྐད་	Tibétain	`bo`	`Tibt`
ትግርኛ	Tigirinya	`ti`	`Ethi`
اردو	Ourdou	`ur`	`Arab`
oʻzbekcha	Ouzbek	`uz`	`Latn`	Latin
oʻzbekcha	Ouzbek	`uz-Cyrl`	`Cyrl`	Ancienne orthographe
Cymraeg	Gallois	`cy`	`Latn`
IsiZulu	Zoulou	`zu`	`Latn`

Langues mappées

Les langues suivantes sont mappées à un autre code de langue ou mappées à un outil de reconnaissance de caractères général.

Langue	Langue (nom français)	Code `languageHints`	Script	Remarques
بهسا اچيه	Aceh	`ace`	`Latn`	Modèle latin
Lwo	Acholi	`ach`	`Latn`	Modèle latin
Dangme	Adangme	`ada`	`Latn`	Modèle latin
Akan	Akan	`ak`	`Latn`	Modèle latin
Anicinâbemowin	Algonquien	`alg`	`Latn`	Modèle latin
Mapudungu	Araucan/Mapuche	`arn`	`Latn`	Modèle latin
Asturianu	Asturien	`ast`	`Latn`	Modèle latin
Dene	Athapascan	`ath`	`Latn`	Modèle latin
Aymar aru	Aymara	`ay`	`Latn`	Modèle latin
Bhāṣa Bali	Balinais	`ban`	`Latn`	Modèle latin
Bamanankan	Bambara	`bm`	`Latn`	Modèle latin
Narrow Bantu	Bantu	`bnt`	`Latn`	Modèle latin
башҡорт теле	Bachkir	`ba`	`Cyrl`	Modèle cyrillique
Toba–Batak	Batak	`btk`	`Latn`	Modèle latin
Chibemba	Bemba	`bem`	`Latn`	Modèle latin
Bikol Naga	Bicol	`bik`	`Latn`	Modèle latin
Bichelamar	Bislama	`bi`	`Latn`	Modèle latin
Brezhoneg	Breton	`br`	`Latn`	Modèle latin
нохчийн мотт / noxçiyn mott	Tchétchène	`ce`	`Cyrl`	Modèle cyrillique
汉语	Chinois (mandarin, simplifié)	`zh-Hans`	`Hans`	Modèle chinois
漢語	Chinois (mandarin, traditionnel)	`zh-Hant`	`Hant`	Modèle chinois
普通話	Chinois (mandarin, Hong Kong)	`zh-Hant-HK`	`Hant`	Modèle chinois
Chahta'	Choctaw	`cho`	`Latn`	Modèle latin
Чӑвашла	Tchouvache	`cv`	`Cyrl`	Modèle cyrillique
Cree–Montagnais–Naskapi	Cri	`cr`	`Latn`	Modèle latin
Mvskoke	Creek	`mus`	`Latn`	Modèle latin
qırımtatar tili, къырымтатар тили	Tatar de Crimée	`crh`	`Latn`	Modèle cyrillique
Dakhótiyapi, Dakȟótiyapi	Dakota	`dak`	`Latn`	Modèle latin
Douala	Douala	`dua`	`Latn`	Modèle latin
Ikɔ Efik	Efik	`efi`	`Latn`	Modèle latin
English (British)	Anglais (britannique)	`en-GB`	`Latn`	Modèle latin
Èʋegbe	Ewe	`ee`	`Latn`	Modèle latin
føroyskt mál	Féroé	`fo`	`Latn`	Modèle latin
Na Vosa Vakaviti	Fidjien	`fj`	`Latn`	Modèle latin
fɔ̀ngbè	Fon	`fon`	`Latn`	Modèle latin
Français canadien	Français (canadien)	`fr-CA`	`Latn`	Modèle latin
Fulani, Fulah, Peul	Peul	`ff`	`Latn`	Modèle latin
Gã	ga	`gaa`	`Latn`	Modèle latin
Luganda	ganda	`lg`	`Latn`	Modèle latin
Basa Gayo	Gayo	`gay`	`Latn`	Modèle latin
Kiribati	Gilbertin	`gil`	`Latn`	Modèle latin
Gothic	Gothique	`got`	`Latn`	Modèle latin
Guaraní	Guarani	`gn`	`Latn`	Modèle latin
Harshen/Halshen Hausa هَرْشَن هَوْسَ	Haoussa	`ha`	`Latn`	Modèle latin
ʻŌlelo Hawaiʻi	Hawaïen	`haw`	`Latn`	Modèle latin
Otjiherero	Héréro	`hz`	`Latn`	Modèle latin
Ilonggo	Hiligaïnon	`hil`	`Latn`	Modèle latin
Jaku Iban	Iban	`iba`	`Latn`	Modèle latin
Asụsụ Igbo	Igbo	`ig`	`Latn`	Modèle latin
Ilokano	Ilocano	`ilo`	`Latn`	Modèle latin
Taqbaylit	Kabyle	`kab`	`Latn`	Modèle latin
Jingpho	Kachin	`kac`	`Latn`	Modèle latin
Kalaallisut	Kalaallisut	`kl`	`Latn`	Modèle latin
Kikamba	Kamba	`kam`	`Latn`	Modèle latin
Kanuri	Kanuri	`kr`	`Latn`	Modèle latin
Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى	Karakalpaks	`kaa`	`Cyrl/Latn`	Modèle cyrillique
Ka Ktien Khasi	Khasi	`kha`	`Latn`	Modèle latin
Gĩkũyũ	Kikuyu	`ki`	`Latn`	Modèle latin
Kinyarwanda	Kinyarwanda	`rw`	`Latn`	Modèle latin
коми кыв	Komi	`kv`	`Cyrl`	Modèle cyrillique
Kikongo	Kongo	`kg`	`Latn`	Modèle latin
Kosraean	Kosrae	`kos`	`Latn`	Modèle latin
Oshikwanyama	Kuanyama	`kj`	`Latn`	Modèle latin
Ngala	Lingala	`ln`	`Latn`	Modèle latin
Plattdütsch, Plattdeutsch, Nedersaksisch	Bas allemand	`nds`	`Latn`	Modèle latin
siLozi	lozi	`loz`	`Latn`	Modèle latin
Kiluba	Luba-katanga	`lu`	`Latn`	Modèle latin
Dholuo	Luo	`luo`	`Latn`	Modèle latin
Madhura, Basa Mathura, بَهاسَ مَدورا	Madurais	`mad`	`Latn`	Modèle latin
Malagasy	Malgache	`mg`	`Latn`	Modèle latin
Mandinka, لغة مندنكا	Mandingue	`man`	`Latn`	Modèle latin
Gaelg, Gailck	Manx	`gv`	`Latn`	Modèle latin
Te reo Māori	Maori	`mi`	`Latn`	Modèle latin
Ebon	Marshallais	`mh`	`Latn`	Modèle latin
Mɛnde yia	Mendé	`men`	`Latn`	Modèle latin
Middle English	Moyen anglais	`enm`	`Latn`	Modèle latin
Mittelhochdeutsch	Moyen haut-allemand	`gmh`	`Latn`	Modèle latin
Baso Minangkabau, باسو مينڠكاباو	Minangkabau	`min`	`Latn`	Modèle latin
Kanienʼkéha	Mohawk	`moh`	`Latn`	Modèle latin
Nkundu	Mongo	`lol`	`Latn`	Modèle latin
Nāhuatl	Nahuatl	`nah`	`Latn`	Modèle latin
Diné bizaad	Navajo	`nv`	`Latn`	Modèle latin
Ndonga	Ndonga	`ng`	`Latn`	Modèle latin
ko e vagahau Niuē	Niuéen	`niu`	`Latn`	Modèle latin
Zimbabwe Ndebele	Ndébélé du Nord	`nd`	`Latn`	Modèle latin
Sesotho sa Leboa	Sotho du Nord	`nso`	`Latn`	Modèle latin
Chichewa, Chinyanja	Chichewa	`ny`	`Latn`	Modèle latin
Runyankore	nyankolé	`nyn`	`Latn`	Modèle latin
Chitonga	Nyasa Tonga	`tog`	`Latn`	Modèle latin
Appolo	Nzema	`nzi`	`Latn`	Modèle latin
Occitan, lenga d'òc, provençal	Occitan	`oc`	`Latn`	Modèle latin
Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ	Ojibwa	`oj`	`Latn`	Modèle latin
Ænglisc, Englisc, Anglisc	Vieil anglais	`ang`	`Latn`	Modèle latin
Franceis, François, Romanz	Ancien français	`fro`	`Latn`	Modèle latin
Diutisk, Althochdeutsch	Vieux haut-allemand	`goh`	`Latn`	Modèle latin
Dǫnsk tunga	Vieux norrois	`non`	`Latn`	Modèle latin
Occitan ancian	Provençal ancien	`pro`	`Latn`	Modèle latin
ирон ӕвзаг	Ossète	`os`	`Cyrl`	Modèle cyrillique
Kapampangan	Pampanga	`pam`	`Latn`	Modèle latin
Salitan Pangasinan	Pangasinan	`pag`	`Latn`	Modèle latin
Papiamentu	Papiamento	`pap`	`Latn`	Modèle latin
Português (Portugal)	Portugais (européen)	`pt-PT`	`Latn`	Modèle latin
Kechua / Runa Simi	Quechua	`qu`	`Latn`	Modèle latin
Rumantsch	Romanche	`rm`	`Latn`	Modèle latin
Romani čhib	Romani	`rom`	`Latn`	Modèle latin
Ikirundi	Rundi	`rn`	`Latn`	Modèle latin
Sakha	Sakha	`sah`	`Cyrl`	Modèle cyrillique
Gagana faʻa Sāmoa	Samoan	`sm`	`Latn`	Modèle latin
yângâ tî sängö	Sango	`sg`	`Latn`	Modèle latin
(Braid) Scots, Lallans, Doric	Écossais	`sco`	`Latn`	Modèle latin
Gàidhlig	Gaélique écossais	`gd`	`Latn`	Modèle latin
chiShona	Shona	`sn`	`Latn`	Modèle latin
Songhay	Songhaï	`son`	`Latn`	Modèle latin
Sesotho	sesotho	`st`	`Latn`	Modèle latin
Español (Latinoamérica)	Espagnol (Amérique latine)	`es-419`	`Latn`	Modèle latin
ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda	Soundanais	`su`	`Latn`	Modèle latin
siSwati	Swati	`ss`	`Latn`	Modèle latin
Reo Tahiti	Tahitien	`ty`	`Latn`	Modèle latin
тоҷикӣ	Tadjik	`tg`	`Cyrl`	Modèle cyrillique
татар теле	Tatar	`tt`	`Cyrl/Latn`	Modèle cyrillique
KʌThemnɛ	Temne	`tem`	`Latn`	Modèle latin
lea faka-Tonga	Tongien	`to`	`Latn`	Modèle latin
Xitsonga	Tsonga	`ts`	`Latn`	Modèle latin
Setswana	Tswana	`tn`	`Latn`	Modèle latin
Türkmençe	Turkmène	`tk`	`Latn`	Modèle cyrillique
удмурт кыл	Oudmourte	`udm`	`Cyrl`	Modèle cyrillique
Tshivenḓa	Venda	`ve`	`Latn`	Modèle latin
Vod	Vote	`vot`	`Cyrl/Latn`	Modèle cyrillique
Frysk	Frison occidental	`fy`	`Latn`	Modèle latin
Wolof	Wolof	`wo`	`Latn`	Modèle latin
isiXhosa	Xhosa	`xh`	`Latn`	Modèle latin
Èdè Yorùbá	Yoruba	`yo`	`Latn`	Modèle latin
Diidxazá	Zapotèque	`zap`	`Latn`	Modèle latin

Scripts d'écriture manuscrite

Les scripts suivants sont compatibles avec la reconnaissance de l'écriture manuscrite. Consultez les tableaux de langues ci-dessus pour connaître les langues utilisant chaque script.

Script	Nom	Niveau d'assistance
`Beng`	Bengalî	Expérimentation
`Cyrl`	Cyrillique	Expérimentation
`Deva`	Dévanâgarî	Expérimentation
`Grek`	Grec	Expérimentation
`Hani`	Chinois	Expérimentation
`Jpan`	Japonais	Compatible
`Kore`	Coréen	Compatible
`Latn`	Latin	Compatible
`vi`	Vietnamien	Test