La fonctionnalité de reconnaissance de texte de l'API Cloud Vision peut détecter une grande variété de langues, et plusieurs langues au sein d'une même image.
Il n'est pas nécessaire de fournir un indicateur de langue au service, mais vous pouvez le faire si ce dernier ne parvient pas à détecter la langue utilisée dans votre image.
Avec le lancement de l'écriture manuscrite (OCR) en phase de disponibilité générale, il n'est pas nécessaire de définir l'option languageHints
pour les images en cas d'utilisation de DOCUMENT_TEXT_DETECTION
.
Les indicateurs de langue facultatifs sont spécifiés dans le champ ImageContext d'une requête en tant que liste de languageHints
pour les requêtes TEXT_DETECTION
et DOCUMENT_TEXT_DETECTION
.
Chaque paramètre de code de langue se compose d'un identifiant BCP 47. Ce paramètre peut se présenter sous la forme langue-région, langue faisant référence à la langue principale et région (facultatif) renvoyant à la zone géographique (généralement désignée par l'identificateur d'un pays) où est parlé le dialecte en question. Par exemple, le chinois peut être représenté par le chinois simplifié tel qu'il est écrit en République populaire de Chine (zh-Hans
) ou en chinois traditionnel tel qu'il est écrit à Taïwan (zh-Hant
).
La fonctionnalité de reconnaissance de texte prend en charge trois niveaux :
- Les langues acceptées sont celles que nous priorisons et évaluons régulièrement par rapport aux performances.
- Les langues expérimentales sont celles qui sont en phase de développement actif, mais pas évaluées régulièrement.
- Les langues mappées sont celles qui sont compatibles avec un autre code de langue ou un outil de reconnaissance de caractères général. Par exemple, la langue "
en-GB
" est acceptée, mais n'est pas traitée différemment de "en
" dans le cadre de la reconnaissance de texte. Nous nous efforçons de renvoyer le code de langue mappé correct dans le champ des paramètres régionaux d'entité, mais les langues mappées sont davantage susceptibles d'être prises pour une langue similaire que les langues entièrement ou expérimentalement acceptées.
La liste des langues (avec les codes languageHint
associés) acceptées par TEXT_DETECTION
et DOCUMENT_TEXT_DETECTION
est indiquée ci-dessous.
Si l'indicateur de langue n'est pas renseigné, nous essaierons de détecter automatiquement la langue la plus appropriée. Le point de terminaison TEXT_DETECTION
détecte automatiquement un sous-ensemble de langues acceptées, tandis que le point de terminaison DOCUMENT_TEXT_DETECTION
détecte automatiquement l'ensemble des langues acceptées.
Langues acceptées
Les langues suivantes sont classées par ordre de priorité et régulièrement évaluées.
Pour filtrer par fonctionnalité, saisissez ou sélectionnez directement la langue souhaitée dans le menu déroulant :
Langue | Langue (nom français) | Code languageHints | Script / Remarques |
---|---|---|---|
Afrikaans | Afrikaans | af | Latn |
shqip | Albanais | sq | Latn |
العربية | Arabe | ar | Arab; Modern Standard |
Հայ | Arménien | hy | Armn |
беларуская | Biélorusse | be | Cyrl |
বাংলা | Bengalî | bn | Beng |
български | Bulgare | bg | Cyrl |
Català | Catalan | ca | Latn |
普通话 | Chinois | zh | Hans/Hant |
Hrvatski | Croate | hr | Latn |
Čeština | Tchèque | cs | Latn |
Dansk | Danois | da | Latn |
Nederlands | Néerlandais | nl | Latn |
English | Anglais | en | Latn; American |
Eesti keel | Estonien | et | Latn |
Filipino | Philippin | fil (or tl) | Latn |
Suomi | Finnois | fi | Latn |
Français | Français | fr | Latn; European |
Deutsch | Allemand | de | Latn |
Ελληνικά | Grec | el | Grek |
ગુજરાતી | Gujarâtî | gu | Gujr |
עברית | Hébreu | iw | Hebr |
हिन्दी | Hindi | hi | Deva |
Magyar | Hongrois | hu | Latn |
Íslenska | Islandais | is | Latn |
Bahasa Indonesia | Indonésien | id | Latn |
Italiano | Italien | it | Latn |
日本語 | Japonais | ja | Jpan |
ಕನ್ನಡ | Kannara | kn | Knda |
ភាសាខ្មែរ | Khmer | km | Khmr |
한국어 | Coréen | ko | Kore |
ລາວ | Laotien | lo | Laoo |
Latviešu | Letton | lv | Latn |
Lietuvių | Lituanien | lt | Latn |
Македонски | Macédonien | mk | Cyrl |
Bahasa Melayu | Malaisien | ms | Latn |
മലയാളം | Malayâlam | ml | Mlym |
मराठी | Marathi | mr | Deva |
नेपाली | Népalais | ne | Deva |
Norsk | Norvégien | no | Latn; Bokmål |
فارسی | Persan | fa | Arab |
Polski | Polonais | pl | Latn |
Português | Portugais | pt | Latn; Brazilian |
ਪੰਜਾਬੀ | Panjabi | pa | Guru; Gurmukhi |
Română | Roumain | ro | Latn |
Русский | Russe | ru | Cyrl |
Русский (старая орфография) | Russe | ru-PETR1708 | Cyrl; Old Orthography |
Српски | Serbe | sr | Cyrl & Latn |
Српски (латиница) | Serbe | sr-Latn | Latn |
Slovenčina | Slovaque | sk | Latn |
Slovenščina | Slovène | sl | Latn |
Español | Espagnol | es | Latn; European |
Svenska | Suédois | sv | Latn |
தமிழ் | Tamoul | ta | Taml |
తెలుగు | Télougou | te | Telu |
ไทย | Thaï | th | Thai |
Türkçe | Turc | tr | Latn |
Українська | Ukrainien | uk | Cyrl |
Tiếng Việt | Vietnamien | vi | Latn |
Yiddish | Yiddish | yi | Hebr |
Langues expérimentales
Les langues suivantes sont en phase de développement actif et n'ont pas encore été évaluées régulièrement.
Langage | Langue (nom français) | Code languageHints |
Script / Remarques |
---|---|---|---|
አማርኛ | Amharique | am | Ethi |
Αρχαία ελληνικά | Grec ancien | grc | Grek |
অসমীয়া | Assamais | as | Beng |
Azərbaycan | Azéri | az | Latn |
Azərbaycan (qədim yazı) | Azéri | az-Cyrl | Cyrl; Ancienne orthographe |
Euskara | Basque | eu | Latn |
Bosanski | Bosniaque | bs | Latn |
မြန်မာ | Birman | my | Mymr |
Cebuano | Cebuano | ceb | Latn |
ᏣᎳᎩ ᎦᏬᏂᎯᏍᏗ | Cherokee | chr | Cher |
dhivehi, dhivehi-bas | Divéhi | dv | Thaa |
རྫོང་ཁ | Dzonkha | dz | Tibt |
Esperanto | Espéranto | eo | Latn |
Galego | Galicien | gl | Latn |
ქართული | Géorgien | ka | Geor |
Kreyòl Ayisyen | Créole haïtien | ht | Latn |
Gaeilge | Irlandais | ga | Latn |
Jawa | Javanais | jv | Latn |
Қазақ | Kazakh | kk | Cyrl |
Kirghiz | Kirghiz | ky | Cyrl |
Latine | Latin | la | Latn |
Malti | Maltais | mt | Latn |
Монгол | Mongol | mn | Cyrl |
ଓଡ଼ିଆ | Oriyâ | or | Orya |
پښتو | Pachtô | ps | Arab |
संस्कृतम् | Sanskrit | sa | Deva |
සිංහල | Cingalais | si | Sinh |
Swahili | Swahili | sw | Latn |
leššānā Suryāyā | Syriaque | syr | Syriac |
བོད་སྐད་ | Tibétain | bo | Tibt |
ትግርኛ | Tigirinya | ti | Ethi |
اردو | Ourdou | ur | Arab |
oʻzbekcha | Ouzbek | uz | Latn; Latin |
oʻzbekcha | Ouzbek | uz-Cyrl | Cyrl; Ancienne orthographe |
Cymraeg | Gallois | cy | Latn |
IsiZulu | Zoulou | zu | Latn |
Langues mappées
Les langues suivantes sont mappées à un autre code de langue ou mappées à un outil de reconnaissance de caractères général.
Langage | Langue (nom français) | Code languageHints | Script / Remarques | Associé à |
---|---|---|---|---|
بهسا اچيه | Aceh | ace | Latn | Modèle de script latin |
Lwo | Acholi | ach | Latn | Modèle de script latin |
Dangme | Adangme | ada | Latn | Modèle de script latin |
Akan | Akan | ak | Latn | Modèle de script latin |
Anicinâbemowin | Algonquien | alg | Latn | Modèle de script latin |
Mapudungu | Araucan/Mapuche | arn | Latn | Modèle de script latin |
Asturianu | Asturien | ast | Latn | Modèle de script latin |
Dene | Athapascan | ath | Latn | Modèle de script latin |
Aymar aru | Aymara | ay | Latn | Modèle de script latin |
Bhāṣa Bali | Balinais | ban | Latn | Modèle de script latin |
Bamanankan | Bambara | bm | Latn | Modèle de script latin |
Narrow Bantu | Bantu | bnt | Latn | Modèle de script latin |
башҡорт теле | Bachkir | ba | Cyrl | Modèle de script cyrillique |
Toba–Batak | Batak | btk | Latn | Modèle de script latin |
Chibemba | Bemba | bem | Latn | Modèle de script latin |
Bikol Naga | Bicol | bik | Latn | Modèle de script latin |
Bichelamar | Bislama | bi | Latn | Modèle de script latin |
Brezhoneg | Breton | br | Latn | Modèle de script latin |
нохчийн мотт / noxçiyn mott | Tchétchène | ce | Cyrl | Modèle de script cyrillique |
汉语 | Chinois | zh-Hans | Hans; Mandarin, simplifié | Modèle de script chinois |
漢語 | Chinois | zh-Hant | Hant; Mandarin, traditionnel | Modèle de script chinois |
普通話 | Chinois | zh-Hant-HK | Hant; Mandarin, Hong Kong | Modèle de script chinois |
Chahta' | Choctaw | cho | Latn | Modèle de script latin |
Чӑвашла | Tchouvache | cv | Cyrl | Modèle de script cyrillique |
Cree–Montagnais–Naskapi | Cri | cr | Latn | Modèle de script latin |
Mvskoke | Creek | mus | Latn | Modèle de script latin |
qırımtatar tili, къырымтатар тили | Tatar de Crimée | crh | Latn | Modèle de script cyrillique |
Dakhótiyapi, Dakȟótiyapi | Dakota | dak | Latn | Modèle de script latin |
Douala | Douala | dua | Latn | Modèle de script latin |
Ikɔ Efik | Efik | efi | Latn | Modèle de script latin |
English (British) | Français | en-GB | Latn; British | Modèle de script latin |
Èʋegbe | Ewe | ee | Latn | Modèle de script latin |
føroyskt mál | Féroé | fo | Latn | Modèle de script latin |
Na Vosa Vakaviti | Fidjien | fj | Latn | Modèle de script latin |
fɔ̀ngbè | Fon | fon | Latn | Modèle de script latin |
Français canadien | Français | fr-CA | Latn; Canadian | Modèle de script latin |
Fulani, Fulah, Peul | Peul | ff | Latn | Modèle de script latin |
Gã | ga | gaa | Latn | Modèle de script latin |
Luganda | ganda | lg | Latn | Modèle de script latin |
Basa Gayo | Gayo | gay | Latn | Modèle de script latin |
Kiribati | Gilbertin | gil | Latn | Modèle de script latin |
Gothic | Gothique | got | Latn | Modèle de script latin |
Guaraní | Guarani | gn | Latn | Modèle de script latin |
Harshen/Halshen Hausa هَرْشَن هَوْسَ | Haoussa | ha | Latn | Modèle de script latin |
ʻŌlelo Hawaiʻi | Hawaïen | haw | Latn | Modèle de script latin |
Otjiherero | Héréro | hz | Latn | Modèle de script latin |
Ilonggo | Hiligaïnon | hil | Latn | Modèle de script latin |
Jaku Iban | Iban | iba | Latn | Modèle de script latin |
Asụsụ Igbo | Igbo | ig | Latn | Modèle de script latin |
Ilokano | Ilocano | ilo | Latn | Modèle de script latin |
Taqbaylit | Kabyle | kab | Latn | Modèle de script latin |
Jingpho | Kachin | kac | Latn | Modèle de script latin |
Kalaallisut | Kalaallisut | kl | Latn | Modèle de script latin |
Kikamba | Kamba | kam | Latn | Modèle de script latin |
Kanuri | Kanuri | kr | Latn | Modèle de script latin |
Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى | Karakalpaks | kaa | Cyrl/Latn | Modèle de script cyrillique |
Ka Ktien Khasi | Khasi | kha | Latn | Modèle de script latin |
Gĩkũyũ | Kikuyu | ki | Latn | Modèle de script latin |
Kinyarwanda | Kinyarwanda | rw | Latn | Modèle de script latin |
коми кыв | Komi | kv | Cyrl | Modèle de script cyrillique |
Kikongo | Kongo | kg | Latn | Modèle de script latin |
Kosraean | Kosrae | kos | Latn | Modèle de script latin |
Oshikwanyama | Kuanyama | kj | Latn | Modèle de script latin |
Ngala | Lingala | ln | Latn | Modèle de script latin |
Plattdütsch, Plattdeutsch, Nedersaksisch | Bas allemand | nds | Latn | Modèle de script latin |
siLozi | lozi | loz | Latn | Modèle de script latin |
Kiluba | Luba-katanga | lu | Latn | Modèle de script latin |
Dholuo | Luo | luo | Latn | Modèle de script latin |
Madhura, Basa Mathura, بَهاسَ مَدورا | Madurais | mad | Latn | Modèle de script latin |
Malagasy | Malgache | mg | Latn | Modèle de script latin |
Mandinka, لغة مندنكا | Mandingue | man | Latn | Modèle de script latin |
Gaelg, Gailck | Manx | gv | Latn | Modèle de script latin |
Te reo Māori | Maori | mi | Latn | Modèle de script latin |
Ebon | Marshallais | mh | Latn | Modèle de script latin |
Mɛnde yia | Mendé | men | Latn | Modèle de script latin |
Middle English | Moyen anglais | enm | Latn | Modèle de script latin |
Mittelhochdeutsch | Moyen haut-allemand | gmh | Latn | Modèle de script latin |
Baso Minangkabau, باسو مينڠكاباو | Minangkabau | min | Latn | Modèle de script latin |
Kanienʼkéha | Mohawk | moh | Latn | Modèle de script latin |
Nkundu | Mongo | lol | Latn | Modèle de script latin |
Nāhuatl | Nahuatl | nah | Latn | Modèle de script latin |
Diné bizaad | Navajo | nv | Latn | Modèle de script latin |
Ndonga | Ndonga | ng | Latn | Modèle de script latin |
ko e vagahau Niuē | Niuéen | niu | Latn | Modèle de script latin |
Zimbabwe Ndebele | Ndébélé du Nord | nd | Latn | Modèle de script latin |
Sesotho sa Leboa | Sotho du Nord | nso | Latn | Modèle de script latin |
Chichewa, Chinyanja | Chichewa | ny | Latn | Modèle de script latin |
Runyankore | nyankolé | nyn | Latn | Modèle de script latin |
Chitonga | Nyasa Tonga | tog | Latn | Modèle de script latin |
Appolo | Nzema | nzi | Latn | Modèle de script latin |
Occitan, lenga d'òc, provençal | Occitan | oc | Latn | Modèle de script latin |
Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ | Ojibwa | oj | Latn | Modèle de script latin |
Ænglisc, Englisc, Anglisc | Vieil anglais | ang | Latn | Modèle de script latin |
Franceis, François, Romanz | Ancien français | fro | Latn | Modèle de script latin |
Diutisk, Althochdeutsch | Vieux haut-allemand | goh | Latn | Modèle de script latin |
Dǫnsk tunga | Vieux norrois | non | Latn | Modèle de script latin |
Occitan ancian | Provençal ancien | pro | Latn | Modèle de script latin |
ирон ӕвзаг | Ossète | os | Cyrl | Modèle de script cyrillique |
Kapampangan | Pampanga | pam | Latn | Modèle de script latin |
Salitan Pangasinan | Pangasinan | pag | Latn | Modèle de script latin |
Papiamentu | Papiamento | pap | Latn | Modèle de script latin |
Português (Portugal) | Portugais | pt-PT | Latn; European | Modèle de script latin |
Kechua / Runa Simi | Quechua | qu | Latn | Modèle de script latin |
Rumantsch | Romanche | rm | Latn | Modèle de script latin |
Romani čhib | Romani | rom | Latn | Modèle de script latin |
Ikirundi | Rundi | rn | Latn | Modèle de script latin |
Sakha | Sakha | sah | Cyrl | Modèle de script cyrillique |
Gagana faʻa Sāmoa | Samoan | sm | Latn | Modèle de script latin |
yângâ tî sängö | Sango | sg | Latn | Modèle de script latin |
(Braid) Scots, Lallans, Doric | Écossais | sco | Latn | Modèle de script latin |
Gàidhlig | Gaélique écossais | gd | Latn | Modèle de script latin |
chiShona | Shona | sn | Latn | Modèle de script latin |
Songhay | Songhaï | son | Latn | Modèle de script latin |
Sesotho | sesotho | st | Latn | Modèle de script latin |
Español (Latinoamérica) | Espagnol | es-419 | Latn; Latin American | Modèle de script latin |
ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda | Soundanais | su | Latn | Modèle de script latin |
siSwati | Swati | ss | Latn | Modèle de script latin |
Reo Tahiti | Tahitien | ty | Latn | Modèle de script latin |
тоҷикӣ | Tadjik | tg | Cyrl | Modèle de script cyrillique |
татар теле | Tatar | tt | Cyrl/Latn | Modèle de script cyrillique |
KʌThemnɛ | Temne | tem | Latn | Modèle de script latin |
lea faka-Tonga | Tongien | to | Latn | Modèle de script latin |
Xitsonga | Tsonga | ts | Latn | Modèle de script latin |
Setswana | Tswana | tn | Latn | Modèle de script latin |
Türkmençe | Turkmène | tk | Latn | Modèle de script cyrillique |
удмурт кыл | Oudmourte | udm | Cyrl | Modèle de script cyrillique |
Tshivenḓa | Venda | ve | Latn | Modèle de script latin |
Vod | Vote | vot | Cyrl/Latn | Modèle de script cyrillique |
Frysk | Frison occidental | fy | Latn | Modèle de script latin |
Wolof | Wolof | wo | Latn | Modèle de script latin |
isiXhosa | Xhosa | xh | Latn | Modèle de script latin |
Èdè Yorùbá | Yoruba | yo | Latn | Modèle de script latin |
Diidxazá | Zapotèque | zap | Latn | Modèle de script latin |
Scripts d'écriture manuscrite
Les scripts suivants sont compatibles avec la reconnaissance de l'écriture manuscrite. Consultez les tableaux de langues ci-dessus pour connaître les langues utilisant chaque script.
Tag du script | Nom | Niveau d'assistance |
---|---|---|
Beng | Bengalî | Expérimentation |
Cyrl | Cyrillique | Expérimentation |
Deva | Dévanâgarî | Expérimentation |
Grek | Grec | Expérimentation |
Hani | Chinois | Expérimentation |
Jpan | Japonais | Compatible |
Kore | Coréen | Compatible |
Latn | Latin | Compatible |
vi | Vietnamien | Test |