La fonctionnalité de reconnaissance de texte de l'API Cloud Vision peut détecter une grande variété de langues, et plusieurs langues au sein d'une même image.
Il n'est pas nécessaire de fournir un indicateur de langue au service, mais vous pouvez le faire si ce dernier ne parvient pas à détecter la langue utilisée dans votre image.
Avec le lancement de l'écriture manuscrite (OCR) en phase de disponibilité générale, il n'est pas nécessaire de définir l'option languageHints
pour les images en cas d'utilisation de DOCUMENT_TEXT_DETECTION
.
Les indicateurs de langue facultatifs sont spécifiés dans le champ ImageContext d'une requête en tant que liste de languageHints
pour les requêtes TEXT_DETECTION
et DOCUMENT_TEXT_DETECTION
.
Chaque paramètre de code de langue se compose d'un identifiant BCP 47. Ce paramètre peut se présenter sous la forme langue-région, langue faisant référence à la langue principale et région (facultatif) renvoyant à la zone géographique (généralement désignée par l'identificateur d'un pays) où est parlé le dialecte en question. Par exemple, le chinois peut être représenté par le chinois simplifié tel qu'il est écrit en République populaire de Chine (zh-Hans
) ou en chinois traditionnel tel qu'il est écrit à Taïwan (zh-Hant
).
La fonctionnalité de reconnaissance de texte prend en charge trois niveaux :
- Les langues acceptées sont celles que nous priorisons et évaluons régulièrement par rapport aux performances.
- Les langues expérimentales sont celles qui sont en phase de développement actif, mais pas évaluées régulièrement.
- Les langues mappées sont celles qui sont compatibles avec un autre code de langue ou un outil de reconnaissance de caractères général. Par exemple, la langue "
en-GB
" est acceptée, mais n'est pas traitée différemment de "en
" dans le cadre de la reconnaissance de texte. Nous nous efforçons de renvoyer le code de langue mappé correct dans le champ des paramètres régionaux d'entité, mais les langues mappées sont davantage susceptibles d'être prises pour une langue similaire que les langues entièrement ou expérimentalement acceptées.
La liste des langues (avec les codes languageHint
associés) acceptées par TEXT_DETECTION
et DOCUMENT_TEXT_DETECTION
est indiquée ci-dessous.
Si l'indicateur de langue n'est pas renseigné, nous essaierons de détecter automatiquement la langue la plus appropriée. Le point de terminaison TEXT_DETECTION
détecte automatiquement un sous-ensemble de langues acceptées, tandis que le point de terminaison DOCUMENT_TEXT_DETECTION
détecte automatiquement l'ensemble des langues acceptées.
Langues acceptées
Les langues suivantes sont classées par ordre de priorité et régulièrement évaluées.
Pour filtrer par fonctionnalité, saisissez ou sélectionnez directement la langue souhaitée dans le menu déroulant :
Language | Language (English name) | languageHints code | Script / notes |
---|---|---|---|
Afrikaans | Afrikaans | af | Latn |
shqip | Albanian | sq | Latn |
العربية | Arabic | ar | Arab; Modern Standard |
Հայ | Armenian | hy | Armn |
беларускі | Belorussian | be | Cyrl |
বাংলা | Bengali | bn | Beng |
български | Bulgarian | bg | Cyrl |
Català | Catalan | ca | Latn |
普通话 | Chinese | zh | Hans/Hant |
Hrvatski | Croatian | hr | Latn |
Čeština | Czech | cs | Latn |
Dansk | Danish | da | Latn |
Nederlands | Dutch | nl | Latn |
English | English | en | Latn; American |
Eesti keel | Estonian | et | Latn |
Filipino | Filipino | fil (or tl) | Latn |
Suomi | Finnish | fi | Latn |
Français | French | fr | Latn; European |
Deutsch | German | de | Latn |
Ελληνικά | Greek | el | Grek |
ગુજરાતી | Gujarati | gu | Gujr |
עברית | Hebrew | iw | Hebr |
हिन्दी | Hindi | hi | Deva |
Magyar | Hungarian | hu | Latn |
Íslenska | Icelandic | is | Latn |
Bahasa Indonesia | Indonesian | id | Latn |
Italiano | Italian | it | Latn |
日本語 | Japanese | ja | Jpan |
ಕನ್ನಡ | Kannada | kn | Knda |
ភាសាខ្មែរ | Khmer | km | Khmr |
한국어 | Korean | ko | Kore |
ລາວ | Lao | lo | Laoo |
Latviešu | Latvian | lv | Latn |
Lietuvių | Lithuanian | lt | Latn |
Македонски | Macedonian | mk | Cyrl |
Bahasa Melayu | Malay | ms | Latn |
മലയാളം | Malayalam | ml | Mlym |
मराठी | Marathi | mr | Deva |
नेपाली | Nepali | ne | Deva |
Norsk | Norwegian | no | Latn; Bokmål |
فارسی | Persian | fa | Arab |
Polski | Polish | pl | Latn |
Português | Portuguese | pt | Latn; Brazilian |
ਪੰਜਾਬੀ | Punjabi | pa | Guru; Gurmukhi |
Română | Romanian | ro | Latn |
Русский | Russian | ru | Cyrl |
Русский (старая орфография) | Russian | ru-PETR1708 | Cyrl; Old Orthography |
Српски | Serbian | sr | Cyrl & Latn |
Српски (латиница) | Serbian | sr-Latn | Latn |
Slovenčina | Slovak | sk | Latn |
Slovenščina | Slovenian | sl | Latn |
Español | Spanish | es | Latn; European |
Svenska | Swedish | sv | Latn |
தமிழ் | Tamil | ta | Taml |
తెలుగు | Telugu | te | Telu |
ไทย | Thai | th | Thai |
Türkçe | Turkish | tr | Latn |
Українська | Ukrainian | uk | Cyrl |
Tiếng Việt | Vietnamese | vi | Latn |
Yiddish | Yiddish | yi | Hebr |
Langues expérimentales
Les langues suivantes sont en phase de développement actif et n'ont pas encore été évaluées régulièrement.
Language | Language (English name) | languageHints code |
Script / notes |
---|---|---|---|
አማርኛ | Amharic | am | Ethi |
Αρχαία ελληνικά | Ancient Greek | grc | Grek |
অসমীয়া | Assamese | as | Beng |
Azərbaycan | Azerbaijani | az | Latn |
Azərbaycan (qədim yazı) | Azerbaijani | az-Cyrl | Cyrl; old orthography |
Euskara | Basque | eu | Latn |
Bosanski | Bosnian | bs | Latn |
မြန်မာ | Burmese | my | Mymr |
Cebuano | Cebuano | ceb | Latn |
ᏣᎳᎩ ᎦᏬᏂᎯᏍᏗ | Cherokee | chr | Cher |
dhivehi, dhivehi-bas | Dhivehi | dv | Thaa |
རྫོང་ཁ | Dzonkha | dz | Tibt |
Esperanto | Esperanto | eo | Latn |
Galego | Galician | gl | Latn |
ქართული | Georgian | ka | Geor |
Kreyòl Ayisyen | Haitian Creole | ht | Latn |
Gaeilge | Irish | ga | Latn |
Jawa | Javanese | jv | Latn |
Қазақ | Kazakh | kk | Cyrl |
Kirghiz | Kirghiz | ky | Cyrl |
Latine | Latin | la | Latn |
Malti | Maltese | mt | Latn |
Монгол | Mongolian | mn | Cyrl |
ଓଡ଼ିଆ | Oriya | or | Orya |
پښتو | Pashto | ps | Arab |
संस्कृतम् | Sanskrit | sa | Deva |
සිංහල | Sinhala | si | Sinh |
Swahili | Swahili | sw | Latn |
leššānā Suryāyā | Syriac | syr | Syriac |
བོད་སྐད་ | Tibetan | bo | Tibt |
ትግርኛ | Tigirinya | ti | Ethi |
اردو | Urdu | ur | Arab |
oʻzbekcha | Uzbek | uz | Latn; Latin |
oʻzbekcha | Uzbek | uz-Cyrl | Cyrl; old orthography |
Cymraeg | Welsh | cy | Latn |
IsiZulu | Zulu | zu | Latn |
Langues mappées
Les langues suivantes sont mappées à un autre code de langue ou mappées à un outil de reconnaissance de caractères général.
Language | Language (English name) | languageHints code | Script / notes | Mapped to |
---|---|---|---|---|
بهسا اچيه | Acehnese | ace | Latn | Latin script model |
Lwo | Acholi | ach | Latn | Latin script model |
Dangme | Adangme | ada | Latn | Latin script model |
Akan | Akan | ak | Latn | Latin script model |
Anicinâbemowin | Algonquinian | alg | Latn | Latin script model |
Mapudungu | Araucanian/Mapuche | arn | Latn | Latin script model |
Asturianu | Asturian | ast | Latn | Latin script model |
Dene | Athabaskan | ath | Latn | Latin script model |
Aymar aru | Aymara | ay | Latn | Latin script model |
Bhāṣa Bali | Balinese | ban | Latn | Latin script model |
Bamanankan | Bambara | bm | Latn | Latin script model |
Narrow Bantu | Bantu | bnt | Latn | Latin script model |
башҡорт теле | Bashkir | ba | Cyrl | Cyrillic script model |
Toba–Batak | Batak | btk | Latn | Latin script model |
Chibemba | Bemba | bem | Latn | Latin script model |
Bikol Naga | Bikol | bik | Latn | Latin script model |
Bichelamar | Bislama | bi | Latn | Latin script model |
Brezhoneg | Breton | br | Latn | Latin script model |
нохчийн мотт / noxçiyn mott | Chechen | ce | Cyrl | Cyrillic script model |
汉语 | Chinese | zh-Hans | Hans; Simplified; Mandarin | zh |
漢語 | Chinese | zh-Hant | Hant; Traditional; Mandarin | zh |
普通話 | Chinese | zh-Hant-HK | Hant; Mandarin; Hong Kong | zh |
Chahta' | Choctaw | cho | Latn | Latin script model |
Чӑвашла | Chuvash | cv | Cyrl | Cyrillic script model |
Cree–Montagnais–Naskapi | Cree | cr | Latn | Latin script model |
Mvskoke | Creek | mus | Latn | Latin script model |
qırımtatar tili, къырымтатар тили | Crimean Tatar | crh | Latn | Cyrillic script model |
Dakhótiyapi, Dakȟótiyapi | Dakota | dak | Latn | Latin script model |
Douala | Duala | dua | Latn | Latin script model |
Ikɔ Efik | Efik | efi | Latn | Latin script model |
English (British) | English | en-GB | Latn; British | en |
Èʋegbe | Ewe | ee | Latn | Latin script model |
føroyskt mál | Faroese | fo | Latn | Latin script model |
Na Vosa Vakaviti | Fijian | fj | Latn | Latin script model |
fɔ̀ngbè | Fon | fon | Latn | Latin script model |
Français canadien | French | fr-CA | Latn; Canadian | fr |
Fulani, Fulah, Peul | Fulah | ff | Latn | Latin script model |
Gã | Ga | gaa | Latn | Latin script model |
Luganda | Ganda | lg | Latn | Latin script model |
Basa Gayo | Gayo | gay | Latn | Latin script model |
Kiribati | Gilbertese | gil | Latn | Latin script model |
Gothic | Gothic | got | Latn | Latin script model |
Guaraní | Guarani | gn | Latn | Latin script model |
Harshen/Halshen Hausa هَرْشَن هَوْسَ | Hausa | ha | Latn | Latin script model |
ʻŌlelo Hawaiʻi | Hawaiian | haw | Latn | Latin script model |
Otjiherero | Herero | hz | Latn | Latin script model |
Ilonggo | Hiligaynon | hil | Latn | Latin script model |
Jaku Iban | Iban | iba | Latn | Latin script model |
Asụsụ Igbo | Igbo | ig | Latn | Latin script model |
Ilokano | Iloko | ilo | Latn | Latin script model |
Taqbaylit | Kabyle | kab | Latn | Latin script model |
Jingpho | Kachin | kac | Latn | Latin script model |
Kalaallisut | Kalaallisut | kl | Latn | Latin script model |
Kikamba | Kamba | kam | Latn | Latin script model |
Kanuri | Kanuri | kr | Latn | Latin script model |
Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى | Kara-Kalpak | kaa | Cyrl/Latn | Cyrillic script model |
Ka Ktien Khasi | Khasi | kha | Latn | Latin script model |
Gĩkũyũ | Kikuyu | ki | Latn | Latin script model |
Kinyarwanda | Kinyarwanda | rw | Latn | Latin script model |
коми кыв | Komi | kv | Cyrl | Cyrillic script model |
Kikongo | Kongo | kg | Latn | Latin script model |
Kosraean | Kosraean | kos | Latn | Latin script model |
Oshikwanyama | Kuanyama | kj | Latn | Latin script model |
Ngala | Lingala | ln | Latn | Latin script model |
Plattdütsch, Plattdeutsch, Nedersaksisch | Low German | nds | Latn | Latin script model |
siLozi | Lozi | loz | Latn | Latin script model |
Kiluba | Luba-Katanga | lu | Latn | Latin script model |
Dholuo | Luo | luo | Latn | Latin script model |
Madhura, Basa Mathura, بَهاسَ مَدورا | Madurese | mad | Latn | Latin script model |
Malagasy | Malagasy | mg | Latn | Latin script model |
Mandinka, لغة مندنكا | Mandingo | man | Latn | Latin script model |
Gaelg, Gailck | Manx | gv | Latn | Latin script model |
Te reo Māori | Maori | mi | Latn | Latin script model |
Ebon | Marshallese | mh | Latn | Latin script model |
Mɛnde yia | Mende | men | Latn | Latin script model |
Middle English | Middle English | enm | Latn | Latin script model |
Mittelhochdeutsch | Middle High German | gmh | Latn | Latin script model |
Baso Minangkabau, باسو مينڠكاباو | Minangkabau | min | Latn | Latin script model |
Kanienʼkéha | Mohawk | moh | Latn | Latin script model |
Nkundu | Mongo | lol | Latn | Latin script model |
Nāhuatl | Nahuatl | nah | Latn | Latin script model |
Diné bizaad | Navajo | nv | Latn | Latin script model |
Ndonga | Ndonga | ng | Latn | Latin script model |
ko e vagahau Niuē | Niuean | niu | Latn | Latin script model |
Zimbabwe Ndebele | North Ndebele | nd | Latn | Latin script model |
Sesotho sa Leboa | Northern Sotho | nso | Latn | Latin script model |
Chichewa, Chinyanja | Nyanja | ny | Latn | Latin script model |
Runyankore | Nyankole | nyn | Latn | Latin script model |
Chitonga | Nyasa Tonga | tog | Latn | Latin script model |
Appolo | Nzima | nzi | Latn | Latin script model |
Occitan, lenga d'òc, provençal | Occitan | oc | Latn | Latin script model |
Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ | Ojibwa | oj | Latn | Latin script model |
Ænglisc, Englisc, Anglisc | Old English | ang | Latn | Latin script model |
Franceis, François, Romanz | Old French | fro | Latn | Latin script model |
Diutisk, Althochdeutsch | Old High German | goh | Latn | Latin script model |
Dǫnsk tunga | Old Norse | non | Latn | Latin script model |
Occitan ancian | Old Provencal | pro | Latn | Latin script model |
ирон ӕвзаг | Ossetic | os | Cyrl | Cyrillic script model |
Kapampangan | Pampanga | pam | Latn | Latin script model |
Salitan Pangasinan | Pangasinan | pag | Latn | Latin script model |
Papiamentu | Papiamento | pap | Latn | Latin script model |
Português (Portugal) | Portuguese | pt-PT | Latn; European | pt |
Kechua / Runa Simi | Quechua | qu | Latn | Latin script model |
Rumantsch | Romansh | rm | Latn | Latin script model |
Romani čhib | Romany | rom | Latn | Latin script model |
Ikirundi | Rundi | rn | Latn | Latin script model |
Sakha | Sakha | sah | Cyrl | Cyrillic script model |
Gagana faʻa Sāmoa | Samoan | sm | Latn | Latin script model |
yângâ tî sängö | Sango | sg | Latn | Latin script model |
(Braid) Scots, Lallans, Doric | Scots | sco | Latn | Latin script model |
Gàidhlig | Scottish Gaelic | gd | Latn | Latin script model |
chiShona | Shona | sn | Latn | Latin script model |
Songhay | Songhai | son | Latn | Latin script model |
Sesotho | Southern Sotho | st | Latn | Latin script model |
Español (Latinoamérica) | Spanish | es-419 | Latn; Latin American | es |
ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda | Sundanese | su | Latn | Latin script model |
siSwati | Swati | ss | Latn | Latin script model |
Reo Tahiti | Tahitian | ty | Latn | Latin script model |
тоҷикӣ | Tajik | tg | Cyrl | Cyrillic script model |
татар теле | Tatar | tt | Cyrl/Latn | Cyrillic script model |
KʌThemnɛ | Temne | tem | Latn | Latin script model |
lea faka-Tonga | Tongan | to | Latn | Latin script model |
Xitsonga | Tsonga | ts | Latn | Latin script model |
Setswana | Tswana | tn | Latn | Latin script model |
Türkmençe | Turkmen | tk | Latn | Cyrillic script model |
удмурт кыл | Udmurt | udm | Cyrl | Cyrillic script model |
Tshivenḓa | Venda | ve | Latn | Latin script model |
Vod | Votic | vot | Cyrl/Latn | Cyrillic script model |
Frysk | Western Frisian | fy | Latn | Latin script model |
Wolof | Wolof | wo | Latn | Latin script model |
isiXhosa | Xhosa | xh | Latn | Latin script model |
Èdè Yorùbá | Yoruba | yo | Latn | Latin script model |
Diidxazá | Zapotec | zap | Latn | Latin script model |