Supporto delle lingue per OCR

La funzionalità di riconoscimento del testo dell'API Cloud Vision è in grado di rilevare un'ampia gamma di lingue e più lingue all'interno di un'unica immagine.

Fornire un suggerimento sulla lingua al servizio non è obbligatorio, ma può essere fatto se il servizio ha difficoltà a rilevare la lingua utilizzata nell'immagine.

Con il rilascio delle immagini OCR per la scrittura a mano libera, le immagini con scrittura a mano libera non richiedono più un flag languageHints per la scrittura a mano libera quando si utilizza DOCUMENT_TEXT_DETECTION.

I suggerimenti facoltativi per la lingua vengono specificati all'interno di ImageContext di una richiesta come elenco di languageHints per una richiesta TEXT_DETECTION e DOCUMENT_TEXT_DETECTION.

Ogni parametro del codice lingua è costituito in genere da un identificatore BCP-47. Questo parametro può essere di forma lingua-regione, dove lingua fa riferimento alla lingua principale e regione facoltativo fa riferimento a una regione (di solito un identificativo di un paese) di un determinato dialetto. Ad esempio, il cinese può essere rappresentato come cinese semplificato come scritto nella Repubblica popolare cinese (zh-Hans) o cinese tradizionale come scritto a Taiwan (zh-Hant).

La funzionalità di riconoscimento del testo supporta tre livelli di lingue:

  1. Le lingue supportate sono quelle a cui diamo la priorità e rispetto alle quali valutiamo regolarmente il rendimento.
  2. Le lingue sperimentali sono quelle in fase di sviluppo attivo, ma non valutate regolarmente.
  3. Le lingue associate sono quelle supportate tramite l'associazione a un altro codice lingua o a un riconoscitore di caratteri generale. Ad esempio, "en-GB" è supportato, ma non viene trattato in modo diverso da "en" ai fini del riconoscimento del testo. Facciamo del nostro meglio per restituire il codice lingua mappato corretto nel campo della lingua dell'entità, ma le lingue mappate hanno maggiori probabilità di essere identificate erroneamente come lingue simili rispetto alle lingue supportate completamente o sperimentalmente.

Di seguito è riportato l'elenco delle lingue (con i codici languageHint associati) supportate da TEXT_DETECTION e DOCUMENT_TEXT_DETECTION.

Se il suggerimento di lingua viene lasciato vuoto, tenteremo di rilevare automaticamente la lingua più appropriata. L'endpoint TEXT_DETECTION rileverà automaticamente solo un sottoinsieme delle lingue supportate, mentre l'endpoint DOCUMENT_TEXT_DETECTION rileverà automaticamente l'intero insieme di lingue supportate.

Lingue supportate

Le seguenti lingue hanno la priorità e vengono valutate regolarmente.

Per filtrare in base alle funzionalità, al tipo o selezionare direttamente la lingua che ti interessa dal menu a discesa:

Lingua Lingua (nome in inglese) Codice languageHints Script Note
Afrikaans Afrikaans af Latn
shqip Albanese sq Latn
العربية Arabo ar Arab Standard moderno
Հայ Armeno hy Armn
беларуская Bielorusso be Cyrl
বাংলা Bengali bn Beng
български Bulgaro bg Cyrl
Català Catalano ca Latn
普通话 Cinese zh Hans/Hant
Hrvatski Croato hr Latn
Čeština Ceco cs Latn
Dansk Danese da Latn
Nederlands Olandese nl Latn
English Inglese en Latn Americano
Eesti keel Estone et Latn
Filipino Filippino fil Latn
Suomi Finlandese fi Latn
Français Francese fr Latn Europei
Deutsch Tedesco de Latn
Ελληνικά Greco el Grek
ગુજરાતી Gujarati gu Gujr
עברית Ebraico iw Hebr
हिन्दी Hindi hi Deva
Magyar Ungherese hu Latn
Íslenska Islandese is Latn
Bahasa Indonesia Indonesiano id Latn
Italiano Italiano it Latn
日本語 Giapponese ja Jpan
ಕನ್ನಡ Kannada kn Knda
ភាសាខ្មែរ Khmer km Khmr
한국어 Coreano ko Kore
ລາວ Lao lo Laoo
Latviešu Lettone lv Latn
Lietuvių Lituano lt Latn
Македонски Macedone mk Cyrl
Bahasa Melayu Malese ms Latn
മലയാളം Malayalam ml Mlym
मराठी Marathi mr Deva
नेपाली Nepalese ne Deva
Norsk Norvegese no Latn Bokmål
فارسی Persiano fa Arab
Polski Polacco pl Latn
Português Portoghese pt Latn Brasiliano
ਪੰਜਾਬੀ Punjabi pa Guru Gurmukhi
Română Rumeno ro Latn
Русский Russo ru Cyrl
Русский (старая орфография) Russo ru-PETR1708 Cyrl Ortografia antica
Српски Serbo sr Cyrl
Српски (латиница) Serbo sr-Latn Latn
Slovenčina Slovacco sk Latn
Slovenščina Sloveno sl Latn
Español Spagnolo es Latn Europei
Svenska Svedese sv Latn
Tagalog Tagalog tl Latn
தமிழ் Tamil ta Taml
తెలుగు Telugu te Telu
ไทย Thailandese th Thai
Türkçe Turco tr Latn
Українська Ucraino uk Cyrl
Tiếng Việt Vietnamita vi Latn
Yiddish Yiddish yi Hebr

Lingue sperimentali

Le seguenti lingue sono in fase di sviluppo attivo e non sono ancora oggetto di valutazioni regolari.

Lingua Lingua (nome in inglese) Codice languageHints Script Note
አማርኛ Amarico am Ethi
Αρχαία ελληνικά Greco antico grc Grek
অসমীয়া Assamese as Beng
Azərbaycan Azero az Latn
Azərbaycan (qədim yazı) Azero az-Cyrl Cyrl Ortografia antica
Euskara Basco eu Latn
Bosanski Bosniaco bs Latn
မြန်မာ Birmano my Mymr
Cebuano Cebuano ceb Latn
ᏣᎳᎩ ᎦᏬᏂᎯᏍᏗ Cherokee chr Cher
dhivehi, dhivehi-bas Dhivehi dv Thaa
རྫོང་ཁ Dzongkha dz Tibt
Esperanto Esperanto eo Latn
Galego Galiziano gl Latn
ქართული Georgiano ka Geor
Kreyòl Ayisyen Creolo haitiano ht Latn
Gaeilge Irlandese ga Latn
Jawa Giavanese jv Latn
Қазақ Kazako kk Cyrl
Kirghiz Kirghiso ky Cyrl
Latine Latino la Latn
Malti Maltese mt Latn
Монгол Mongolo mn Cyrl
ଓଡ଼ିଆ Oriya or Orya
پښتو Pashto ps Arab
संस्कृतम् Sanscrito sa Deva
සිංහල Singalese si Sinh
Swahili Swahili sw Latn
leššānā Suryāyā Siriaco syr Syriac
བོད་སྐད་ Tibetano bo Tibt
ትግርኛ Tigrino ti Ethi
اردو Urdu ur Arab
oʻzbekcha Uzbeco uz Latn Latino
oʻzbekcha Uzbeco uz-Cyrl Cyrl Ortografia antica
Cymraeg Gallese cy Latn
IsiZulu Zulu zu Latn

Lingue mappate

Le seguenti lingue sono mappate a un altro codice lingua o a un riconoscitore di caratteri generale.

Lingua Lingua (nome in inglese) Codice languageHints Script Note
بهسا اچيه Acehnese ace Latn Modello latino
Lwo Acholi ach Latn Modello latino
Dangme Adangme ada Latn Modello latino
Akan Akan ak Latn Modello latino
Anicinâbemowin Algonquin alg Latn Modello latino
Mapudungu Araucano/Mapuche arn Latn Modello latino
Asturianu Asturiano ast Latn Modello latino
Dene Athabaskan ath Latn Modello latino
Aymar aru Aymara ay Latn Modello latino
Bhāṣa Bali Balinese ban Latn Modello latino
Bamanankan Bambara bm Latn Modello latino
Narrow Bantu Bantu bnt Latn Modello latino
башҡорт теле Bashkir ba Cyrl Modello cirillico
Toba–Batak Batak btk Latn Modello latino
Chibemba Bemba bem Latn Modello latino
Bikol Naga Bikol bik Latn Modello latino
Bichelamar Bislama bi Latn Modello latino
Brezhoneg Bretone br Latn Modello latino
нохчийн мотт / noxçiyn mott Ceceno ce Cyrl Modello cirillico
汉语 Cinese (mandarino, semplificato) zh-Hans Hans Modello cinese
漢語 Cinese (mandarino, tradizionale) zh-Hant Hant Modello cinese
普通話 Cinese (mandarino, Hong Kong) zh-Hant-HK Hant Modello cinese
Chahta' Choctaw cho Latn Modello latino
Чӑвашла Chuvash cv Cyrl Modello cirillico
Cree–Montagnais–Naskapi Cree cr Latn Modello latino
Mvskoke Creek mus Latn Modello latino
qırımtatar tili, къырымтатар тили Tataro di Crimea crh Latn Modello cirillico
Dakhótiyapi, Dakȟótiyapi Dakota dak Latn Modello latino
Douala Duala dua Latn Modello latino
Ikɔ Efik Efik efi Latn Modello latino
English (British) Inglese (britannico) en-GB Latn Modello latino
Èʋegbe Ewe ee Latn Modello latino
føroyskt mál Faroese fo Latn Modello latino
Na Vosa Vakaviti Figiano fj Latn Modello latino
fɔ̀ngbè Fon fon Latn Modello latino
Français canadien Francese (Canada) fr-CA Latn Modello latino
Fulani, Fulah, Peul Fulah ff Latn Modello latino
Ga gaa Latn Modello latino
Luganda ganda lg Latn Modello latino
Basa Gayo Gayo gay Latn Modello latino
Kiribati Gilbertese gil Latn Modello latino
Gothic Gotico got Latn Modello latino
Guaraní Guarani gn Latn Modello latino
Harshen/Halshen Hausa هَرْشَن هَوْسَ Hausa ha Latn Modello latino
ʻŌlelo Hawaiʻi Hawaiano haw Latn Modello latino
Otjiherero Herero hz Latn Modello latino
Ilonggo Hiligaynon hil Latn Modello latino
Jaku Iban Iban iba Latn Modello latino
Asụsụ Igbo Igbo ig Latn Modello latino
Ilokano Iloko ilo Latn Modello latino
Taqbaylit Kabyle kab Latn Modello latino
Jingpho Kachin kac Latn Modello latino
Kalaallisut Kalaallisut kl Latn Modello latino
Kikamba Kamba kam Latn Modello latino
Kanuri Kanuri kr Latn Modello latino
Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى Karakalpaka kaa Cyrl/Latn Modello cirillico
Ka Ktien Khasi Khasi kha Latn Modello latino
Gĩkũyũ Kikuyu ki Latn Modello latino
Kinyarwanda Kinyarwanda rw Latn Modello latino
коми кыв Komi kv Cyrl Modello cirillico
Kikongo Kongo kg Latn Modello latino
Kosraean Kosraeano kos Latn Modello latino
Oshikwanyama Kuanyama kj Latn Modello latino
Ngala Lingala ln Latn Modello latino
Plattdütsch, Plattdeutsch, Nedersaksisch Basso tedesco nds Latn Modello latino
siLozi lozi loz Latn Modello latino
Kiluba Luba-Katanga lu Latn Modello latino
Dholuo Luo luo Latn Modello latino
Madhura, Basa Mathura, بَهاسَ مَدورا Madurese mad Latn Modello latino
Malagasy Malgascio mg Latn Modello latino
Mandinka, لغة مندنكا Mandingo man Latn Modello latino
Gaelg, Gailck Manx gv Latn Modello latino
Te reo Māori Maori mi Latn Modello latino
Ebon Marshallese mh Latn Modello latino
Mɛnde yia Mende men Latn Modello latino
Middle English Inglese medio enm Latn Modello latino
Mittelhochdeutsch Tedesco medio alto gmh Latn Modello latino
Baso Minangkabau, باسو مينڠكاباو Minangkabau min Latn Modello latino
Kanienʼkéha Mohawk moh Latn Modello latino
Nkundu Mongo lol Latn Modello latino
Nāhuatl Nahuatl nah Latn Modello latino
Diné bizaad Navajo nv Latn Modello latino
Ndonga Ndonga ng Latn Modello latino
ko e vagahau Niuē Niueano niu Latn Modello latino
Zimbabwe Ndebele Ndebele del nord nd Latn Modello latino
Sesotho sa Leboa Sotho del nord nso Latn Modello latino
Chichewa, Chinyanja Nyanja ny Latn Modello latino
Runyankore nyankole nyn Latn Modello latino
Chitonga Nyasa Tonga tog Latn Modello latino
Appolo Nzima nzi Latn Modello latino
Occitan, lenga d'òc, provençal Occitano oc Latn Modello latino
Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ Ojibwe oj Latn Modello latino
Ænglisc, Englisc, Anglisc Inglese antico ang Latn Modello latino
Franceis, François, Romanz Francese antico fro Latn Modello latino
Diutisk, Althochdeutsch Tedesco antico goh Latn Modello latino
Dǫnsk tunga Islandese antico non Latn Modello latino
Occitan ancian Provenzale antico pro Latn Modello latino
ирон ӕвзаг Ossetic os Cyrl Modello cirillico
Kapampangan Pampanga pam Latn Modello latino
Salitan Pangasinan Pangasinan pag Latn Modello latino
Papiamentu Papiamento pap Latn Modello latino
Português (Portugal) Portoghese (Europa) pt-PT Latn Modello latino
Kechua / Runa Simi Quechua qu Latn Modello latino
Rumantsch Romancio rm Latn Modello latino
Romani čhib Rom rom Latn Modello latino
Ikirundi Rundi rn Latn Modello latino
Sakha Sakha sah Cyrl Modello cirillico
Gagana faʻa Sāmoa Samoano sm Latn Modello latino
yângâ tî sängö Sango sg Latn Modello latino
(Braid) Scots, Lallans, Doric Scozzese sco Latn Modello latino
Gàidhlig Gaelico scozzese gd Latn Modello latino
chiShona Shona sn Latn Modello latino
Songhay Impero Songhai son Latn Modello latino
Sesotho Sotho del sud st Latn Modello latino
Español (Latinoamérica) Spagnolo (America Latina) es-419 Latn Modello latino
ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda Sundanese su Latn Modello latino
siSwati Swati ss Latn Modello latino
Reo Tahiti Tahitiano ty Latn Modello latino
тоҷикӣ Tagico tg Cyrl Modello cirillico
татар теле Tataro tt Cyrl/Latn Modello cirillico
KʌThemnɛ Temne tem Latn Modello latino
lea faka-Tonga Tongano to Latn Modello latino
Xitsonga Tsonga ts Latn Modello latino
Setswana Tswana tn Latn Modello latino
Türkmençe Turkmeno tk Latn Modello cirillico
удмурт кыл Udmurto udm Cyrl Modello cirillico
Tshivenḓa Venda ve Latn Modello latino
Vod Votic vot Cyrl/Latn Modello cirillico
Frysk Frisone occidentale fy Latn Modello latino
Wolof Wolof wo Latn Modello latino
isiXhosa Xhosa xh Latn Modello latino
Èdè Yorùbá Yoruba yo Latn Modello latino
Diidxazá Zapotec zap Latn Modello latino

Script di scrittura a mano libera

I seguenti script sono supportati per il riconoscimento della scrittura a mano libera. Consulta le tabelle delle lingue sopra per trovare le lingue che utilizzano ciascun script.

Script Nome Livello di assistenza
Beng Bengali Sperimentale
Cyrl Cirillico Sperimentale
Deva Devanagari Sperimentale
Grek Greco Sperimentale
Hani Cinese Sperimentale
Jpan Giapponese Supportato
Kore Coreano Supportato
Latn Latino Supportato
vi Vietnamita Sperimentale