OCR-Sprachunterstützung

Die Texterkennungsfunktion der Cloud Vision API erkennt eine Vielzahl von Sprachen und kann mehrere Sprachen in einem einzigen Bild erkennen.

Die Angabe eines Sprachhinweises für den Dienst ist nicht erforderlich, aber möglich, falls der Dienst die Sprache in Ihrem Bild nicht erkennt.

Seit der Veröffentlichung des GA-Release Handschrift-Texterkennung (Optical Character Recognition, OCR) müssen Bilder, die Handschrift enthalten, bei der Verwendung von DOCUMENT_TEXT_DETECTION nicht mehr mit einem Flag languageHints für Handschrift versehen werden.

Optionale Sprachhinweise werden bei TEXT_DETECTION- und DOCUMENT_TEXT_DETECTION-Anfragen im ImageContext der Anfrage als Liste von languageHints angegeben.

Jeder Sprachcodeparameter besteht üblicherweise aus einer BCP-47-Kennung. Diese Parameter können in der Form Sprache-Region festgelegt werden. Dabei bezieht sich Sprache auf die Standardsprache und die optionale Angabe für Region auf eine Region (in der Regel eine Länderkennung) mit einem bestimmten Dialekt. Beispiel: Chinesisch kann als Vereinfachtes Chinesisch (zh-Hans) dargestellt werden, wie es in der Volksrepublik China geschrieben wird, oder als Traditionelles Chinesisch in der taiwanischen Schreibweise (zh-Hant).

Die Texterkennungsfunktion bietet drei Ebenen der Sprachunterstützung:

  1. Unterstützte Sprachen sind diejenigen, denen wir Priorität einräumen und bezüglich derer wir regelmäßig Leistungsbewertungen vornehmen.
  2. Experimentelle Sprachen sind Sprachen, die aktiv entwickelt, aber nicht regelmäßig ausgewertet werden.
  3. Zugeordnete Sprachen werden einem anderen Sprachcode oder einem allgemeinen Zeichenerkenner zugeordnet, um sie zu unterstützen. "en-GB" wird beispielsweise unterstützt, bei der Texterkennung jedoch nicht anders behandelt als "en". Wir bemühen uns zwar, den korrekten Code der zugeordneten Sprache im Feld für die Sprache der Entität zurückzugeben, doch kann es bei zugeordneten Sprachen eher als bei vollständig oder experimentell unterstützten Sprachen vorkommen, dass sie als eine ähnliche Sprache und somit falsch identifiziert werden.

Weiter unter finden Sie eine Liste der Sprachen (mit den zugehörigen languageHint-Codes), die von TEXT_DETECTION und DOCUMENT_TEXT_DETECTION unterstützt werden.

Wenn der Sprachhinweis leer gelassen wird, versuchen wir, die am besten passende Sprache automatisch zu erkennen. Der Endpunkt TEXT_DETECTION erkennt nur einen Teil der unterstützten Sprachen automatisch, während der Endpunkt DOCUMENT_TEXT_DETECTION alle unterstützten Sprachen automatisch erkennt.

Unterstützte Sprachen

Die folgenden Sprachen werden priorisiert und regelmäßig ausgewertet.

Wenn Sie nach bestimmten Features filtern möchten, geben Sie die gewünschte Sprache ein oder wählen Sie sie direkt aus dem Drop-down-Menü aus:

Sprache Sprache (deutscher Name) languageHints Code Script Hinweise
Afrikaans Afrikaans af Latn
shqip Albanisch sq Latn
العربية Arabisch ar Arab Moderner Standard
Հայ Armenisch hy Armn
беларуская Belarussisch be Cyrl
বাংলা Bengalisch bn Beng
български Bulgarisch bg Cyrl
Català Katalanisch ca Latn
普通话 Chinesisch zh Hans/Hant
Hrvatski Kroatisch hr Latn
Čeština Tschechisch cs Latn
Dansk Dänisch da Latn
Nederlands Niederländisch nl Latn
English Englisch en Latn Amerikanisch
Eesti keel Estnisch et Latn
Filipino Filipino fil Latn
Suomi Finnisch fi Latn
Français Französisch fr Latn Europäisch
Deutsch Deutsch de Latn
Ελληνικά Griechisch el Grek
ગુજરાતી Gujarati gu Gujr
עברית Hebräisch iw Hebr
हिन्दी Hindi hi Deva
Magyar Ungarisch hu Latn
Íslenska Isländisch is Latn
Bahasa Indonesia Indonesisch id Latn
Italiano Italienisch it Latn
日本語 Japanisch ja Jpan
ಕನ್ನಡ Kannada kn Knda
ភាសាខ្មែរ Khmer km Khmr
한국어 Koreanisch ko Kore
ລາວ Lao lo Laoo
Latviešu Lettisch lv Latn
Lietuvių Litauisch lt Latn
Македонски Mazedonisch mk Cyrl
Bahasa Melayu Malaiisch ms Latn
മലയാളം Malayalam ml Mlym
मराठी Marathi mr Deva
नेपाली Nepali ne Deva
Norsk Norwegisch no Latn Bokmål
فارسی Persisch fa Arab
Polski Polnisch pl Latn
Português Portugiesisch pt Latn Brasilianisch
ਪੰਜਾਬੀ Panjabi pa Guru Gurmukhi
Română Rumänisch ro Latn
Русский Russisch ru Cyrl
Русский (старая орфография) Russisch ru-PETR1708 Cyrl Alte Rechtschreibung
Српски Serbisch sr Cyrl
Српски (латиница) Serbisch sr-Latn Latn
Slovenčina Slowakisch sk Latn
Slovenščina Slowenisch sl Latn
Español Spanisch es Latn Europäisch
Svenska Schwedisch sv Latn
Tagalog Tagalog tl Latn
தமிழ் Tamil ta Taml
తెలుగు Telugu te Telu
ไทย Thai th Thai
Türkçe Türkisch tr Latn
Українська Ukrainisch uk Cyrl
Tiếng Việt Vietnamesisch vi Latn
Yiddish Jiddisch yi Hebr

Experimentelle Sprachen

Die folgenden Sprachen befinden sich in der Entwicklungsphase und werden noch nicht regelmäßig evaluiert.

Sprache Sprache (deutscher Name) languageHints Code Script Hinweise
አማርኛ Amharisch am Ethi
Αρχαία ελληνικά Altgriechisch grc Grek
অসমীয়া Assamesisch as Beng
Azərbaycan Aserbaidschanisch az Latn
Azərbaycan (qədim yazı) Aserbaidschanisch az-Cyrl Cyrl Alte Rechtschreibung
Euskara Baskisch eu Latn
Bosanski Bosnisch bs Latn
မြန်မာ Burmesisch my Mymr
Cebuano Cebuano ceb Latn
ᏣᎳᎩ ᎦᏬᏂᎯᏍᏗ Cherokee chr Cher
dhivehi, dhivehi-bas Dhivehi dv Thaa
རྫོང་ཁ Dzonkha dz Tibt
Esperanto Esperanto eo Latn
Galego Galizisch gl Latn
ქართული Georgisch ka Geor
Kreyòl Ayisyen Kreolisch (Haiti) ht Latn
Gaeilge Irisch ga Latn
Jawa Javanisch jv Latn
Қазақ Kasachisch kk Cyrl
Kirghiz Kirgisisch ky Cyrl
Latine Latein la Latn
Malti Maltesisch mt Latn
Монгол Mongolisch mn Cyrl
ଓଡ଼ିଆ Oriya or Orya
پښتو Paschtunisch ps Arab
संस्कृतम् Sanskrit sa Deva
සිංහල Singhalesisch si Sinh
Swahili Swahili sw Latn
leššānā Suryāyā Syrisch syr Syriac
བོད་སྐད་ Tibetisch bo Tibt
ትግርኛ Tigirinya ti Ethi
اردو Urdu ur Arab
oʻzbekcha Usbekisch uz Latn Latein
oʻzbekcha Usbekisch uz-Cyrl Cyrl Alte Rechtschreibung
Cymraeg Walisisch cy Latn
IsiZulu Zulu zu Latn

Zugeordnete Sprachen

Die folgenden Sprachen sind einem anderen Sprachcode zugeordnet oder einem allgemeinen Zeichenerkenner.

Sprache Sprache (deutscher Name) languageHints Code Script Hinweise
بهسا اچيه Achinesisch ace Latn Lateinisches Modell
Lwo Acholi ach Latn Lateinisches Modell
Dangme Adangme ada Latn Lateinisches Modell
Akan Akan ak Latn Lateinisches Modell
Anicinâbemowin Algonquinian alg Latn Lateinisches Modell
Mapudungu Araucanian/Mapuche arn Latn Lateinisches Modell
Asturianu Asturisch ast Latn Lateinisches Modell
Dene Athapaskisch ath Latn Lateinisches Modell
Aymar aru Aymara ay Latn Lateinisches Modell
Bhāṣa Bali Balinesisch ban Latn Lateinisches Modell
Bamanankan Bambara bm Latn Lateinisches Modell
Narrow Bantu Bantu bnt Latn Lateinisches Modell
башҡорт теле Baschkirisch ba Cyrl Kyrillisches Modell
Toba–Batak Batak btk Latn Lateinisches Modell
Chibemba Bemba bem Latn Lateinisches Modell
Bikol Naga Bikol bik Latn Lateinisches Modell
Bichelamar Bislama bi Latn Lateinisches Modell
Brezhoneg Bretonisch br Latn Lateinisches Modell
нохчийн мотт / noxçiyn mott Tschetschenisch ce Cyrl Kyrillisches Modell
汉语 Chinesisch (Mandarin, vereinfacht,) zh-Hans Hans Chinesisches Modell
漢語 Chinesisch (Mandarin, traditionell) zh-Hant Hant Chinesisches Modell
普通話 Chinesisch (Mandarin, Hongkong) zh-Hant-HK Hant Chinesisches Modell
Chahta' Choctaw cho Latn Lateinisches Modell
Чӑвашла Tschuwaschisch cv Cyrl Kyrillisches Modell
Cree–Montagnais–Naskapi Cree cr Latn Lateinisches Modell
Mvskoke Muskogee mus Latn Lateinisches Modell
qırımtatar tili, къырымтатар тили Krimtatarisch crh Latn Kyrillisches Modell
Dakhótiyapi, Dakȟótiyapi Dakota dak Latn Lateinisches Modell
Douala Duala dua Latn Lateinisches Modell
Ikɔ Efik Efik efi Latn Lateinisches Modell
English (British) Englisch (Britisch) en-GB Latn Lateinisches Modell
Èʋegbe Ewe ee Latn Lateinisches Modell
føroyskt mál Färöisch fo Latn Lateinisches Modell
Na Vosa Vakaviti Fidschi fj Latn Lateinisches Modell
fɔ̀ngbè Fon fon Latn Lateinisches Modell
Français canadien Französisch (Kanada) fr-CA Latn Lateinisches Modell
Fulani, Fulah, Peul Fulfulde ff Latn Lateinisches Modell
Ga gaa Latn Lateinisches Modell
Luganda Ganda lg Latn Lateinisches Modell
Basa Gayo Gayo gay Latn Lateinisches Modell
Kiribati Kiribatisch gil Latn Lateinisches Modell
Gothic Gotisch got Latn Lateinisches Modell
Guaraní Guarani gn Latn Lateinisches Modell
Harshen/Halshen Hausa هَرْشَن هَوْسَ Hausa ha Latn Lateinisches Modell
ʻŌlelo Hawaiʻi Hawaiianisch haw Latn Lateinisches Modell
Otjiherero Herero hz Latn Lateinisches Modell
Ilonggo Hiligaynon hil Latn Lateinisches Modell
Jaku Iban Iban iba Latn Lateinisches Modell
Asụsụ Igbo Igbo ig Latn Lateinisches Modell
Ilokano Ilokano ilo Latn Lateinisches Modell
Taqbaylit Kabylisch kab Latn Lateinisches Modell
Jingpho Kachin kac Latn Lateinisches Modell
Kalaallisut Kalaallisut kl Latn Lateinisches Modell
Kikamba Kikamba kam Latn Lateinisches Modell
Kanuri Kanuri kr Latn Lateinisches Modell
Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى Kara-Kalpak kaa Cyrl/Latn Kyrillisches Modell
Ka Ktien Khasi Khasi kha Latn Lateinisches Modell
Gĩkũyũ Kikuyu ki Latn Lateinisches Modell
Kinyarwanda Kinyarwanda rw Latn Lateinisches Modell
коми кыв Komi kv Cyrl Kyrillisches Modell
Kikongo Kongo kg Latn Lateinisches Modell
Kosraean Kosraeanisch kos Latn Lateinisches Modell
Oshikwanyama Kuanyama kj Latn Lateinisches Modell
Ngala Lingala ln Latn Lateinisches Modell
Plattdütsch, Plattdeutsch, Nedersaksisch Plattdeutsch nds Latn Lateinisches Modell
siLozi Lozi loz Latn Lateinisches Modell
Kiluba Luba-Katanga lu Latn Lateinisches Modell
Dholuo Luo luo Latn Lateinisches Modell
Madhura, Basa Mathura, بَهاسَ مَدورا Madura mad Latn Lateinisches Modell
Malagasy Malagasy mg Latn Lateinisches Modell
Mandinka, لغة مندنكا Mandingo man Latn Lateinisches Modell
Gaelg, Gailck Manx gv Latn Lateinisches Modell
Te reo Māori Maori mi Latn Lateinisches Modell
Ebon Marshallesisch mh Latn Lateinisches Modell
Mɛnde yia Mende men Latn Lateinisches Modell
Middle English Mittelenglisch enm Latn Lateinisches Modell
Mittelhochdeutsch Mittelhochdeutsch gmh Latn Lateinisches Modell
Baso Minangkabau, باسو مينڠكاباو Minangkabauisch min Latn Lateinisches Modell
Kanienʼkéha Mohawk moh Latn Lateinisches Modell
Nkundu Mongo lol Latn Lateinisches Modell
Nāhuatl Nahuatl nah Latn Lateinisches Modell
Diné bizaad Navajo nv Latn Lateinisches Modell
Ndonga Ndonga ng Latn Lateinisches Modell
ko e vagahau Niuē Niueanisch niu Latn Lateinisches Modell
Zimbabwe Ndebele Nord-Ndebele nd Latn Lateinisches Modell
Sesotho sa Leboa Nord-Sotho nso Latn Lateinisches Modell
Chichewa, Chinyanja Chichewa ny Latn Lateinisches Modell
Runyankore Nyankole nyn Latn Lateinisches Modell
Chitonga Nyasa Tonga tog Latn Lateinisches Modell
Appolo Nzima nzi Latn Lateinisches Modell
Occitan, lenga d'òc, provençal Okzitanisch oc Latn Lateinisches Modell
Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ Ojibwa oj Latn Lateinisches Modell
Ænglisc, Englisc, Anglisc Altenglisch ang Latn Lateinisches Modell
Franceis, François, Romanz Altfranzösisch fro Latn Lateinisches Modell
Diutisk, Althochdeutsch Althochdeutsch goh Latn Lateinisches Modell
Dǫnsk tunga Altnordisch non Latn Lateinisches Modell
Occitan ancian Altprovenzalisch pro Latn Lateinisches Modell
ирон ӕвзаг Ossetisch os Cyrl Kyrillisches Modell
Kapampangan Pampanga pam Latn Lateinisches Modell
Salitan Pangasinan Pangasinensisch pag Latn Lateinisches Modell
Papiamentu Papiamento pap Latn Lateinisches Modell
Português (Portugal) Portugiesisch (europäisch) pt-PT Latn Lateinisches Modell
Kechua / Runa Simi Quechua qu Latn Lateinisches Modell
Rumantsch Rätoromanisch rm Latn Lateinisches Modell
Romani čhib Romani rom Latn Lateinisches Modell
Ikirundi Kirundi rn Latn Lateinisches Modell
Sakha Jakutisch sah Cyrl Kyrillisches Modell
Gagana faʻa Sāmoa Samoanisch sm Latn Lateinisches Modell
yângâ tî sängö Sango sg Latn Lateinisches Modell
(Braid) Scots, Lallans, Doric Schottisch sco Latn Lateinisches Modell
Gàidhlig Schottisch-Gälisch gd Latn Lateinisches Modell
chiShona Shona sn Latn Lateinisches Modell
Songhay Songhai son Latn Lateinisches Modell
Sesotho Süd-Sotho-Sprache st Latn Lateinisches Modell
Español (Latinoamérica) Spanisch (Lateinamerika) es-419 Latn Lateinisches Modell
ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda Sundanesisch su Latn Lateinisches Modell
siSwati Siswati ss Latn Lateinisches Modell
Reo Tahiti Tahitianisch ty Latn Lateinisches Modell
тоҷикӣ Tadschikisch tg Cyrl Kyrillisches Modell
татар теле Tatarisch tt Cyrl/Latn Kyrillisches Modell
KʌThemnɛ Temne tem Latn Lateinisches Modell
lea faka-Tonga Tongaisch to Latn Lateinisches Modell
Xitsonga Tsonga ts Latn Lateinisches Modell
Setswana Setswana tn Latn Lateinisches Modell
Türkmençe Turkmenisch tk Latn Kyrillisches Modell
удмурт кыл Udmurten udm Cyrl Kyrillisches Modell
Tshivenḓa Venda ve Latn Lateinisches Modell
Vod Wotisch vot Cyrl/Latn Kyrillisches Modell
Frysk Westfriesisch fy Latn Lateinisches Modell
Wolof Wolof wo Latn Lateinisches Modell
isiXhosa Xhosa xh Latn Lateinisches Modell
Èdè Yorùbá Yoruba yo Latn Lateinisches Modell
Diidxazá Zapotec zap Latn Lateinisches Modell

Handschrift-Skripts

Die folgenden Scripts werden für die Handschrifterkennung unterstützt. In den obigen Sprachtabellen finden Sie die Sprachen, die das jeweilige Script verwenden.

Script Name Supportstufe
Beng Bengalisch Experimentell
Cyrl Kyrillisch Experimentell
Deva Dewanagari Experimentell
Grek Griechisch Experimentell
Hani Chinesisch Experimentell
Jpan Japanisch Unterstützt
Kore Koreanisch Unterstützt
Latn Latein Unterstützt
vi Vietnamesisch Experimentell