Die Texterkennungsfunktion der Cloud Vision API erkennt eine Vielzahl von Sprachen und kann mehrere Sprachen in einem einzigen Bild erkennen.
Die Angabe eines Sprachhinweises für den Dienst ist nicht erforderlich, aber möglich, falls der Dienst die Sprache in Ihrem Bild nicht erkennt.
Seit der Veröffentlichung des GA-Release Handschrift-Texterkennung (Optical Character Recognition, OCR) müssen Bilder, die Handschrift enthalten, bei der Verwendung von DOCUMENT_TEXT_DETECTION
nicht mehr mit einem Flag languageHints
für Handschrift versehen werden.
Optionale Sprachhinweise werden bei TEXT_DETECTION
- und DOCUMENT_TEXT_DETECTION
-Anfragen im ImageContext der Anfrage als Liste von languageHints
angegeben.
Jeder Sprachcodeparameter besteht üblicherweise aus einer BCP-47-Kennung. Diese Parameter können in der Form Sprache-Region festgelegt werden. Dabei bezieht sich Sprache auf die Standardsprache und die optionale Angabe für Region auf eine Region (in der Regel eine Länderkennung) mit einem bestimmten Dialekt. Beispiel: Chinesisch kann als Vereinfachtes Chinesisch (zh-Hans
) dargestellt werden, wie es in der Volksrepublik China geschrieben wird, oder als Traditionelles Chinesisch in der taiwanischen Schreibweise (zh-Hant
).
Die Texterkennungsfunktion bietet drei Ebenen der Sprachunterstützung:
- Unterstützte Sprachen sind diejenigen, denen wir Priorität einräumen und bezüglich derer wir regelmäßig Leistungsbewertungen vornehmen.
- Experimentelle Sprachen sind Sprachen, die aktiv entwickelt, aber nicht regelmäßig ausgewertet werden.
- Zugeordnete Sprachen werden einem anderen Sprachcode oder einem allgemeinen Zeichenerkenner zugeordnet, um sie zu unterstützen. "
en-GB
" wird beispielsweise unterstützt, bei der Texterkennung jedoch nicht anders behandelt als "en
". Wir bemühen uns zwar, den korrekten Code der zugeordneten Sprache im Feld für die Sprache der Entität zurückzugeben, doch kann es bei zugeordneten Sprachen eher als bei vollständig oder experimentell unterstützten Sprachen vorkommen, dass sie als eine ähnliche Sprache und somit falsch identifiziert werden.
Weiter unter finden Sie eine Liste der Sprachen (mit den zugehörigen languageHint
-Codes), die von TEXT_DETECTION
und DOCUMENT_TEXT_DETECTION
unterstützt werden.
Wenn der Sprachhinweis leer gelassen wird, versuchen wir, die am besten passende Sprache automatisch zu erkennen. Der Endpunkt TEXT_DETECTION
erkennt nur einen Teil der unterstützten Sprachen automatisch, während der Endpunkt DOCUMENT_TEXT_DETECTION
alle unterstützten Sprachen automatisch erkennt.
Unterstützte Sprachen
Die folgenden Sprachen werden priorisiert und regelmäßig ausgewertet.
Wenn Sie nach bestimmten Features filtern möchten, geben Sie die gewünschte Sprache ein oder wählen Sie sie direkt aus dem Drop-down-Menü aus:
Sprache | Sprache (deutscher Name) | languageHints-Code | Skript/Notizen |
---|---|---|---|
Afrikaans | Afrikaans | af | Latn |
shqip | Albanisch | sq | Latn |
العربية | Arabisch | ar | Arab; Modern Standard |
Հայ | Armenisch | hy | Armn |
беларуская | Belarussisch | be | Cyrl |
বাংলা | Bengalisch | bn | Beng |
български | Bulgarisch | bg | Cyrl |
Català | Katalanisch | ca | Latn |
普通话 | Chinesisch | zh | Hans/Hant |
Hrvatski | Kroatisch | hr | Latn |
Čeština | Tschechisch | cs | Latn |
Dansk | Dänisch | da | Latn |
Nederlands | Niederländisch | nl | Latn |
English | Englisch | en | Latn; American |
Eesti keel | Estnisch | et | Latn |
Filipino | Filipino | fil (or tl) | Latn |
Suomi | Finnisch | fi | Latn |
Français | Französisch | fr | Latn; European |
Deutsch | Deutsch | de | Latn |
Ελληνικά | Griechisch | el | Grek |
ગુજરાતી | Gujarati | gu | Gujr |
עברית | Hebräisch | iw | Hebr |
हिन्दी | Hindi | hi | Deva |
Magyar | Ungarisch | hu | Latn |
Íslenska | Isländisch | is | Latn |
Bahasa Indonesia | Indonesisch | id | Latn |
Italiano | Italienisch | it | Latn |
日本語 | Japanisch | ja | Jpan |
ಕನ್ನಡ | Kannada | kn | Knda |
ភាសាខ្មែរ | Khmer | km | Khmr |
한국어 | Koreanisch | ko | Kore |
ລາວ | Lao | lo | Laoo |
Latviešu | Lettisch | lv | Latn |
Lietuvių | Litauisch | lt | Latn |
Македонски | Mazedonisch | mk | Cyrl |
Bahasa Melayu | Malaiisch | ms | Latn |
മലയാളം | Malayalam | ml | Mlym |
मराठी | Marathi | mr | Deva |
नेपाली | Nepali | ne | Deva |
Norsk | Norwegisch | no | Latn; Bokmål |
فارسی | Persisch | fa | Arab |
Polski | Polnisch | pl | Latn |
Português | Portugiesisch | pt | Latn; Brazilian |
ਪੰਜਾਬੀ | Panjabi | pa | Guru; Gurmukhi |
Română | Rumänisch | ro | Latn |
Русский | Russisch | ru | Cyrl |
Русский (старая орфография) | Russisch | ru-PETR1708 | Cyrl; Old Orthography |
Српски | Serbisch | sr | Cyrl & Latn |
Српски (латиница) | Serbisch | sr-Latn | Latn |
Slovenčina | Slowakisch | sk | Latn |
Slovenščina | Slowenisch | sl | Latn |
Español | Spanisch | es | Latn; European |
Svenska | Schwedisch | sv | Latn |
தமிழ் | Tamil | ta | Taml |
తెలుగు | Telugu | te | Telu |
ไทย | Thai | th | Thai |
Türkçe | Türkisch | tr | Latn |
Українська | Ukrainisch | uk | Cyrl |
Tiếng Việt | Vietnamesisch | vi | Latn |
Yiddish | Jiddisch | yi | Hebr |
Experimentelle Sprachen
Die folgenden Sprachen befinden sich in der Entwicklungsphase und werden noch nicht regelmäßig evaluiert.
Sprache | Sprache (deutscher Name) | languageHints Code |
Skript/Notizen |
---|---|---|---|
አማርኛ | Amharisch | am | Ethi |
Αρχαία ελληνικά | Altgriechisch | grc | Grek |
অসমীয়া | Assamesisch | as | Beng |
Azərbaycan | Aserbaidschanisch | az | Latn |
Azərbaycan (qədim yazı) | Aserbaidschanisch | az-Cyrl | Cyrl; Alte Rechtschreibung |
Euskara | Baskisch | eu | Latn |
Bosanski | Bosnisch | bs | Latn |
မြန်မာ | Burmesisch | my | Mymr |
Cebuano | Cebuano | ceb | Latn |
ᏣᎳᎩ ᎦᏬᏂᎯᏍᏗ | Cherokee | chr | Cher |
dhivehi, dhivehi-bas | Dhivehi | dv | Thaa |
རྫོང་ཁ | Dzonkha | dz | Tibt |
Esperanto | Esperanto | eo | Latn |
Galego | Galizisch | gl | Latn |
ქართული | Georgisch | ka | Geor |
Kreyòl Ayisyen | Kreolisch (Haiti) | ht | Latn |
Gaeilge | Irisch | ga | Latn |
Jawa | Javanisch | jv | Latn |
Қазақ | Kasachisch | kk | Cyrl |
Kirghiz | Kirgisisch | ky | Cyrl |
Latine | Latein | la | Latn |
Malti | Maltesisch | mt | Latn |
Монгол | Mongolisch | mn | Cyrl |
ଓଡ଼ିଆ | Oriya | or | Orya |
پښتو | Paschtunisch | ps | Arab |
संस्कृतम् | Sanskrit | sa | Deva |
සිංහල | Singhalesisch | si | Sinh |
Swahili | Swahili | sw | Latn |
leššānā Suryāyā | Syrisch | syr | Syriac |
བོད་སྐད་ | Tibetisch | bo | Tibt |
ትግርኛ | Tigirinya | ti | Ethi |
اردو | Urdu | ur | Arab |
oʻzbekcha | Usbekisch | uz | Latn; Latein |
oʻzbekcha | Usbekisch | uz-Cyrl | Cyrl; Alte Rechtschreibung |
Cymraeg | Walisisch | cy | Latn |
IsiZulu | Zulu | zu | Latn |
Zugeordnete Sprachen
Die folgenden Sprachen sind einem anderen Sprachcode zugeordnet oder einem allgemeinen Zeichenerkenner.
Sprache | Sprache (deutscher Name) | languageHints-Code | Skript/Notizen | Zugeordnet zu |
---|---|---|---|---|
بهسا اچيه | Achinesisch | ace | Latn | Lateinisches Skriptmodell |
Lwo | Acholi | ach | Latn | Lateinisches Skriptmodell |
Dangme | Adangme | ada | Latn | Lateinisches Skriptmodell |
Akan | Akan | ak | Latn | Lateinisches Skriptmodell |
Anicinâbemowin | Algonquinian | alg | Latn | Lateinisches Skriptmodell |
Mapudungu | Araucanian/Mapuche | arn | Latn | Lateinisches Skriptmodell |
Asturianu | Asturisch | ast | Latn | Lateinisches Skriptmodell |
Dene | Athapaskisch | ath | Latn | Lateinisches Skriptmodell |
Aymar aru | Aymara | ay | Latn | Lateinisches Skriptmodell |
Bhāṣa Bali | Balinesisch | ban | Latn | Lateinisches Skriptmodell |
Bamanankan | Bambara | bm | Latn | Lateinisches Skriptmodell |
Narrow Bantu | Bantu | bnt | Latn | Lateinisches Skriptmodell |
башҡорт теле | Baschkirisch | ba | Cyrl | Kyrillisches Skriptmodell |
Toba–Batak | Batak | btk | Latn | Lateinisches Skriptmodell |
Chibemba | Bemba | bem | Latn | Lateinisches Skriptmodell |
Bikol Naga | Bikol | bik | Latn | Lateinisches Skriptmodell |
Bichelamar | Bislama | bi | Latn | Lateinisches Skriptmodell |
Brezhoneg | Bretonisch | br | Latn | Lateinisches Skriptmodell |
нохчийн мотт / noxçiyn mott | Tschetschenisch | ce | Cyrl | Kyrillisches Skriptmodell |
汉语 | Chinesisch | zh-Hans | Hans; Vereinfacht; Mandarin | Chinesisches Skriptmodell |
漢語 | Chinesisch | zh-Hant | Hant; Traditionell; Mandarin | Chinesisches Skriptmodell |
普通話 | Chinesisch | zh-Hant-HK | Hant; Mandarin (Hongkong) | Chinesisches Skriptmodell |
Chahta' | Choctaw | cho | Latn | Lateinisches Skriptmodell |
Чӑвашла | Tschuwaschisch | cv | Cyrl | Kyrillisches Skriptmodell |
Cree–Montagnais–Naskapi | Cree | cr | Latn | Lateinisches Skriptmodell |
Mvskoke | Muskogee | mus | Latn | Lateinisches Skriptmodell |
qırımtatar tili, къырымтатар тили | Krimtatarisch | crh | Latn | Kyrillisches Skriptmodell |
Dakhótiyapi, Dakȟótiyapi | Dakota | dak | Latn | Lateinisches Skriptmodell |
Douala | Duala | dua | Latn | Lateinisches Skriptmodell |
Ikɔ Efik | Efik | efi | Latn | Lateinisches Skriptmodell |
English (British) | Deutsch | en-GB | Latn; British | Lateinisches Skriptmodell |
Èʋegbe | Ewe | ee | Latn | Lateinisches Skriptmodell |
føroyskt mál | Färöisch | fo | Latn | Lateinisches Skriptmodell |
Na Vosa Vakaviti | Fidschi | fj | Latn | Lateinisches Skriptmodell |
fɔ̀ngbè | Fon | fon | Latn | Lateinisches Skriptmodell |
Français canadien | Französisch | fr-CA | Latn; Canadian | Lateinisches Skriptmodell |
Fulani, Fulah, Peul | Fulfulde | ff | Latn | Lateinisches Skriptmodell |
Gã | Ga | gaa | Latn | Lateinisches Skriptmodell |
Luganda | Ganda | lg | Latn | Lateinisches Skriptmodell |
Basa Gayo | Gayo | gay | Latn | Lateinisches Skriptmodell |
Kiribati | Kiribatisch | gil | Latn | Lateinisches Skriptmodell |
Gothic | Gotisch | got | Latn | Lateinisches Skriptmodell |
Guaraní | Guarani | gn | Latn | Lateinisches Skriptmodell |
Harshen/Halshen Hausa هَرْشَن هَوْسَ | Hausa | ha | Latn | Lateinisches Skriptmodell |
ʻŌlelo Hawaiʻi | Hawaiianisch | haw | Latn | Lateinisches Skriptmodell |
Otjiherero | Herero | hz | Latn | Lateinisches Skriptmodell |
Ilonggo | Hiligaynon | hil | Latn | Lateinisches Skriptmodell |
Jaku Iban | Iban | iba | Latn | Lateinisches Skriptmodell |
Asụsụ Igbo | Igbo | ig | Latn | Lateinisches Skriptmodell |
Ilokano | Ilokano | ilo | Latn | Lateinisches Skriptmodell |
Taqbaylit | Kabylisch | kab | Latn | Lateinisches Skriptmodell |
Jingpho | Kachin | kac | Latn | Lateinisches Skriptmodell |
Kalaallisut | Kalaallisut | kl | Latn | Lateinisches Skriptmodell |
Kikamba | Kikamba | kam | Latn | Lateinisches Skriptmodell |
Kanuri | Kanuri | kr | Latn | Lateinisches Skriptmodell |
Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى | Kara-Kalpak | kaa | Cyrl/Latn | Kyrillisches Skriptmodell |
Ka Ktien Khasi | Khasi | kha | Latn | Lateinisches Skriptmodell |
Gĩkũyũ | Kikuyu | ki | Latn | Lateinisches Skriptmodell |
Kinyarwanda | Kinyarwanda | rw | Latn | Lateinisches Skriptmodell |
коми кыв | Komi | kv | Cyrl | Kyrillisches Skriptmodell |
Kikongo | Kongo | kg | Latn | Lateinisches Skriptmodell |
Kosraean | Kosraeanisch | kos | Latn | Lateinisches Skriptmodell |
Oshikwanyama | Kuanyama | kj | Latn | Lateinisches Skriptmodell |
Ngala | Lingala | ln | Latn | Lateinisches Skriptmodell |
Plattdütsch, Plattdeutsch, Nedersaksisch | Plattdeutsch | nds | Latn | Lateinisches Skriptmodell |
siLozi | Lozi | loz | Latn | Lateinisches Skriptmodell |
Kiluba | Luba-Katanga | lu | Latn | Lateinisches Skriptmodell |
Dholuo | Luo | luo | Latn | Lateinisches Skriptmodell |
Madhura, Basa Mathura, بَهاسَ مَدورا | Madura | mad | Latn | Lateinisches Skriptmodell |
Malagasy | Malagasy | mg | Latn | Lateinisches Skriptmodell |
Mandinka, لغة مندنكا | Mandingo | man | Latn | Lateinisches Skriptmodell |
Gaelg, Gailck | Manx | gv | Latn | Lateinisches Skriptmodell |
Te reo Māori | Maori | mi | Latn | Lateinisches Skriptmodell |
Ebon | Marshallesisch | mh | Latn | Lateinisches Skriptmodell |
Mɛnde yia | Mende | men | Latn | Lateinisches Skriptmodell |
Middle English | Mittelenglisch | enm | Latn | Lateinisches Skriptmodell |
Mittelhochdeutsch | Mittelhochdeutsch | gmh | Latn | Lateinisches Skriptmodell |
Baso Minangkabau, باسو مينڠكاباو | Minangkabauisch | min | Latn | Lateinisches Skriptmodell |
Kanienʼkéha | Mohawk | moh | Latn | Lateinisches Skriptmodell |
Nkundu | Mongo | lol | Latn | Lateinisches Skriptmodell |
Nāhuatl | Nahuatl | nah | Latn | Lateinisches Skriptmodell |
Diné bizaad | Navajo | nv | Latn | Lateinisches Skriptmodell |
Ndonga | Ndonga | ng | Latn | Lateinisches Skriptmodell |
ko e vagahau Niuē | Niueanisch | niu | Latn | Lateinisches Skriptmodell |
Zimbabwe Ndebele | Nord-Ndebele | nd | Latn | Lateinisches Skriptmodell |
Sesotho sa Leboa | Nord-Sotho | nso | Latn | Lateinisches Skriptmodell |
Chichewa, Chinyanja | Chichewa | ny | Latn | Lateinisches Skriptmodell |
Runyankore | Nyankole | nyn | Latn | Lateinisches Skriptmodell |
Chitonga | Nyasa Tonga | tog | Latn | Lateinisches Skriptmodell |
Appolo | Nzima | nzi | Latn | Lateinisches Skriptmodell |
Occitan, lenga d'òc, provençal | Okzitanisch | oc | Latn | Lateinisches Skriptmodell |
Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ | Ojibwa | oj | Latn | Lateinisches Skriptmodell |
Ænglisc, Englisc, Anglisc | Altenglisch | ang | Latn | Lateinisches Skriptmodell |
Franceis, François, Romanz | Altfranzösisch | fro | Latn | Lateinisches Skriptmodell |
Diutisk, Althochdeutsch | Althochdeutsch | goh | Latn | Lateinisches Skriptmodell |
Dǫnsk tunga | Altnordisch | non | Latn | Lateinisches Skriptmodell |
Occitan ancian | Altprovenzalisch | pro | Latn | Lateinisches Skriptmodell |
ирон ӕвзаг | Ossetisch | os | Cyrl | Kyrillisches Skriptmodell |
Kapampangan | Pampanga | pam | Latn | Lateinisches Skriptmodell |
Salitan Pangasinan | Pangasinensisch | pag | Latn | Lateinisches Skriptmodell |
Papiamentu | Papiamento | pap | Latn | Lateinisches Skriptmodell |
Português (Portugal) | Portugiesisch | pt-PT | Latn; European | Lateinisches Skriptmodell |
Kechua / Runa Simi | Quechua | qu | Latn | Lateinisches Skriptmodell |
Rumantsch | Rätoromanisch | rm | Latn | Lateinisches Skriptmodell |
Romani čhib | Romani | rom | Latn | Lateinisches Skriptmodell |
Ikirundi | Kirundi | rn | Latn | Lateinisches Skriptmodell |
Sakha | Jakutisch | sah | Cyrl | Kyrillisches Skriptmodell |
Gagana faʻa Sāmoa | Samoanisch | sm | Latn | Lateinisches Skriptmodell |
yângâ tî sängö | Sango | sg | Latn | Lateinisches Skriptmodell |
(Braid) Scots, Lallans, Doric | Schottisch | sco | Latn | Lateinisches Skriptmodell |
Gàidhlig | Schottisch-Gälisch | gd | Latn | Lateinisches Skriptmodell |
chiShona | Shona | sn | Latn | Lateinisches Skriptmodell |
Songhay | Songhai | son | Latn | Lateinisches Skriptmodell |
Sesotho | Süd-Sotho-Sprache | st | Latn | Lateinisches Skriptmodell |
Español (Latinoamérica) | Spanisch | es-419 | Latn; Latin American | Lateinisches Skriptmodell |
ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda | Sundanesisch | su | Latn | Lateinisches Skriptmodell |
siSwati | Siswati | ss | Latn | Lateinisches Skriptmodell |
Reo Tahiti | Tahitianisch | ty | Latn | Lateinisches Skriptmodell |
тоҷикӣ | Tadschikisch | tg | Cyrl | Kyrillisches Skriptmodell |
татар теле | Tatarisch | tt | Cyrl/Latn | Kyrillisches Skriptmodell |
KʌThemnɛ | Temne | tem | Latn | Lateinisches Skriptmodell |
lea faka-Tonga | Tongaisch | to | Latn | Lateinisches Skriptmodell |
Xitsonga | Tsonga | ts | Latn | Lateinisches Skriptmodell |
Setswana | Setswana | tn | Latn | Lateinisches Skriptmodell |
Türkmençe | Turkmenisch | tk | Latn | Kyrillisches Skriptmodell |
удмурт кыл | Udmurten | udm | Cyrl | Kyrillisches Skriptmodell |
Tshivenḓa | Venda | ve | Latn | Lateinisches Skriptmodell |
Vod | Wotisch | vot | Cyrl/Latn | Kyrillisches Skriptmodell |
Frysk | Westfriesisch | fy | Latn | Lateinisches Skriptmodell |
Wolof | Wolof | wo | Latn | Lateinisches Skriptmodell |
isiXhosa | Xhosa | xh | Latn | Lateinisches Skriptmodell |
Èdè Yorùbá | Yoruba | yo | Latn | Lateinisches Skriptmodell |
Diidxazá | Zapotec | zap | Latn | Lateinisches Skriptmodell |
Handschrift-Skripts
Die folgenden Skripts werden für die Handschrifterkennung unterstützt. In den obigen Sprachtabellen finden Sie die Sprachen, die das jeweilige Skript verwenden.
Skript-Tag | Name | Supportstufe |
---|---|---|
Beng | Bengalisch | Experimentell |
Cyrl | Kyrillisch | Experimentell |
Deva | Dewanagari | Experimentell |
Grek | Griechisch | Experimentell |
Hani | Chinesisch | Experimentell |
Jpan | Japanisch | Unterstützt |
Kore | Koreanisch | Unterstützt |
Latn | Latein | Unterstützt |
vi | Vietnamesisch | Experimentell |