Dukungan Bahasa OCR

Fitur pengenalan teks Cloud Vision API dapat mendeteksi berbagai bahasa dan dapat mendeteksi beberapa bahasa dalam satu gambar.

Memberikan petunjuk bahasa ke layanan tidak diwajibkan, tetapi dapat dilakukan jika layanan mengalami masalah dalam mendeteksi bahasa yang digunakan dalam gambar.

Dengan dirilisnya image GA OCR Tulisan tangan dengan tulisan tangan tidak lagi memerlukan tanda languageHints tulisan tangan saat menggunakan DOCUMENT_TEXT_DETECTION.

Petunjuk bahasa opsional ditentukan dalam ImageContext permintaan sebagai daftar languageHints untuk permintaan TEXT_DETECTION dan DOCUMENT_TEXT_DETECTION.

Setiap parameter kode bahasa biasanya terdiri dari ID BCP-47. Parameter ini dapat berupa bentuk bahasa-region, dengan bahasa mengacu pada bahasa utama dan region opsional mengacu pada region (biasanya ID negara) dari dialek tertentu. Misalnya, bahasa Mandarin dapat direpresentasikan sebagai Mandarin Aksara Sederhana seperti yang digunakan di Republik Rakyat China (zh-Hans) atau Mandarin Aksara Tradisional seperti yang digunakan di Taiwan (zh-Hant).

Ada tiga tingkat dukungan bahasa dalam fitur pengenalan teks:

  1. Bahasa yang didukung adalah bahasa yang kami prioritaskan dan performanya dievaluasi secara rutin.
  2. Bahasa Eksperimental adalah bahasa yang sedang dalam pengembangan aktif, tetapi tidak dievaluasi secara rutin.
  3. Bahasa yang dipetakan adalah bahasa yang didukung dengan memetakannya ke kode bahasa lain atau ke pengenal karakter umum. Misalnya, "en-GB" didukung, tetapi tidak diperlakukan secara berbeda dengan "en" untuk tujuan mengenali teks. Kami melakukan upaya terbaik untuk menampilkan kode bahasa yang dipetakan yang benar di kolom lokalitas Entitas. Namun, bahasa yang dipetakan cenderung salah diidentifikasi sebagai bahasa serupa, bukan bahasa yang didukung sepenuhnya, atau yang didukung secara eksperimental.

Daftar bahasa (dengan kode languageHint terkait) yang didukung oleh TEXT_DETECTION dan DOCUMENT_TEXT_DETECTION ditampilkan di bawah ini.

Jika petunjuk bahasa dibiarkan kosong, kami akan mencoba mendeteksi secara otomatis bahasa yang paling sesuai. Endpoint TEXT_DETECTION akan otomatis mendeteksi sebagian bahasa yang didukung, sedangkan endpoint DOCUMENT_TEXT_DETECTION akan otomatis mendeteksi rangkaian lengkap bahasa yang didukung.

Bahasa yang didukung

Bahasa berikut diprioritaskan dan dievaluasi secara berkala.

Untuk memfilter berdasarkan fitur, ketik atau langsung pilih bahasa yang diinginkan dari menu dropdown:

Pemodelan bahasa Bahasa (nama bahasa Inggris) Kode languageHints Skrip Catatan
Afrikaans Afrika af Latn
shqip Albania sq Latn
العربية Arabic ar Arab Standar Modern
Հայ Armenia hy Armn
беларуская Belarusia be Cyrl
বাংলা Bengali bn Beng
български Bulgaria bg Cyrl
Català Catalan ca Latn
普通话 China zh Hans/Hant
Hrvatski Kroasia hr Latn
Čeština Ceko cs Latn
Dansk Dansk da Latn
Nederlands Belanda nl Latn
English Inggris en Latn Amerika
Eesti keel Estonia et Latn
Filipino Filipina fil Latn
Suomi Suomi fi Latn
Français French fr Latn Eropa
Deutsch German de Latn
Ελληνικά Yunani el Grek
ગુજરાતી Gujarati gu Gujr
עברית Ibrani iw Hebr
हिन्दी Hindi hi Deva
Magyar Hungaria hu Latn
Íslenska Islan is Latn
Bahasa Indonesia Indonesian id Latn
Italiano Italia it Latn
日本語 Japanese ja Jpan
ಕನ್ನಡ Kannada kn Knda
ភាសាខ្មែរ Khmer km Khmr
한국어 Korean ko Kore
ລາວ Laos lo Laoo
Latviešu Latvi lv Latn
Lietuvių Lituania lt Latn
Македонски Makedonia mk Cyrl
Bahasa Melayu Melayu ms Latn
മലയാളം Malayalam ml Mlym
मराठी Marathi mr Deva
नेपाली Nepal ne Deva
Norsk Norwegia no Latn Bokmål
فارسی Persia fa Arab
Polski Polski pl Latn
Português Portugis pt Latn Brasil
ਪੰਜਾਬੀ Punjabi pa Guru Gurmukhi
Română Rumania ro Latn
Русский Russian ru Cyrl
Русский (старая орфография) Russian ru-PETR1708 Cyrl Ortografi Lama
Српски Serbia sr Cyrl
Српски (латиница) Serbia sr-Latn Latn
Slovenčina Slovakia sk Latn
Slovenščina Slovenia sl Latn
Español Spanish es Latn Eropa
Svenska Swensk sv Latn
Tagalog Tagalog tl Latn
தமிழ் Tamil ta Taml
తెలుగు Telugu te Telu
ไทย Thai th Thai
Türkçe Turki tr Latn
Українська Ukraina uk Cyrl
Tiếng Việt Vietnam vi Latn
Yiddish Yiddish yi Hebr

Bahasa eksperimental

Bahasa berikut sedang dalam pengembangan aktif dan belum dievaluasi secara berkala.

Pemodelan bahasa Bahasa (nama bahasa Inggris) Kode languageHints Skrip Notes
አማርኛ Amhara am Ethi
Αρχαία ελληνικά Yunani Kuno grc Grek
অসমীয়া Assam as Beng
Azərbaycan Azerbaijani az Latn
Azərbaycan (qədim yazı) Azerbaijani az-Cyrl Cyrl Ortografi Lama
Euskara Basque eu Latn
Bosanski Bosnia bs Latn
မြန်မာ Burma my Mymr
Cebuano Cebu ceb Latn
ᏣᎳᎩ ᎦᏬᏂᎯᏍᏗ Cherokee chr Cher
dhivehi, dhivehi-bas Dhivehi dv Thaa
རྫོང་ཁ Dzonkha dz Tibt
Esperanto Esperanto eo Latn
Galego Galisia gl Latn
ქართული Georgia ka Geor
Kreyòl Ayisyen Kreol Haiti ht Latn
Gaeilge Irlandia ga Latn
Jawa Jawa jv Latn
Қазақ Kazak kk Cyrl
Kirghiz Kirgiz ky Cyrl
Latine Latin la Latn
Malti Malta mt Latn
Монгол Mongolia mn Cyrl
ଓଡ଼ିଆ Oriya or Orya
پښتو Pashto ps Arab
संस्कृतम् Sanskrit sa Deva
සිංහල Sinhala si Sinh
Swahili Swahili sw Latn
leššānā Suryāyā Suryani syr Syriac
བོད་སྐད་ Tibet bo Tibt
ትግርኛ Tigirinya ti Ethi
اردو Urdu ur Arab
oʻzbekcha Uzbekistan uz Latn Latin
oʻzbekcha Uzbekistan uz-Cyrl Cyrl Ortografi Lama
Cymraeg Wales cy Latn
IsiZulu Zulu zu Latn

Bahasa yang dipetakan

Bahasa berikut dipetakan ke kode bahasa lain atau dipetakan ke pengenal karakter umum.

Pemodelan bahasa Bahasa (nama bahasa Inggris) Kode languageHints Skrip Notes
بهسا اچيه Aceh ace Latn Model Latin
Lwo Acholi ach Latn Model Latin
Dangme Adangme ada Latn Model Latin
Akan Akan ak Latn Model Latin
Anicinâbemowin Algonquinian alg Latn Model Latin
Mapudungu Araucanian/Mapuche arn Latn Model Latin
Asturianu Asturia ast Latn Model Latin
Dene Athabaskan ath Latn Model Latin
Aymar aru Aymara ay Latn Model Latin
Bhāṣa Bali Bali ban Latn Model Latin
Bamanankan Bambara bm Latn Model Latin
Narrow Bantu Bantu bnt Latn Model Latin
башҡорт теле Bashkir ba Cyrl Model Sirilik
Toba–Batak Batak btk Latn Model Latin
Chibemba Bemba bem Latn Model Latin
Bikol Naga Bikol bik Latn Model Latin
Bichelamar Bislama bi Latn Model Latin
Brezhoneg Breton br Latn Model Latin
нохчийн мотт / noxçiyn mott Suku Chechen ce Cyrl Model Sirilik
汉语 Bahasa China, Mandarin (Aksara Sederhana) zh-Hans Hans Model China
漢語 China (Mandarin, Tradisional) zh-Hant Hant Model China
普通話 China (Mandarin, Hong Kong) zh-Hant-HK Hant Model China
Chahta' Choctaw cho Latn Model Latin
Чӑвашла Chuvash cv Cyrl Model Sirilik
Cree–Montagnais–Naskapi Cree cr Latn Model Latin
Mvskoke Creek mus Latn Model Latin
qırımtatar tili, къырымтатар тили Crimean Tatar crh Latn Model Sirilik
Dakhótiyapi, Dakȟótiyapi Dakota dak Latn Model Latin
Douala Duala dua Latn Model Latin
Ikɔ Efik Efik efi Latn Model Latin
English (British) Inggris (Britania Raya) en-GB Latn Model Latin
Èʋegbe Ewe ee Latn Model Latin
føroyskt mál Faroese fo Latn Model Latin
Na Vosa Vakaviti Fiji fj Latn Model Latin
fɔ̀ngbè Fon fon Latn Model Latin
Français canadien Prancis (Kanada) fr-CA Latn Model Latin
Fulani, Fulah, Peul Fulah ff Latn Model Latin
Ga gaa Latn Model Latin
Luganda Ganda lg Latn Model Latin
Basa Gayo Gayo gay Latn Model Latin
Kiribati Gilbert gil Latn Model Latin
Gothic Gotik got Latn Model Latin
Guaraní Guarani gn Latn Model Latin
Harshen/Halshen Hausa هَرْشَن هَوْسَ Hausa ha Latn Model Latin
ʻŌlelo Hawaiʻi Hawaii haw Latn Model Latin
Otjiherero Herero hz Latn Model Latin
Ilonggo Hiligaynon hil Latn Model Latin
Jaku Iban Iban iba Latn Model Latin
Asụsụ Igbo Igbo ig Latn Model Latin
Ilokano Iloko ilo Latn Model Latin
Taqbaylit Kabyle kab Latn Model Latin
Jingpho Kachin kac Latn Model Latin
Kalaallisut Kalaallisut kl Latn Model Latin
Kikamba Kamba kam Latn Model Latin
Kanuri Kanuri kr Latn Model Latin
Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى Karakalpak kaa Cyrl/Latn Model Sirilik
Ka Ktien Khasi Khasi kha Latn Model Latin
Gĩkũyũ Kikuyu ki Latn Model Latin
Kinyarwanda Kinyarwanda rw Latn Model Latin
коми кыв Komi kv Cyrl Model Sirilik
Kikongo Kongo kg Latn Model Latin
Kosraean Kosrae kos Latn Model Latin
Oshikwanyama Kuanyama kj Latn Model Latin
Ngala Lingala ln Latn Model Latin
Plattdütsch, Plattdeutsch, Nedersaksisch Dialek Jerman Utara nds Latn Model Latin
siLozi Lozi loz Latn Model Latin
Kiluba Luba-Katanga lu Latn Model Latin
Dholuo Luo luo Latn Model Latin
Madhura, Basa Mathura, بَهاسَ مَدورا Madura mad Latn Model Latin
Malagasy Malagasi mg Latn Model Latin
Mandinka, لغة مندنكا Mandingo man Latn Model Latin
Gaelg, Gailck Manx gv Latn Model Latin
Te reo Māori Maori mi Latn Model Latin
Ebon Marshall mh Latn Model Latin
Mɛnde yia Mende men Latn Model Latin
Middle English Inggris Pertengahan enm Latn Model Latin
Mittelhochdeutsch Jerman Hulu Pertengahan gmh Latn Model Latin
Baso Minangkabau, باسو مينڠكاباو Minangkabau min Latn Model Latin
Kanienʼkéha Mohawk moh Latn Model Latin
Nkundu Mongo lol Latn Model Latin
Nāhuatl Nahuatl nah Latn Model Latin
Diné bizaad Navajo nv Latn Model Latin
Ndonga Ndonga ng Latn Model Latin
ko e vagahau Niuē Niuean niu Latn Model Latin
Zimbabwe Ndebele Ndebele Utara nd Latn Model Latin
Sesotho sa Leboa Sotho Utara nso Latn Model Latin
Chichewa, Chinyanja Nyanja ny Latn Model Latin
Runyankore Nyankole nyn Latn Model Latin
Chitonga Nyasa Tonga tog Latn Model Latin
Appolo Nzima nzi Latn Model Latin
Occitan, lenga d'òc, provençal Occitan oc Latn Model Latin
Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ Ojibwa oj Latn Model Latin
Ænglisc, Englisc, Anglisc Inggris Kuno ang Latn Model Latin
Franceis, François, Romanz Prancis Kuno fro Latn Model Latin
Diutisk, Althochdeutsch Jerman Hulu Kuno goh Latn Model Latin
Dǫnsk tunga Norse Kuno non Latn Model Latin
Occitan ancian Provencal Kuno pro Latn Model Latin
ирон ӕвзаг Ossetic os Cyrl Model Sirilik
Kapampangan Pampanga pam Latn Model Latin
Salitan Pangasinan Pangasinan pag Latn Model Latin
Papiamentu Papiamento pap Latn Model Latin
Português (Portugal) Portugis (Eropa) pt-PT Latn Model Latin
Kechua / Runa Simi Quechua qu Latn Model Latin
Rumantsch Romansh rm Latn Model Latin
Romani čhib Rumania rom Latn Model Latin
Ikirundi Rundi rn Latn Model Latin
Sakha Sakha sah Cyrl Model Sirilik
Gagana faʻa Sāmoa Samoa sm Latn Model Latin
yângâ tî sängö Sango sg Latn Model Latin
(Braid) Scots, Lallans, Doric Skotlandia sco Latn Model Latin
Gàidhlig Gaelik Skotlandia gd Latn Model Latin
chiShona Shona sn Latn Model Latin
Songhay Songhai son Latn Model Latin
Sesotho Sotho Selatan st Latn Model Latin
Español (Latinoamérica) Spanyol (Amerika Latin) es-419 Latn Model Latin
ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda Sunda su Latn Model Latin
siSwati Swati ss Latn Model Latin
Reo Tahiti Tahiti ty Latn Model Latin
тоҷикӣ Tajik tg Cyrl Model Sirilik
татар теле Tatar tt Cyrl/Latn Model Sirilik
KʌThemnɛ Temne tem Latn Model Latin
lea faka-Tonga Tonga to Latn Model Latin
Xitsonga Tsonga ts Latn Model Latin
Setswana Tswana tn Latn Model Latin
Türkmençe Turkmen tk Latn Model Sirilik
удмурт кыл Udmurt udm Cyrl Model Sirilik
Tshivenḓa Venda ve Latn Model Latin
Vod Votic vot Cyrl/Latn Model Sirilik
Frysk Frisia Barat fy Latn Model Latin
Wolof Wolof wo Latn Model Latin
isiXhosa Xhosa xh Latn Model Latin
Èdè Yorùbá Yoruba yo Latn Model Latin
Diidxazá Zapotec zap Latn Model Latin

Skrip tulisan tangan

Skrip berikut didukung untuk pengenalan tulisan tangan. Lihat tabel bahasa di atas untuk bahasa yang menggunakan setiap skrip.

Skrip Nama Level Dukungan
Beng Bengali Eksperimental
Cyrl Sirilik Eksperimental
Deva Devanagari Eksperimental
Grek Yunani Eksperimental
Hani China Eksperimental
Jpan Japanese Didukung
Kore Korean Didukung
Latn Latin Didukung
vi Vietnam Eksperimental