OCR 言語のサポート

Cloud Vision API のテキスト認識機能では、多様な言語を検出でき、1 つの画像内の複数の言語を検出できます。

サービスに言語のヒントを提供することは必須ではありませんが、サービスで画像に使用されている言語の検出が困難な場合に行うことができます。

手書き OCR 一般提供のリリースに伴い、DOCUMENT_TEXT_DETECTION を使用する場合、手書き文字の含まれた画像には手書き languageHints フラグが不要になりました。

言語ヒント(省略可能)は、TEXT_DETECTION および DOCUMENT_TEXT_DETECTION リクエストに関して、リクエストの ImageContext 内に languageHints リストとして指定します。

各言語コード パラメータは一般に BCP-47 識別子で構成されています。このパラメータでは、言語-地域の形式が可能です。ここで、言語は第一言語を表し、地域(省略可能)は特定の言語の地域(通常は国の識別子)を表します。たとえば、中国語は中華人民共和国で使用される簡体中国語(zh-Hans)、または台湾で使用される繁体中国語(zh-Hant)で表されます。

テキスト認識機能には、次の 3 段階の言語サポートがあります。

  1. サポート対象言語は、優先して定期的にパフォーマンスを評価されます。
  2. 試験運用言語は開発が積極的に進められていますが、定期的に評価されません。
  3. マッピング言語とは、別の言語コードや一般的な文字認識ツールにマッピングすることでサポートされる言語です。たとえば、「en-GB」はサポートされていますが、文字認識においては「en」と同様に扱われます。エンティティのロケール フィールドで正しいマッピング言語コードを返すよう最善を尽くしますが、マッピング言語は完全にサポートされている言語や試験運用でサポートされている言語よりも、類似した言語として誤って認識される可能性があります。

TEXT_DETECTIONDOCUMENT_TEXT_DETECTION でサポートされる言語のリスト(および関連する languageHint コード)は、以下のとおりです。

言語ヒントが空白の場合、最適な言語の自動検出を試みます。TEXT_DETECTION エンドポイントは、サポートされている言語のサブセットのみを自動検出します。一方、DOCUMENT_TEXT_DETECTION エンドポイントは、サポートされているすべての言語を自動検出します。

サポートされる言語

次の言語は優先され、定期的に評価されます。

機能別でフィルタするには、目的の言語を入力するか、プルダウン メニューから選択します。

Language Language (English name) languageHints code Script / notes
Afrikaans Afrikaans af Latn
shqip Albanian sq Latn
العربية Arabic ar Arab; Modern Standard
Հայ Armenian hy Armn
беларускі Belorussian be Cyrl
বাংলা Bengali bn Beng
български Bulgarian bg Cyrl
Català Catalan ca Latn
普通话 Chinese zh Hans/Hant
Hrvatski Croatian hr Latn
Čeština Czech cs Latn
Dansk Danish da Latn
Nederlands Dutch nl Latn
English English en Latn; American
Eesti keel Estonian et Latn
Filipino Filipino fil (or tl) Latn
Suomi Finnish fi Latn
Français French fr Latn; European
Deutsch German de Latn
Ελληνικά Greek el Grek
ગુજરાતી Gujarati gu Gujr
עברית Hebrew iw Hebr
हिन्दी Hindi hi Deva
Magyar Hungarian hu Latn
Íslenska Icelandic is Latn
Bahasa Indonesia Indonesian id Latn
Italiano Italian it Latn
日本語 Japanese ja Jpan
ಕನ್ನಡ Kannada kn Knda
ភាសាខ្មែរ Khmer km Khmr
한국어 Korean ko Kore
ລາວ Lao lo Laoo
Latviešu Latvian lv Latn
Lietuvių Lithuanian lt Latn
Македонски Macedonian mk Cyrl
Bahasa Melayu Malay ms Latn
മലയാളം Malayalam ml Mlym
मराठी Marathi mr Deva
नेपाली Nepali ne Deva
Norsk Norwegian no Latn; Bokmål
فارسی Persian fa Arab
Polski Polish pl Latn
Português Portuguese pt Latn; Brazilian
ਪੰਜਾਬੀ Punjabi pa Guru; Gurmukhi
Română Romanian ro Latn
Русский Russian ru Cyrl
Русский (старая орфография) Russian ru-PETR1708 Cyrl; Old Orthography
Српски Serbian sr Cyrl & Latn
Српски (латиница) Serbian sr-Latn Latn
Slovenčina Slovak sk Latn
Slovenščina Slovenian sl Latn
Español Spanish es Latn; European
Svenska Swedish sv Latn
தமிழ் Tamil ta Taml
తెలుగు Telugu te Telu
ไทย Thai th Thai
Türkçe Turkish tr Latn
Українська Ukrainian uk Cyrl
Tiếng Việt Vietnamese vi Latn
Yiddish Yiddish yi Hebr

試験運用言語

次の言語は現在開発が積極的に進められている最中ですが、まだ定期的に評価されていません。

Language Language (English name) languageHints code Script / notes
አማርኛ Amharic am Ethi
Αρχαία ελληνικά Ancient Greek grc Grek
অসমীয়া Assamese as Beng
Azərbaycan Azerbaijani az Latn
Azərbaycan (qədim yazı) Azerbaijani az-Cyrl Cyrl; old orthography
Euskara Basque eu Latn
Bosanski Bosnian bs Latn
မြန်မာ Burmese my Mymr
Cebuano Cebuano ceb Latn
ᏣᎳᎩ ᎦᏬᏂᎯᏍᏗ Cherokee chr Cher
dhivehi, dhivehi-bas Dhivehi dv Thaa
རྫོང་ཁ Dzonkha dz Tibt
Esperanto Esperanto eo Latn
Galego Galician gl Latn
ქართული Georgian ka Geor
Kreyòl Ayisyen Haitian Creole ht Latn
Gaeilge Irish ga Latn
Jawa Javanese jv Latn
Қазақ Kazakh kk Cyrl
Kirghiz Kirghiz ky Cyrl
Latine Latin la Latn
Malti Maltese mt Latn
Монгол Mongolian mn Cyrl
ଓଡ଼ିଆ Oriya or Orya
پښتو Pashto ps Arab
संस्कृतम् Sanskrit sa Deva
සිංහල Sinhala si Sinh
Swahili Swahili sw Latn
leššānā Suryāyā Syriac syr Syriac
བོད་སྐད་ Tibetan bo Tibt
ትግርኛ Tigirinya ti Ethi
اردو Urdu ur Arab
oʻzbekcha Uzbek uz Latn; Latin
oʻzbekcha Uzbek uz-Cyrl Cyrl; old orthography
Cymraeg Welsh cy Latn
IsiZulu Zulu zu Latn

マッピング言語

次の言語は別の言語コードにマッピングされるか、一般的な文字認識ツールにマッピングされます。

Language Language (English name) languageHints code Script / notes Mapped to
بهسا اچيه Acehnese ace Latn Latin script model
Lwo Acholi ach Latn Latin script model
Dangme Adangme ada Latn Latin script model
Akan Akan ak Latn Latin script model
Anicinâbemowin Algonquinian alg Latn Latin script model
Mapudungu Araucanian/Mapuche arn Latn Latin script model
Asturianu Asturian ast Latn Latin script model
Dene Athabaskan ath Latn Latin script model
Aymar aru Aymara ay Latn Latin script model
Bhāṣa Bali Balinese ban Latn Latin script model
Bamanankan Bambara bm Latn Latin script model
Narrow Bantu Bantu bnt Latn Latin script model
башҡорт теле Bashkir ba Cyrl Cyrillic script model
Toba–Batak Batak btk Latn Latin script model
Chibemba Bemba bem Latn Latin script model
Bikol Naga Bikol bik Latn Latin script model
Bichelamar Bislama bi Latn Latin script model
Brezhoneg Breton br Latn Latin script model
нохчийн мотт / noxçiyn mott Chechen ce Cyrl Cyrillic script model
汉语 Chinese zh-Hans Hans; Simplified; Mandarin zh
漢語 Chinese zh-Hant Hant; Traditional; Mandarin zh
普通話 Chinese zh-Hant-HK Hant; Mandarin; Hong Kong zh
Chahta' Choctaw cho Latn Latin script model
Чӑвашла Chuvash cv Cyrl Cyrillic script model
Cree–Montagnais–Naskapi Cree cr Latn Latin script model
Mvskoke Creek mus Latn Latin script model
qırımtatar tili, къырымтатар тили Crimean Tatar crh Latn Cyrillic script model
Dakhótiyapi, Dakȟótiyapi Dakota dak Latn Latin script model
Douala Duala dua Latn Latin script model
Ikɔ Efik Efik efi Latn Latin script model
English (British) English en-GB Latn; British en
Èʋegbe Ewe ee Latn Latin script model
føroyskt mál Faroese fo Latn Latin script model
Na Vosa Vakaviti Fijian fj Latn Latin script model
fɔ̀ngbè Fon fon Latn Latin script model
Français canadien French fr-CA Latn; Canadian fr
Fulani, Fulah, Peul Fulah ff Latn Latin script model
Ga gaa Latn Latin script model
Luganda Ganda lg Latn Latin script model
Basa Gayo Gayo gay Latn Latin script model
Kiribati Gilbertese gil Latn Latin script model
Gothic Gothic got Latn Latin script model
Guaraní Guarani gn Latn Latin script model
Harshen/Halshen Hausa هَرْشَن هَوْسَ Hausa ha Latn Latin script model
ʻŌlelo Hawaiʻi Hawaiian haw Latn Latin script model
Otjiherero Herero hz Latn Latin script model
Ilonggo Hiligaynon hil Latn Latin script model
Jaku Iban Iban iba Latn Latin script model
Asụsụ Igbo Igbo ig Latn Latin script model
Ilokano Iloko ilo Latn Latin script model
Taqbaylit Kabyle kab Latn Latin script model
Jingpho Kachin kac Latn Latin script model
Kalaallisut Kalaallisut kl Latn Latin script model
Kikamba Kamba kam Latn Latin script model
Kanuri Kanuri kr Latn Latin script model
Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى Kara-Kalpak kaa Cyrl/Latn Cyrillic script model
Ka Ktien Khasi Khasi kha Latn Latin script model
Gĩkũyũ Kikuyu ki Latn Latin script model
Kinyarwanda Kinyarwanda rw Latn Latin script model
коми кыв Komi kv Cyrl Cyrillic script model
Kikongo Kongo kg Latn Latin script model
Kosraean Kosraean kos Latn Latin script model
Oshikwanyama Kuanyama kj Latn Latin script model
Ngala Lingala ln Latn Latin script model
Plattdütsch, Plattdeutsch, Nedersaksisch Low German nds Latn Latin script model
siLozi Lozi loz Latn Latin script model
Kiluba Luba-Katanga lu Latn Latin script model
Dholuo Luo luo Latn Latin script model
Madhura, Basa Mathura, بَهاسَ مَدورا Madurese mad Latn Latin script model
Malagasy Malagasy mg Latn Latin script model
Mandinka, لغة مندنكا Mandingo man Latn Latin script model
Gaelg, Gailck Manx gv Latn Latin script model
Te reo Māori Maori mi Latn Latin script model
Ebon Marshallese mh Latn Latin script model
Mɛnde yia Mende men Latn Latin script model
Middle English Middle English enm Latn Latin script model
Mittelhochdeutsch Middle High German gmh Latn Latin script model
Baso Minangkabau, باسو مينڠكاباو Minangkabau min Latn Latin script model
Kanienʼkéha Mohawk moh Latn Latin script model
Nkundu Mongo lol Latn Latin script model
Nāhuatl Nahuatl nah Latn Latin script model
Diné bizaad Navajo nv Latn Latin script model
Ndonga Ndonga ng Latn Latin script model
ko e vagahau Niuē Niuean niu Latn Latin script model
Zimbabwe Ndebele North Ndebele nd Latn Latin script model
Sesotho sa Leboa Northern Sotho nso Latn Latin script model
Chichewa, Chinyanja Nyanja ny Latn Latin script model
Runyankore Nyankole nyn Latn Latin script model
Chitonga Nyasa Tonga tog Latn Latin script model
Appolo Nzima nzi Latn Latin script model
Occitan, lenga d'òc, provençal Occitan oc Latn Latin script model
Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ Ojibwa oj Latn Latin script model
Ænglisc, Englisc, Anglisc Old English ang Latn Latin script model
Franceis, François, Romanz Old French fro Latn Latin script model
Diutisk, Althochdeutsch Old High German goh Latn Latin script model
Dǫnsk tunga Old Norse non Latn Latin script model
Occitan ancian Old Provencal pro Latn Latin script model
ирон ӕвзаг Ossetic os Cyrl Cyrillic script model
Kapampangan Pampanga pam Latn Latin script model
Salitan Pangasinan Pangasinan pag Latn Latin script model
Papiamentu Papiamento pap Latn Latin script model
Português (Portugal) Portuguese pt-PT Latn; European pt
Kechua / Runa Simi Quechua qu Latn Latin script model
Rumantsch Romansh rm Latn Latin script model
Romani čhib Romany rom Latn Latin script model
Ikirundi Rundi rn Latn Latin script model
Sakha Sakha sah Cyrl Cyrillic script model
Gagana faʻa Sāmoa Samoan sm Latn Latin script model
yângâ tî sängö Sango sg Latn Latin script model
(Braid) Scots, Lallans, Doric Scots sco Latn Latin script model
Gàidhlig Scottish Gaelic gd Latn Latin script model
chiShona Shona sn Latn Latin script model
Songhay Songhai son Latn Latin script model
Sesotho Southern Sotho st Latn Latin script model
Español (Latinoamérica) Spanish es-419 Latn; Latin American es
ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda Sundanese su Latn Latin script model
siSwati Swati ss Latn Latin script model
Reo Tahiti Tahitian ty Latn Latin script model
тоҷикӣ Tajik tg Cyrl Cyrillic script model
татар теле Tatar tt Cyrl/Latn Cyrillic script model
KʌThemnɛ Temne tem Latn Latin script model
lea faka-Tonga Tongan to Latn Latin script model
Xitsonga Tsonga ts Latn Latin script model
Setswana Tswana tn Latn Latin script model
Türkmençe Turkmen tk Latn Cyrillic script model
удмурт кыл Udmurt udm Cyrl Cyrillic script model
Tshivenḓa Venda ve Latn Latin script model
Vod Votic vot Cyrl/Latn Cyrillic script model
Frysk Western Frisian fy Latn Latin script model
Wolof Wolof wo Latn Latin script model
isiXhosa Xhosa xh Latn Latin script model
Èdè Yorùbá Yoruba yo Latn Latin script model
Diidxazá Zapotec zap Latn Latin script model