OCR 言語のサポート

Cloud Vision API のテキスト認識機能では、多様な言語を検出でき、1 つの画像内の複数の言語を検出できます。

サービスに言語のヒントを提供することは必須ではありませんが、サービスで画像に使用されている言語の検出が困難な場合に行うことができます。

手書き OCR 一般提供のリリースに伴い、DOCUMENT_TEXT_DETECTION を使用する場合、手書き文字の含まれた画像には手書き languageHints フラグが不要になりました。

言語ヒント（省略可能）は、TEXT_DETECTION および DOCUMENT_TEXT_DETECTION リクエストに関して、リクエストの ImageContext 内に languageHints リストとして指定します。

各言語コードパラメータは一般に BCP-47 識別子で構成されています。このパラメータでは、言語-地域の形式が可能です。ここで、言語は第一言語を表し、地域（省略可能）は特定の言語の地域（通常は国の識別子）を表します。たとえば、中国語は中華人民共和国で使用される簡体中国語（zh-Hans）、または台湾で使用される繁体中国語（zh-Hant）で表されます。

テキスト認識機能には、次の 3 段階の言語サポートがあります。

サポート対象の言語は、優先して定期的にパフォーマンスを評価されます。
試験運用版の言語は開発が積極的に進められていますが、定期的に評価されません。
マッピング言語とは、別の言語コードや一般的な文字認識ツールにマッピングすることでサポートされる言語です。たとえば、「en-GB」はサポートされていますが、文字認識においては「en」と同様に扱われます。エンティティのロケールフィールドで正しいマッピング言語コードを返すよう最善を尽くしますが、マッピング言語は完全にサポートされている言語や試験運用でサポートされている言語よりも、類似した言語として誤って認識される可能性があります。

TEXT_DETECTION と DOCUMENT_TEXT_DETECTION でサポートされる言語のリスト（および関連する languageHint コード）は、以下のとおりです。

言語ヒントが空白の場合、最適な言語の自動検出を試みます。TEXT_DETECTION エンドポイントは、サポートされている言語のサブセットのみを自動検出します。一方、DOCUMENT_TEXT_DETECTION エンドポイントは、サポートされているすべての言語を自動検出します。

サポートされている言語

次の言語は優先され、定期的に評価されます。

機能別でフィルタするには、目的の言語を入力するか、プルダウンメニューから選択します。

言語	言語（日本語名）	`languageHints` コード	スクリプト	注
Afrikaans	アフリカーンス語	`af`	`Latn`
shqip	アルバニア語	`sq`	`Latn`
العربية	アラビア語	`ar`	`Arab`	現代標準
Հայ	アルメニア語	`hy`	`Armn`
беларуская	ベラルーシ語	`be`	`Cyrl`
বাংলা	ベンガル語	`bn`	`Beng`
български	ブルガリア語	`bg`	`Cyrl`
Català	カタロニア語	`ca`	`Latn`
普通话	中国語	`zh`	`Hans/Hant`
Hrvatski	クロアチア語	`hr`	`Latn`
Čeština	チェコ語	`cs`	`Latn`
Dansk	デンマーク語	`da`	`Latn`
Nederlands	オランダ語	`nl`	`Latn`
English	英語	`en`	`Latn`	米国
Eesti keel	エストニア語	`et`	`Latn`
Filipino	フィリピン語	`fil`	`Latn`
Suomi	フィンランド語	`fi`	`Latn`
Français	フランス語	`fr`	`Latn`	ヨーロッパ
Deutsch	ドイツ語	`de`	`Latn`
Ελληνικά	ギリシャ語	`el`	`Grek`
ગુજરાતી	グジャラト語	`gu`	`Gujr`
עברית	ヘブライ語	`iw`	`Hebr`
हिन्दी	ヒンディー語	`hi`	`Deva`
Magyar	ハンガリー語	`hu`	`Latn`
Íslenska	アイスランド語	`is`	`Latn`
Bahasa Indonesia	インドネシア語	`id`	`Latn`
Italiano	イタリア語	`it`	`Latn`
日本語	日本語	`ja`	`Jpan`
ಕನ್ನಡ	カンナダ語	`kn`	`Knda`
ភាសាខ្មែរ	クメール語	`km`	`Khmr`
한국어	韓国語	`ko`	`Kore`
ລາວ	ラオ語	`lo`	`Laoo`
Latviešu	ラトビア語	`lv`	`Latn`
Lietuvių	リトアニア語	`lt`	`Latn`
Македонски	マケドニア語	`mk`	`Cyrl`
Bahasa Melayu	マレー語	`ms`	`Latn`
മലയാളം	マラヤーラム語	`ml`	`Mlym`
मराठी	マラーティー語	`mr`	`Deva`
नेपाली	ネパール語	`ne`	`Deva`
Norsk	ノルウェー語	`no`	`Latn`	ノルウェー語（ブークモール）
فارسی	ペルシャ語	`fa`	`Arab`
Polski	ポーランド語	`pl`	`Latn`
Português	ポルトガル語	`pt`	`Latn`	ブラジル
ਪੰਜਾਬੀ	パンジャブ語	`pa`	`Guru`	グルムキー文字
Română	ルーマニア語	`ro`	`Latn`
Русский	ロシア語	`ru`	`Cyrl`
Русский (старая орфография)	ロシア語	`ru-PETR1708`	`Cyrl`	旧正書法
Српски	セルビア語	`sr`	`Cyrl`
Српски (латиница)	セルビア語	`sr-Latn`	`Latn`
Slovenčina	スロバキア語	`sk`	`Latn`
Slovenščina	スロベニア語	`sl`	`Latn`
Español	スペイン語	`es`	`Latn`	ヨーロッパ
Svenska	スウェーデン語	`sv`	`Latn`
Tagalog	タガログ語	`tl`	`Latn`
தமிழ்	タミル語	`ta`	`Taml`
తెలుగు	テルグ語	`te`	`Telu`
ไทย	タイ語	`th`	`Thai`
Türkçe	トルコ語	`tr`	`Latn`
Українська	ウクライナ語	`uk`	`Cyrl`
Tiếng Việt	ベトナム語	`vi`	`Latn`
Yiddish	イディッシュ語	`yi`	`Hebr`

試験運用版の言語

次の言語は現在開発が積極的に進められている最中ですが、まだ定期的に評価されていません。

言語	言語（日本語名）	`languageHints` コード	スクリプト	注
አማርኛ	アムハラ語	`am`	`Ethi`
Αρχαία ελληνικά	古代ギリシャ語	`grc`	`Grek`
অসমীয়া	アッサム語	`as`	`Beng`
Azərbaycan	アゼルバイジャン語	`az`	`Latn`
Azərbaycan (qədim yazı)	アゼルバイジャン語	`az-Cyrl`	`Cyrl`	旧正書法
Euskara	バスク語	`eu`	`Latn`
Bosanski	ボスニア語	`bs`	`Latn`
မြန်မာ	ビルマ語	`my`	`Mymr`
Cebuano	セブ語	`ceb`	`Latn`
ᏣᎳᎩ ᎦᏬᏂᎯᏍᏗ	チェロキー語	`chr`	`Cher`
dhivehi, dhivehi-bas	ディベヒ語	`dv`	`Thaa`
རྫོང་ཁ	ゾンカ語	`dz`	`Tibt`
Esperanto	エスペラント語	`eo`	`Latn`
Galego	ガリシア語	`gl`	`Latn`
ქართული	ジョージア語	`ka`	`Geor`
Kreyòl Ayisyen	クレオール語（ハイチ）	`ht`	`Latn`
Gaeilge	アイルランド語	`ga`	`Latn`
Jawa	ジャワ語	`jv`	`Latn`
Қазақ	カザフ語	`kk`	`Cyrl`
Kirghiz	キルギス語	`ky`	`Cyrl`
Latine	ラテン語	`la`	`Latn`
Malti	マルタ語	`mt`	`Latn`
Монгол	モンゴル語	`mn`	`Cyrl`
ଓଡ଼ିଆ	オリヤ語	`or`	`Orya`
پښتو	パシュト語	`ps`	`Arab`
संस्कृतम्	サンスクリット語	`sa`	`Deva`
සිංහල	シンハラ語	`si`	`Sinh`
Swahili	スワヒリ語	`sw`	`Latn`
leššānā Suryāyā	シリア語	`syr`	`Syriac`
བོད་སྐད་	チベット語	`bo`	`Tibt`
ትግርኛ	ティグリニャ語	`ti`	`Ethi`
اردو	ウルドゥー語	`ur`	`Arab`
oʻzbekcha	ウズベク語	`uz`	`Latn`	ラテン語
oʻzbekcha	ウズベク語	`uz-Cyrl`	`Cyrl`	旧正書法
Cymraeg	ウェールズ語	`cy`	`Latn`
IsiZulu	ズールー語	`zu`	`Latn`

マッピング言語

次の言語は、別の言語コードにマッピングされるか、一般的な文字認識ツールにマッピングされます。

言語	言語（日本語名）	`languageHints` コード	スクリプト	注
بهسا اچيه	アチェ語	`ace`	`Latn`	ラテン文字モデル
Lwo	アチョリ語	`ach`	`Latn`	ラテン文字モデル
Dangme	アダングメ語	`ada`	`Latn`	ラテン文字モデル
Akan	アカン語	`ak`	`Latn`	ラテン文字モデル
Anicinâbemowin	アルゴンキン語	`alg`	`Latn`	ラテン文字モデル
Mapudungu	アラウカニア語 / マプチェ語	`arn`	`Latn`	ラテン文字モデル
Asturianu	アストゥリアス語	`ast`	`Latn`	ラテン文字モデル
Dene	アサバスカ語	`ath`	`Latn`	ラテン文字モデル
Aymar aru	アイマラ語	`ay`	`Latn`	ラテン文字モデル
Bhāṣa Bali	バリ文字	`ban`	`Latn`	ラテン文字モデル
Bamanankan	バンバラ語	`bm`	`Latn`	ラテン文字モデル
Narrow Bantu	バントゥー語	`bnt`	`Latn`	ラテン文字モデル
башҡорт теле	バシキール語	`ba`	`Cyrl`	キリル文字モデル
Toba–Batak	バタク文字	`btk`	`Latn`	ラテン文字モデル
Chibemba	ベンバ語	`bem`	`Latn`	ラテン文字モデル
Bikol Naga	ビコール語	`bik`	`Latn`	ラテン文字モデル
Bichelamar	ビスラマ語	`bi`	`Latn`	ラテン文字モデル
Brezhoneg	ブルトン語	`br`	`Latn`	ラテン文字モデル
нохчийн мотт / noxçiyn mott	チェチェン語	`ce`	`Cyrl`	キリル文字モデル
汉语	中国語（標準語、簡体）	`zh-Hans`	`Hans`	中国語モデル
漢語	中国語（標準語、繁体）	`zh-Hant`	`Hant`	中国語モデル
普通話	中国語（標準語、香港）	`zh-Hant-HK`	`Hant`	中国語モデル
Chahta'	チョクトー語	`cho`	`Latn`	ラテン文字モデル
Чӑвашла	チュヴァシ語	`cv`	`Cyrl`	キリル文字モデル
Cree–Montagnais–Naskapi	クリー語	`cr`	`Latn`	ラテン文字モデル
Mvskoke	クリーク語	`mus`	`Latn`	ラテン文字モデル
qırımtatar tili, къырымтатар тили	クリミアタタール語	`crh`	`Latn`	キリル文字モデル
Dakhótiyapi, Dakȟótiyapi	ダコタ語	`dak`	`Latn`	ラテン文字モデル
Douala	ドゥアラ語	`dua`	`Latn`	ラテン文字モデル
Ikɔ Efik	エフィク語	`efi`	`Latn`	ラテン文字モデル
English (British)	英語（英国）	`en-GB`	`Latn`	ラテン文字モデル
Èʋegbe	エウェ語	`ee`	`Latn`	ラテン文字モデル
føroyskt mál	フェロー語	`fo`	`Latn`	ラテン文字モデル
Na Vosa Vakaviti	フィジー語	`fj`	`Latn`	ラテン文字モデル
fɔ̀ngbè	フォン語	`fon`	`Latn`	ラテン文字モデル
Français canadien	フランス語（カナダ）	`fr-CA`	`Latn`	ラテン文字モデル
Fulani, Fulah, Peul	フラニ語	`ff`	`Latn`	ラテン文字モデル
Gã	ガ語	`gaa`	`Latn`	ラテン文字モデル
Luganda	ガンダ語	`lg`	`Latn`	ラテン文字モデル
Basa Gayo	ガヨ語	`gay`	`Latn`	ラテン文字モデル
Kiribati	キリバス語	`gil`	`Latn`	ラテン文字モデル
Gothic	ゴート文字	`got`	`Latn`	ラテン文字モデル
Guaraní	グアラニ語	`gn`	`Latn`	ラテン文字モデル
Harshen/Halshen Hausa هَرْشَن هَوْسَ	ハウサ語	`ha`	`Latn`	ラテン文字モデル
ʻŌlelo Hawaiʻi	ハワイ語	`haw`	`Latn`	ラテン文字モデル
Otjiherero	ヘレロ語	`hz`	`Latn`	ラテン文字モデル
Ilonggo	ヒリガイノン語	`hil`	`Latn`	ラテン文字モデル
Jaku Iban	イバン語	`iba`	`Latn`	ラテン文字モデル
Asụsụ Igbo	イボ語	`ig`	`Latn`	ラテン文字モデル
Ilokano	イロカノ語	`ilo`	`Latn`	ラテン文字モデル
Taqbaylit	カビル語	`kab`	`Latn`	ラテン文字モデル
Jingpho	カチン語	`kac`	`Latn`	ラテン文字モデル
Kalaallisut	カラーリット語	`kl`	`Latn`	ラテン文字モデル
Kikamba	カンバ語	`kam`	`Latn`	ラテン文字モデル
Kanuri	カヌリ語	`kr`	`Latn`	ラテン文字モデル
Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى	カラカルパク語	`kaa`	`Cyrl/Latn`	キリル文字モデル
Ka Ktien Khasi	カーシ語	`kha`	`Latn`	ラテン文字モデル
Gĩkũyũ	キクユ語	`ki`	`Latn`	ラテン文字モデル
Kinyarwanda	キニヤルワンダ語	`rw`	`Latn`	ラテン文字モデル
коми кыв	コミ語	`kv`	`Cyrl`	キリル文字モデル
Kikongo	コンゴ語	`kg`	`Latn`	ラテン文字モデル
Kosraean	コスラエ語	`kos`	`Latn`	ラテン文字モデル
Oshikwanyama	クワニャマ語	`kj`	`Latn`	ラテン文字モデル
Ngala	リンガラ語	`ln`	`Latn`	ラテン文字モデル
Plattdütsch, Plattdeutsch, Nedersaksisch	低地ドイツ語	`nds`	`Latn`	ラテン文字モデル
siLozi	ロジ語	`loz`	`Latn`	ラテン文字モデル
Kiluba	ルバカタンガ語	`lu`	`Latn`	ラテン文字モデル
Dholuo	ルオ語	`luo`	`Latn`	ラテン文字モデル
Madhura, Basa Mathura, بَهاسَ مَدورا	マドゥラ語	`mad`	`Latn`	ラテン文字モデル
Malagasy	マラガシ語	`mg`	`Latn`	ラテン文字モデル
Mandinka, لغة مندنكا	マンディンゴ語	`man`	`Latn`	ラテン文字モデル
Gaelg, Gailck	マン島語	`gv`	`Latn`	ラテン文字モデル
Te reo Māori	マオリ語	`mi`	`Latn`	ラテン文字モデル
Ebon	マーシャル語	`mh`	`Latn`	ラテン文字モデル
Mɛnde yia	メンデ語	`men`	`Latn`	ラテン文字モデル
Middle English	中英語	`enm`	`Latn`	ラテン文字モデル
Mittelhochdeutsch	中高ドイツ語	`gmh`	`Latn`	ラテン文字モデル
Baso Minangkabau, باسو مينڠكاباو	ミナンカバウ語	`min`	`Latn`	ラテン文字モデル
Kanienʼkéha	モホーク語	`moh`	`Latn`	ラテン文字モデル
Nkundu	モンゴ語	`lol`	`Latn`	ラテン文字モデル
Nāhuatl	ナワトル語	`nah`	`Latn`	ラテン文字モデル
Diné bizaad	ナヴァホ語	`nv`	`Latn`	ラテン文字モデル
Ndonga	ンドンガ語	`ng`	`Latn`	ラテン文字モデル
ko e vagahau Niuē	ニウエ語	`niu`	`Latn`	ラテン文字モデル
Zimbabwe Ndebele	北ンデベレ語	`nd`	`Latn`	ラテン文字モデル
Sesotho sa Leboa	北ソト語	`nso`	`Latn`	ラテン文字モデル
Chichewa, Chinyanja	ニャンジャ語	`ny`	`Latn`	ラテン文字モデル
Runyankore	ニャンコレ語	`nyn`	`Latn`	ラテン文字モデル
Chitonga	トンガ語（ニアサ）	`tog`	`Latn`	ラテン文字モデル
Appolo	ンジマ語	`nzi`	`Latn`	ラテン文字モデル
Occitan, lenga d'òc, provençal	オック語	`oc`	`Latn`	ラテン文字モデル
Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ	オジブワ語	`oj`	`Latn`	ラテン文字モデル
Ænglisc, Englisc, Anglisc	古英語	`ang`	`Latn`	ラテン文字モデル
Franceis, François, Romanz	古フランス語	`fro`	`Latn`	ラテン文字モデル
Diutisk, Althochdeutsch	古高ドイツ語	`goh`	`Latn`	ラテン文字モデル
Dǫnsk tunga	古ノルド語	`non`	`Latn`	ラテン文字モデル
Occitan ancian	古プロヴァンス語	`pro`	`Latn`	ラテン文字モデル
ирон ӕвзаг	オセット語	`os`	`Cyrl`	キリル文字モデル
Kapampangan	パンパンガ	`pam`	`Latn`	ラテン文字モデル
Salitan Pangasinan	パンガシナン	`pag`	`Latn`	ラテン文字モデル
Papiamentu	パピアメント語	`pap`	`Latn`	ラテン文字モデル
Português (Portugal)	ポルトガル語（ヨーロッパ）	`pt-PT`	`Latn`	ラテン文字モデル
Kechua / Runa Simi	ケチュア語	`qu`	`Latn`	ラテン文字モデル
Rumantsch	ロマンシュ語	`rm`	`Latn`	ラテン文字モデル
Romani čhib	ロマ語	`rom`	`Latn`	ラテン文字モデル
Ikirundi	ルンディ語	`rn`	`Latn`	ラテン文字モデル
Sakha	サカ語	`sah`	`Cyrl`	キリル文字モデル
Gagana faʻa Sāmoa	サモア語	`sm`	`Latn`	ラテン文字モデル
yângâ tî sängö	サンゴ語	`sg`	`Latn`	ラテン文字モデル
(Braid) Scots, Lallans, Doric	スコットランド語	`sco`	`Latn`	ラテン文字モデル
Gàidhlig	スコットランドゲール語	`gd`	`Latn`	ラテン文字モデル
chiShona	ショナ語	`sn`	`Latn`	ラテン文字モデル
Songhay	ソンガイ語	`son`	`Latn`	ラテン文字モデル
Sesotho	南部ソト語	`st`	`Latn`	ラテン文字モデル
Español (Latinoamérica)	スペイン語（ラテンアメリカ）	`es-419`	`Latn`	ラテン文字モデル
ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda	スンダ文字	`su`	`Latn`	ラテン文字モデル
siSwati	スワート語	`ss`	`Latn`	ラテン文字モデル
Reo Tahiti	タヒチ語	`ty`	`Latn`	ラテン文字モデル
тоҷикӣ	タジク語	`tg`	`Cyrl`	キリル文字モデル
татар теле	タタール語	`tt`	`Cyrl/Latn`	キリル文字モデル
KʌThemnɛ	テムネ語	`tem`	`Latn`	ラテン文字モデル
lea faka-Tonga	トンガ語	`to`	`Latn`	ラテン文字モデル
Xitsonga	ツォンガ語	`ts`	`Latn`	ラテン文字モデル
Setswana	ツワナ語	`tn`	`Latn`	ラテン文字モデル
Türkmençe	トルクメン語	`tk`	`Latn`	キリル文字モデル
удмурт кыл	ウドムルト語	`udm`	`Cyrl`	キリル文字モデル
Tshivenḓa	ヴェンダ語	`ve`	`Latn`	ラテン文字モデル
Vod	ヴォート語	`vot`	`Cyrl/Latn`	キリル文字モデル
Frysk	西フリジア語	`fy`	`Latn`	ラテン文字モデル
Wolof	ウォロフ語	`wo`	`Latn`	ラテン文字モデル
isiXhosa	コーサ語	`xh`	`Latn`	ラテン文字モデル
Èdè Yorùbá	ヨルバ語	`yo`	`Latn`	ラテン文字モデル
Diidxazá	サポテカ語	`zap`	`Latn`	ラテン文字モデル

手書き文字のスクリプト

手書き入力認識でサポートされているスクリプトは次のとおりです。各スクリプトを使用する言語については、上の言語表を参照してください。

スクリプト	名前	サポートレベル
`Beng`	ベンガル語	試験運用版
`Cyrl`	キリル文字	試験運用版
`Deva`	デバナーガリ文字	試験運用版
`Grek`	ギリシャ語	試験運用版
`Hani`	中国語	試験運用版
`Jpan`	日本語	サポート対象
`Kore`	韓国語	サポート対象
`Latn`	ラテン語	サポート対象
`vi`	ベトナム語	試験運用版