OCR 言語のサポート

Cloud Vision API のテキスト認識機能では、多様な言語を検出でき、1 つの画像内の複数の言語を検出できます。

サービスに言語のヒントを提供することは必須ではありませんが、サービスで画像に使用されている言語の検出が困難な場合に行うことができます。

手書き OCR 一般提供のリリースに伴い、DOCUMENT_TEXT_DETECTION を使用する場合、手書き文字の含まれた画像には手書き languageHints フラグが不要になりました。

言語ヒント(省略可能)は、TEXT_DETECTION および DOCUMENT_TEXT_DETECTION リクエストに関して、リクエストの ImageContext 内に languageHints リストとして指定します。

各言語コード パラメータは一般に BCP-47 識別子で構成されています。このパラメータでは、言語-地域の形式が可能です。ここで、言語は第一言語を表し、地域(省略可能)は特定の言語の地域(通常は国の識別子)を表します。たとえば、中国語は中華人民共和国で使用される簡体中国語(zh-Hans)、または台湾で使用される繁体中国語(zh-Hant)で表されます。

テキスト認識機能には、次の 3 段階の言語サポートがあります。

  1. サポート対象の言語は、優先して定期的にパフォーマンスを評価されます。
  2. 試験運用版の言語は開発が積極的に進められていますが、定期的に評価されません。
  3. マッピング言語とは、別の言語コードや一般的な文字認識ツールにマッピングすることでサポートされる言語です。たとえば、「en-GB」はサポートされていますが、文字認識においては「en」と同様に扱われます。エンティティのロケール フィールドで正しいマッピング言語コードを返すよう最善を尽くしますが、マッピング言語は完全にサポートされている言語や試験運用でサポートされている言語よりも、類似した言語として誤って認識される可能性があります。

TEXT_DETECTIONDOCUMENT_TEXT_DETECTION でサポートされる言語のリスト(および関連する languageHint コード)は、以下のとおりです。

言語ヒントが空白の場合、最適な言語の自動検出を試みます。TEXT_DETECTION エンドポイントは、サポートされている言語のサブセットのみを自動検出します。一方、DOCUMENT_TEXT_DETECTION エンドポイントは、サポートされているすべての言語を自動検出します。

サポートされている言語

次の言語は優先され、定期的に評価されます。

機能別でフィルタするには、目的の言語を入力するか、プルダウン メニューから選択します。

言語 言語(日本語名) languageHints コード スクリプト
Afrikaans アフリカーンス語 af Latn
shqip アルバニア語 sq Latn
العربية アラビア語 ar Arab 現代標準
Հայ アルメニア語 hy Armn
беларуская ベラルーシ語 be Cyrl
বাংলা ベンガル語 bn Beng
български ブルガリア語 bg Cyrl
Català カタロニア語 ca Latn
普通话 中国語 zh Hans/Hant
Hrvatski クロアチア語 hr Latn
Čeština チェコ語 cs Latn
Dansk デンマーク語 da Latn
Nederlands オランダ語 nl Latn
English 英語 en Latn 米国
Eesti keel エストニア語 et Latn
Filipino フィリピン語 fil Latn
Suomi フィンランド語 fi Latn
Français フランス語 fr Latn ヨーロッパ
Deutsch ドイツ語 de Latn
Ελληνικά ギリシャ語 el Grek
ગુજરાતી グジャラート文字 gu Gujr
עברית ヘブライ語 iw Hebr
हिन्दी ヒンディー語 hi Deva
Magyar ハンガリー語 hu Latn
Íslenska アイスランド語 is Latn
Bahasa Indonesia インドネシア語 id Latn
Italiano イタリア語 it Latn
日本語 日本語 ja Jpan
ಕನ್ನಡ カンナダ語 kn Knda
ភាសាខ្មែរ クメール語 km Khmr
한국어 韓国語 ko Kore
ລາວ ラオ語 lo Laoo
Latviešu ラトビア語 lv Latn
Lietuvių リトアニア語 lt Latn
Македонски マケドニア語 mk Cyrl
Bahasa Melayu マレー語 ms Latn
മലയാളം マラヤーラム文字 ml Mlym
मराठी マラーティー語 mr Deva
नेपाली ネパール語 ne Deva
Norsk ノルウェー語 no Latn ノルウェー語(ブークモール)
فارسی ペルシャ語 fa Arab
Polski ポーランド語 pl Latn
Português ポルトガル語 pt Latn ブラジル
ਪੰਜਾਬੀ パンジャブ語 pa Guru グルムキー文字
Română ルーマニア語 ro Latn
Русский ロシア語 ru Cyrl
Русский (старая орфография) ロシア語 ru-PETR1708 Cyrl 旧正書法
Српски セルビア語 sr Cyrl
Српски (латиница) セルビア語 sr-Latn Latn
Slovenčina スロバキア語 sk Latn
Slovenščina スロベニア語 sl Latn
Español スペイン語 es Latn ヨーロッパ
Svenska スウェーデン語 sv Latn
Tagalog タガログ語 tl Latn
தமிழ் タミル語 ta Taml
తెలుగు テルグ語 te Telu
ไทย タイ語 th Thai
Türkçe トルコ語 tr Latn
Українська ウクライナ語 uk Cyrl
Tiếng Việt ベトナム語 vi Latn
Yiddish イディッシュ語 yi Hebr

試験運用版の言語

次の言語は現在開発が積極的に進められている最中ですが、まだ定期的に評価されていません。

言語 言語(日本語名) languageHints コード スクリプト
አማርኛ アムハラ語 am Ethi
Αρχαία ελληνικά 古代ギリシャ語 grc Grek
অসমীয়া アッサム語 as Beng
Azərbaycan アゼルバイジャン語 az Latn
Azərbaycan (qədim yazı) アゼルバイジャン語 az-Cyrl Cyrl 旧正書法
Euskara バスク語 eu Latn
Bosanski ボスニア語 bs Latn
မြန်မာ ビルマ語 my Mymr
Cebuano セブ語 ceb Latn
ᏣᎳᎩ ᎦᏬᏂᎯᏍᏗ チェロキー語 chr Cher
dhivehi, dhivehi-bas ディベヒ語 dv Thaa
རྫོང་ཁ ゾンカ語 dz Tibt
Esperanto エスペラント語 eo Latn
Galego ガリシア語 gl Latn
ქართული ジョージア語 ka Geor
Kreyòl Ayisyen クレオール語(ハイチ) ht Latn
Gaeilge アイルランド語 ga Latn
Jawa ジャワ語 jv Latn
Қазақ カザフ語 kk Cyrl
Kirghiz キルギス語 ky Cyrl
Latine ラテン語 la Latn
Malti マルタ語 mt Latn
Монгол モンゴル語 mn Cyrl
ଓଡ଼ିଆ オリヤ語 or Orya
پښتو パシュト語 ps Arab
संस्कृतम् サンスクリット語 sa Deva
සිංහල シンハラ語 si Sinh
Swahili スワヒリ語 sw Latn
leššānā Suryāyā シリア語 syr Syriac
བོད་སྐད་ チベット語 bo Tibt
ትግርኛ ティグリニャ語 ti Ethi
اردو ウルドゥー語 ur Arab
oʻzbekcha ウズベク語 uz Latn ラテン語
oʻzbekcha ウズベク語 uz-Cyrl Cyrl 旧正書法
Cymraeg ウェールズ語 cy Latn
IsiZulu ズールー語 zu Latn

マッピング言語

次の言語は、別の言語コードにマッピングされるか、一般的な文字認識ツールにマッピングされます。

言語 言語(日本語名) languageHints コード スクリプト
بهسا اچيه アチェ語 ace Latn ラテン文字モデル
Lwo アチョリ語 ach Latn ラテン文字モデル
Dangme アダングメ語 ada Latn ラテン文字モデル
Akan アカン語 ak Latn ラテン文字モデル
Anicinâbemowin アルゴンキン語 alg Latn ラテン文字モデル
Mapudungu アラウカニア語 / マプチェ語 arn Latn ラテン文字モデル
Asturianu アストゥリアス語 ast Latn ラテン文字モデル
Dene アサバスカ語 ath Latn ラテン文字モデル
Aymar aru アイマラ語 ay Latn ラテン文字モデル
Bhāṣa Bali バリ文字 ban Latn ラテン文字モデル
Bamanankan バンバラ語 bm Latn ラテン文字モデル
Narrow Bantu バントゥー語 bnt Latn ラテン文字モデル
башҡорт теле バシキール語 ba Cyrl キリル文字モデル
Toba–Batak バタク文字 btk Latn ラテン文字モデル
Chibemba ベンバ語 bem Latn ラテン文字モデル
Bikol Naga ビコール語 bik Latn ラテン文字モデル
Bichelamar ビスラマ語 bi Latn ラテン文字モデル
Brezhoneg ブルトン語 br Latn ラテン文字モデル
нохчийн мотт / noxçiyn mott チェチェン語 ce Cyrl キリル文字モデル
汉语 中国語(標準語、簡体) zh-Hans Hans 中国語モデル
漢語 中国語(標準語、繁体) zh-Hant Hant 中国語モデル
普通話 中国語(標準語、香港) zh-Hant-HK Hant 中国語モデル
Chahta' チョクトー語 cho Latn ラテン文字モデル
Чӑвашла チュヴァシ語 cv Cyrl キリル文字モデル
Cree–Montagnais–Naskapi クリー語 cr Latn ラテン文字モデル
Mvskoke クリーク語 mus Latn ラテン文字モデル
qırımtatar tili, къырымтатар тили クリミア タタール語 crh Latn キリル文字モデル
Dakhótiyapi, Dakȟótiyapi ダコタ語 dak Latn ラテン文字モデル
Douala ドゥアラ語 dua Latn ラテン文字モデル
Ikɔ Efik エフィク語 efi Latn ラテン文字モデル
English (British) 英語(英国) en-GB Latn ラテン文字モデル
Èʋegbe エウェ語 ee Latn ラテン文字モデル
føroyskt mál フェロー語 fo Latn ラテン文字モデル
Na Vosa Vakaviti フィジー語 fj Latn ラテン文字モデル
fɔ̀ngbè フォン語 fon Latn ラテン文字モデル
Français canadien フランス語(カナダ) fr-CA Latn ラテン文字モデル
Fulani, Fulah, Peul フラニ語 ff Latn ラテン文字モデル
ガ語 gaa Latn ラテン文字モデル
Luganda ガンダ語 lg Latn ラテン文字モデル
Basa Gayo ガヨ語 gay Latn ラテン文字モデル
Kiribati キリバス語 gil Latn ラテン文字モデル
Gothic ゴート文字 got Latn ラテン文字モデル
Guaraní グアラニ語 gn Latn ラテン文字モデル
Harshen/Halshen Hausa هَرْشَن هَوْسَ ハウサ語 ha Latn ラテン文字モデル
ʻŌlelo Hawaiʻi ハワイ語 haw Latn ラテン文字モデル
Otjiherero ヘレロ語 hz Latn ラテン文字モデル
Ilonggo ヒリガイノン語 hil Latn ラテン文字モデル
Jaku Iban イバン語 iba Latn ラテン文字モデル
Asụsụ Igbo イボ語 ig Latn ラテン文字モデル
Ilokano イロカノ語 ilo Latn ラテン文字モデル
Taqbaylit カビル語 kab Latn ラテン文字モデル
Jingpho カチン語 kac Latn ラテン文字モデル
Kalaallisut カラーリット語 kl Latn ラテン文字モデル
Kikamba カンバ語 kam Latn ラテン文字モデル
Kanuri カヌリ語 kr Latn ラテン文字モデル
Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى カラカルパク語 kaa Cyrl/Latn キリル文字モデル
Ka Ktien Khasi カーシ語 kha Latn ラテン文字モデル
Gĩkũyũ キクユ語 ki Latn ラテン文字モデル
Kinyarwanda キニヤルワンダ語 rw Latn ラテン文字モデル
коми кыв コミ語 kv Cyrl キリル文字モデル
Kikongo コンゴ語 kg Latn ラテン文字モデル
Kosraean コスラエ語 kos Latn ラテン文字モデル
Oshikwanyama クワニャマ語 kj Latn ラテン文字モデル
Ngala リンガラ語 ln Latn ラテン文字モデル
Plattdütsch, Plattdeutsch, Nedersaksisch 低地ドイツ語 nds Latn ラテン文字モデル
siLozi ロジ語 loz Latn ラテン文字モデル
Kiluba ルバカタンガ語 lu Latn ラテン文字モデル
Dholuo ルオ語 luo Latn ラテン文字モデル
Madhura, Basa Mathura, بَهاسَ مَدورا マドゥラ語 mad Latn ラテン文字モデル
Malagasy マラガシ語 mg Latn ラテン文字モデル
Mandinka, لغة مندنكا マンディンゴ語 man Latn ラテン文字モデル
Gaelg, Gailck マン島語 gv Latn ラテン文字モデル
Te reo Māori マオリ語 mi Latn ラテン文字モデル
Ebon マーシャル語 mh Latn ラテン文字モデル
Mɛnde yia メンデ語 men Latn ラテン文字モデル
Middle English 中英語 enm Latn ラテン文字モデル
Mittelhochdeutsch 中高ドイツ語 gmh Latn ラテン文字モデル
Baso Minangkabau, باسو مينڠكاباو ミナンカバウ語 min Latn ラテン文字モデル
Kanienʼkéha モホーク語 moh Latn ラテン文字モデル
Nkundu モンゴ語 lol Latn ラテン文字モデル
Nāhuatl ナワトル語 nah Latn ラテン文字モデル
Diné bizaad ナヴァホ語 nv Latn ラテン文字モデル
Ndonga ンドンガ語 ng Latn ラテン文字モデル
ko e vagahau Niuē ニウエ語 niu Latn ラテン文字モデル
Zimbabwe Ndebele 北ンデベレ語 nd Latn ラテン文字モデル
Sesotho sa Leboa 北ソト語 nso Latn ラテン文字モデル
Chichewa, Chinyanja ニャンジャ語 ny Latn ラテン文字モデル
Runyankore ニャンコレ語 nyn Latn ラテン文字モデル
Chitonga トンガ語(ニアサ) tog Latn ラテン文字モデル
Appolo ンジマ語 nzi Latn ラテン文字モデル
Occitan, lenga d'òc, provençal オック語 oc Latn ラテン文字モデル
Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ オジブワ語 oj Latn ラテン文字モデル
Ænglisc, Englisc, Anglisc 古英語 ang Latn ラテン文字モデル
Franceis, François, Romanz 古フランス語 fro Latn ラテン文字モデル
Diutisk, Althochdeutsch 古高ドイツ語 goh Latn ラテン文字モデル
Dǫnsk tunga 古ノルド語 non Latn ラテン文字モデル
Occitan ancian 古プロヴァンス語 pro Latn ラテン文字モデル
ирон ӕвзаг オセット語 os Cyrl キリル文字モデル
Kapampangan パンパンガ pam Latn ラテン文字モデル
Salitan Pangasinan パンガシナン pag Latn ラテン文字モデル
Papiamentu パピアメント語 pap Latn ラテン文字モデル
Português (Portugal) ポルトガル語(ヨーロッパ) pt-PT Latn ラテン文字モデル
Kechua / Runa Simi ケチュア語 qu Latn ラテン文字モデル
Rumantsch ロマンシュ語 rm Latn ラテン文字モデル
Romani čhib ロマ語 rom Latn ラテン文字モデル
Ikirundi ルンディ語 rn Latn ラテン文字モデル
Sakha サカ語 sah Cyrl キリル文字モデル
Gagana faʻa Sāmoa サモア語 sm Latn ラテン文字モデル
yângâ tî sängö サンゴ語 sg Latn ラテン文字モデル
(Braid) Scots, Lallans, Doric スコットランド語 sco Latn ラテン文字モデル
Gàidhlig スコットランド ゲール語 gd Latn ラテン文字モデル
chiShona ショナ語 sn Latn ラテン文字モデル
Songhay ソンガイ語 son Latn ラテン文字モデル
Sesotho 南部ソト語 st Latn ラテン文字モデル
Español (Latinoamérica) スペイン語(ラテンアメリカ) es-419 Latn ラテン文字モデル
ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda スンダ文字 su Latn ラテン文字モデル
siSwati スワート語 ss Latn ラテン文字モデル
Reo Tahiti タヒチ語 ty Latn ラテン文字モデル
тоҷикӣ タジク語 tg Cyrl キリル文字モデル
татар теле タタール語 tt Cyrl/Latn キリル文字モデル
KʌThemnɛ テムネ語 tem Latn ラテン文字モデル
lea faka-Tonga トンガ語 to Latn ラテン文字モデル
Xitsonga ツォンガ語 ts Latn ラテン文字モデル
Setswana ツワナ語 tn Latn ラテン文字モデル
Türkmençe トルクメン語 tk Latn キリル文字モデル
удмурт кыл ウドムルト語 udm Cyrl キリル文字モデル
Tshivenḓa ヴェンダ語 ve Latn ラテン文字モデル
Vod ヴォート語 vot Cyrl/Latn キリル文字モデル
Frysk 西フリジア語 fy Latn ラテン文字モデル
Wolof ウォロフ語 wo Latn ラテン文字モデル
isiXhosa コーサ語 xh Latn ラテン文字モデル
Èdè Yorùbá ヨルバ語 yo Latn ラテン文字モデル
Diidxazá サポテカ語 zap Latn ラテン文字モデル

手書き文字のスクリプト

手書き入力認識でサポートされているスクリプトは次のとおりです。各スクリプトを使用する言語については、上の言語表を参照してください。

スクリプト 名前 サポート レベル
Beng ベンガル語 試験運用版
Cyrl キリル文字 試験運用版
Deva デバナーガリ文字 試験運用版
Grek ギリシャ語 試験運用版
Hani 中国語 試験運用版
Jpan 日本語 サポート対象
Kore 韓国語 サポート対象
Latn ラテン語 サポート対象
vi ベトナム語 試験運用版