OCR 言語のサポート

Cloud Vision API のテキスト認識機能では、多様な言語を検出でき、1 つの画像内の複数の言語を検出できます。

サービスに言語のヒントを提供することは必須ではありませんが、サービスで画像に使用されている言語の検出が困難な場合に行うことができます。

手書き OCR 一般提供のリリースに伴い、DOCUMENT_TEXT_DETECTION を使用する場合、手書き文字の含まれた画像には手書き languageHints フラグが不要になりました。

言語ヒント(省略可能)は、TEXT_DETECTION および DOCUMENT_TEXT_DETECTION リクエストに関して、リクエストの ImageContext 内に languageHints リストとして指定します。

各言語コード パラメータは一般に BCP-47 識別子で構成されています。このパラメータでは、言語-地域の形式が可能です。ここで、言語は第一言語を表し、地域(省略可能)は特定の言語の地域(通常は国の識別子)を表します。たとえば、中国語は中華人民共和国で使用される簡体中国語(zh-Hans)、または台湾で使用される繁体中国語(zh-Hant)で表されます。

テキスト認識機能には、次の 3 段階の言語サポートがあります。

  1. サポート対象言語は、優先して定期的にパフォーマンスを評価されます。
  2. 試験運用言語は開発が積極的に進められていますが、定期的に評価されません。
  3. マッピング言語とは、別の言語コードや一般的な文字認識ツールにマッピングすることでサポートされる言語です。たとえば、「en-GB」はサポートされていますが、文字認識においては「en」と同様に扱われます。エンティティのロケール フィールドで正しいマッピング言語コードを返すよう最善を尽くしますが、マッピング言語は完全にサポートされている言語や試験運用でサポートされている言語よりも、類似した言語として誤って認識される可能性があります。

TEXT_DETECTIONDOCUMENT_TEXT_DETECTION でサポートされる言語のリスト(および関連する languageHint コード)は、以下のとおりです。

言語ヒントが空白の場合、最適な言語の自動検出を試みます。TEXT_DETECTION エンドポイントは、サポートされている言語のサブセットのみを自動検出します。一方、DOCUMENT_TEXT_DETECTION エンドポイントは、サポートされているすべての言語を自動検出します。

サポートされる言語

次の言語は優先され、定期的に評価されます。

機能別でフィルタするには、目的の言語を入力するか、プルダウン メニューから選択します。

言語 言語(日本語名) languageHints コード スクリプト / メモ
アフリカーンス語 アフリカーンス語 af Latn
shqip アルバニア語 sq Latn
العربية アラビア語 ar Arab(現代標準)
Հայ アルメニア文字 hy Armn
беларускі ベラルーシ語 be Cyrl
বাংলা ベンガル語 bn Beng
български ブルガリア語 bg Cyrl
Català カタロニア語 ca Latn
普通话 中国語 zh Hans / Hant
Hrvatski クロアチア語 hr Latn
Čeština チェコ cs Latn
Dansk デンマーク語 da Latn
Nederlands オランダ語 nl Latn
英語 英語 en Latn(アメリカ)
Eesti keel エストニア語 et Latn
フィリピン語 フィリピン語 fil(または tl) Latn
Suomi フィンランド語 fi Latn
Français フランス語 fr Latn(ヨーロッパ)
Deutsch ドイツ語 de Latn
Ελληνικά ギリシャ語 el Grek
ગુજરાતી グジャラート文字 gu Gujr
עברית ヘブライ語 iw Hebr
हिन्दी ヒンディー語 hi Deva
Magyar ハンガリー語 hu Latn
Íslenska アイスランド語 = Latn
Bahasa Indonesia インドネシア語 id Latn
Italiano イタリア語 it Latn
日本語 日本語 ja Jpan
ಕನ್ನಡ カンナダ語 kn Knda
ភាសាខ្មែរ クメール語 km Khmr
한국어 韓国語 ko Kore
ລາວ ラオ語 lo Laoo
Latviešu ラトビア語 lv Latn
Lietuvių リトアニア語 lt Latn
Македонски マケドニア語 mk Cyrl
Bahasa Melayu マレー語 ミリ秒 Latn
മലയാളം マラヤーラム文字 ml Mlym
मराठी マラーティー語 mr Deva
नेपाली ネパール語 ne Deva
Norsk ノルウェー語 × Latn(Bokmål)
فارسی ペルシャ語 fa Arab
Polski ポーランド語 pl Latn
Português ポルトガル語 pt Latn(ブラジル)
ਪੰਜਾਬੀ パンジャブ語 pa Guru(グルムキー)
Română ルーマニア語 ro Latn
Русский ロシア語 ru Cyrl
Русский(старая орфография) ロシア語 ru-PETR1708 Cyrl(旧正書法)
Српски セルビア語 sr Cyrl と Latn
Српски(латиница) セルビア語 sr-Latn Latn
Slovenčina スロバキア sk Latn
Slovenščina スロベニア語 sl Latn
Español スペイン語 es Latn(ヨーロッパ)
Svenska スウェーデン語 sv Latn
தமிழ் タミル語 ta Taml
తెలుగు テルグ語 te Telu
ไทย タイ語 th タイ語
Türkçe トルコ語 tr Latn
Українська ウクライナ語 uk Cyrl
Tiếng Việt ベトナム語 vi Latn
イディッシュ語 イディッシュ語 yi Hebr

試験運用言語

次の言語は現在開発が積極的に進められている最中ですが、まだ定期的に評価されていません。

言語 言語(日本語名) languageHints コード スクリプト / メモ
አማርኛ アムハラ語 am Ethi
Αρχαία ελληνικά 古代ギリシャ語 grc Grek
অসমীয়া アッサム語 as Beng
Azərbaycan アゼルバイジャン語 az Latn
Azərbaycan(qədim yazı) アゼルバイジャン語 az-Cyrl Cyrl(旧正書法)
Euskara バスク語 eu Latn
Bosanski ボスニア語 bs Latn
မြန်မာ ビルマ語 my Mymr
セブ語 セブ語 ceb Latn
ᏣᎳᎩ ᎦᏬᏂᎯᏍᏗ チェロキー文字 chr Cher
dhivehi、dhivehi-bas ディベヒ語 dv Thaa
རྫོང་ཁ ゾンカ語 dz Tibt
エスペラント語 エスペラント語 eo Latn
Galego ガリシア語 gl Latn
ქართული グルジア語 ka Geor
Kreyòl Ayisyen クレオール語(ハイチ) ht Latn
Gaeilge アイルランド語 ga Latn
Jawa ジャワ語 jv Latn
Қазақ カザフ語 kk Cyrl
キルギス語 キルギス語 ky Cyrl
Latine ラテン語 la Latn
Malti マルタ語 mt Latn
Монгол モンゴル文字 mn Cyrl
ଓଡ଼ିଆ オリヤ文字 または Orya
پښتو パシュト語 ps Arab
संस्कृतम् サンスクリット語 sa Deva
සිංහල シンハラ語 si Sinh
スワヒリ語 スワヒリ語 sw Latn
leššānā Suryāyā シリア文字 syr シリア文字
བོད་སྐད་ チベット文字 bo Tibt
ትግርኛ ティグリニャ語 ti Ethi
اردو ウルドゥー語 ur Arab
oʻzbekcha ウズベク語 uz Latn(Latin)
oʻzbekcha ウズベク語 uz-Cyrl Cyrl(旧正書法)
Cymraeg ウェールズ語 cy Latn
IsiZulu ズールー語 zu Latn

マッピング言語

次の言語は別の言語コードにマッピングされるか、一般的な文字認識ツールにマッピングされます。

言語 言語(日本語名) languageHints コード スクリプト / メモ マッピング先
بهسا اچيه アチェ語 ace Latn ラテン文字モデル
Lwo アチョリ語 ach Latn ラテン文字モデル
ダンメ語 アダングメ語 ada Latn ラテン文字モデル
アカン語 アカン語 ak Latn ラテン文字モデル
Anicinâbemowin アルゴンキン語 alg Latn ラテン文字モデル
Mapudungu アラウカニア語 / マプチェ語 arn Latn ラテン文字モデル
Asturianu アストゥリアス語 ast Latn ラテン文字モデル
Dene アサバスカ語 ath Latn ラテン文字モデル
Aymar aru アイマラ語 ay Latn ラテン文字モデル
Bhāṣa Bali バリ文字 ban Latn ラテン文字モデル
Bamanankan バンバラ語 bm Latn ラテン文字モデル
Narrow Bantu バントゥー語 bnt Latn ラテン文字モデル
башҡорт теле バシキール語 ba Cyrl キリル文字モデル
Toba–Batak バタク文字 btk Latn ラテン文字モデル
Chibemba ベンバ語 bem Latn ラテン文字モデル
Bikol Naga ビコール語 bik Latn ラテン文字モデル
Bichelamar ビスラマ語 バイ Latn ラテン文字モデル
Brezhoneg ブルトン語 br Latn ラテン文字モデル
нохчийн мотт / noxçiyn mott チェチェン語 ce Cyrl キリル文字モデル
汉语 中国語 zh-Hans Hans(簡体、標準中国語) zh
漢語 中国語 zh-Hant Hant(繁体、標準中国語) zh
普通話 中国語 zh-Hant-HK Hant(標準中国語、香港) zh
Chahta' チョクトー語 cho Latn ラテン文字モデル
Чӑвашла チュヴァシ語 cv Cyrl キリル文字モデル
Cree–Montagnais–Naskapi クリー語 cr Latn ラテン文字モデル
Mvskoke クリーク語 mus Latn ラテン文字モデル
qırımtatar tili、къырымтатар тили クリミア タタール語 crh Latn キリル文字モデル
Dakhótiyapi、Dakȟótiyapi ダコタ語 dak Latn ラテン文字モデル
ドゥアラ ドゥアラ語 dua Latn ラテン文字モデル
Ikɔ Efik エフィク語 efi Latn ラテン文字モデル
English(イギリス) 英語 en-GB Latn(イギリス) en
Èʋegbe エウェ語 ee Latn ラテン文字モデル
føroyskt mál フェロー語 fo Latn ラテン文字モデル
Na Vosa Vakaviti フィジー語 fj Latn ラテン文字モデル
fɔ̀ngbè フォン語 fon Latn ラテン文字モデル
Français canadien フランス語 fr-CA Latn(カナダ) fr
Fulani、Fulah、Peul フラニ語 ff Latn ラテン文字モデル
ガ語 gaa Latn ラテン文字モデル
ルガンダ語 ガンダ語 lg Latn ラテン文字モデル
Basa Gayo ガヨ語 ゲイ Latn ラテン文字モデル
キリバス キリバス語 gil Latn ラテン文字モデル
ゴート文字 ゴート文字 got Latn ラテン文字モデル
Guaraní グアラニ語 gn Latn ラテン文字モデル
Harshen/Halshen Hausa هَرْشَن هَوْسَ ハウサ語 ha Latn ラテン文字モデル
ʻŌlelo Hawaiʻi ハワイ語 haw Latn ラテン文字モデル
Otjiherero ヘレロ語 hz Latn ラテン文字モデル
Ilonggo ヒリガイノン語 hil Latn ラテン文字モデル
Jaku Iban イバン語 iba Latn ラテン文字モデル
Asụsụ Igbo イボ語 ig Latn ラテン文字モデル
Ilokano イロカノ語 ilo Latn ラテン文字モデル
Taqbaylit カビル語 kab Latn ラテン文字モデル
ジンポー語 カチン kac Latn ラテン文字モデル
カラーリット語 カラーリット語 kl Latn ラテン文字モデル
Kikamba カンバ語 kam Latn ラテン文字モデル
カヌリ語 カヌリ語 kr Latn ラテン文字モデル
Qaraqalpaq tili、Қарақалпақ тили、قاراقالپاق تىلى カラカルパク語 kaa Cyrl / Latn キリル文字モデル
Ka Ktien Khasi カーシ語 kha Latn ラテン文字モデル
Gĩkũyũ キクユ語 ki Latn ラテン文字モデル
キニヤルワンダ語 キニヤルワンダ語 rw Latn ラテン文字モデル
коми кыв コミ語 kv Cyrl キリル文字モデル
Kikongo コンゴ語 kg Latn ラテン文字モデル
Kosraean コスラエ語 kos Latn ラテン文字モデル
Oshikwanyama クワニャマ語 kj Latn ラテン文字モデル
Ngala リンガラ語 ln Latn ラテン文字モデル
Plattdütsch、Plattdeutsch、Nedersaksisch 低地ドイツ語 nds Latn ラテン文字モデル
siLozi ロジ語 loz Latn ラテン文字モデル
Kiluba ルバカタンガ語 lu Latn ラテン文字モデル
Dholuo Luo luo Latn ラテン文字モデル
Madhura、Basa Mathura、بَهاسَ مَدورا マドゥラ語 mad Latn ラテン文字モデル
マラガシ語 マラガシ語 mg Latn ラテン文字モデル
Mandinka、لغة مندنكا マンディンゴ語 男性 Latn ラテン文字モデル
Gaelg、Gailck マン島語 gv Latn ラテン文字モデル
Te reo Māori マオリ語 mi Latn ラテン文字モデル
Ebon マーシャル語 mh Latn ラテン文字モデル
Mɛnde yia メンデ語 men Latn ラテン文字モデル
Middle English 中英語 enm Latn ラテン文字モデル
Mittelhochdeutsch 中高ドイツ語 gmh Latn ラテン文字モデル
Baso Minangkabau、باسو مينڠكاباو ミナンカバウ語 Latn ラテン文字モデル
Kanienʼkéha モホーク語 moh Latn ラテン文字モデル
Nkundu モンゴ語 lol Latn ラテン文字モデル
Nāhuatl ナワトル語 nah Latn ラテン文字モデル
Diné bizaad ナバホ nv Latn ラテン文字モデル
ンドンガ語 ンドンガ語 ng Latn ラテン文字モデル
ko e vagahau Niuē ニウエ語 niu Latn ラテン文字モデル
Zimbabwe Ndebele 北ンデベレ語 nd Latn ラテン文字モデル
Sesotho sa Leboa 北ソト語 nso Latn ラテン文字モデル
Chichewa、Chinyanja ニャンジャ語 ny Latn ラテン文字モデル
Runyankore ニャンコレ語 nyn Latn ラテン文字モデル
Chitonga トンガ語(ニアサ) tog Latn ラテン文字モデル
Appolo ンジマ語 nzi Latn ラテン文字モデル
Occitan、lenga d'òc、provençal オック語 oc Latn ラテン文字モデル
Anishinaabemowin、ᐊᓂᔑᓈᐯᒧᐎᓐ オジブワ語 oj Latn ラテン文字モデル
Ænglisc、Englisc、Anglisc 古英語 ang Latn ラテン文字モデル
Franceis、François、Romanz 古フランス語 fro Latn ラテン文字モデル
Diutisk、Althochdeutsch 古高ドイツ語 goh Latn ラテン文字モデル
Dǫnsk tunga 古ノルド語 non Latn ラテン文字モデル
Occitan ancian 古プロヴァンス語 pro Latn ラテン文字モデル
ирон ӕвзаг オセット語 os Cyrl キリル文字モデル
パンパンガ語 パンパンガ pam Latn ラテン文字モデル
Salitan Pangasinan パンガシナン pag Latn ラテン文字モデル
Papiamentu パピアメント語 pap Latn ラテン文字モデル
Português (Portugal) ポルトガル語 pt-PT Latn(ヨーロッパ) pt
Kechua / Runa Simi ケチュア語 qu Latn ラテン文字モデル
Rumantsch ロマンシュ語 rm Latn ラテン文字モデル
Romani čhib ロマ語 rom Latn ラテン文字モデル
Ikirundi ルンディ語 rn Latn ラテン文字モデル
サカ語 サカ語 sah Cyrl キリル文字モデル
Gagana faʻa Sāmoa サモア語 sm Latn ラテン文字モデル
yângâ tî sängö サンゴ語 sg Latn ラテン文字モデル
(Braid)Scots、Lallans、Doric スコットランド語 sco Latn ラテン文字モデル
Gàidhlig スコットランド ゲール語 gd Latn ラテン文字モデル
chiShona ショナ語 sn Latn ラテン文字モデル
Songhay ソンガイ語 son Latn ラテン文字モデル
セソト語 南部ソト語 st Latn ラテン文字モデル
Español(Latinoamérica) スペイン語 es-419 Latn(ラテンアメリカ) es
ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda スンダ文字 su Latn ラテン文字モデル
siSwati スワート語 ss Latn ラテン文字モデル
Reo Tahiti タヒチ語 ty Latn ラテン文字モデル
тоҷикӣ タジク語 tg Cyrl キリル文字モデル
татар теле タタール語 tt Cyrl / Latn キリル文字モデル
KʌThemnɛ テムネ語 tem Latn ラテン文字モデル
lea faka-Tonga トンガ語 Latn ラテン文字モデル
Xitsonga ツォンガ語 ts Latn ラテン文字モデル
Setswana ツワナ語 tn Latn ラテン文字モデル
Türkmençe トルクメン語 tk Latn キリル文字モデル
удмурт кыл ウドムルト語 udm Cyrl キリル文字モデル
Tshivenḓa ヴェンダ語 ve Latn ラテン文字モデル
Vod ヴォート語 vot Cyrl / Latn キリル文字モデル
Frysk 西フリジア語 fy Latn ラテン文字モデル
ウォロフ語 ウォロフ語 wo Latn ラテン文字モデル
isiXhosa コーサ語 xh Latn ラテン文字モデル
Èdè Yorùbá ヨルバ語 yo Latn ラテン文字モデル
Diidxazá サポテカ語 zap Latn ラテン文字モデル