Google Distributed Cloud(GDC)エアギャップ アプライアンスのテキスト認識機能は、さまざまな言語を検出し、1 つの画像内の複数の言語を検出できます。
光学式文字認識(OCR)API リクエストで、オプションの言語ヒントを指定できます。たとえば、API で画像に使用されている言語の検出が困難な場合に、ヒントを提供できます。
オプションの言語ヒントを指定するには、image_context フィールドの BatchAnnotateImages または BatchAnnotateFiles リクエストに、language_hints フィールドの値のリストとして追加します。
language_hints 形式では、次の BCP 47 言語タグの形式設定ガイドラインを使用します。
language["-" script] ["-" region] *("-" variant) *("-" extension) ["-" privateuse]
たとえば、言語ヒント en-t-i0-handwrit は、言語が「手書きから変換された英語」であることを示します。
テキスト認識機能では、次の 3 段階の言語がサポートされています。
- サポート対象言語は、定期的なパフォーマンス評価で優先されます。
- 試験運用版の言語は開発が積極的に進められています。定期的なパフォーマンス評価がない。
- マッピング言語は、別の言語コードまたは一般的な文字認識ツールにマッピングすることでサポートされます。たとえば、
en-GBはサポートされていますが、テキスト認識においてはenと同様に扱われます。OCR サービスは、entityフィールドで正しいマッピング言語コードを返すよう試みます。ただし、マッピング言語は完全にサポートされている言語や試験運用でサポートされている言語よりも、誤って認識される可能性が高くなります。
OCR サービスの主な機能の一つは、画像からテキストを検出して抽出する機能です。画像は、たとえば手書きのテキストなどです。手書き入力認識でサポートされている手書き文字の一覧については、手書き文字をご覧ください。
サポートされている言語
テキスト認識機能は、サポートされている言語を優先して定期的に評価します。言語でフィルタするには、次のフィールドに言語を入力します。
| 言語 | 言語(日本語名) | 言語ヒントコード | スクリプトとメモ |
|---|---|---|---|
| アフリカーンス語 | アフリカーンス語 | af |
Latn |
| shqip | アルバニア語 | sq |
Latn |
| العربية | アラビア語 | ar |
Arab(現代標準) |
| беларуская | ベラルーシ語 | be |
Cyrl |
| български | ブルガリア語 | bg |
Cyrl |
| Català | カタルーニャ語 | ca |
Latn |
| 普通话 | 中国語 | zh |
Hans / Hant |
| Hrvatski | クロアチア語 | hr |
Latn |
| Čeština | チェコ語 | cs |
Latn |
| Dansk | デンマーク語 | da |
Latn |
| Nederlands | オランダ語 | nl |
Latn |
| 英語 | 英語 | en |
Latn(アメリカ) |
| Eesti keel | エストニア語 | et |
Latn |
| フィリピン語 | フィリピン語 | fil または tl |
Latn |
| Suomi | フィンランド語 | fi |
Latn |
| Français | フランス語 | fr |
Latn(ヨーロッパ) |
| Deutsch | ドイツ語 | de |
Latn |
| Ελληνικά | ギリシャ語 | el |
Grek |
| עברית | ヘブライ語 | iw |
Hebr |
| हिन्दी | ヒンディー語 | hi |
Deva |
| Magyar | ハンガリー語 | hu |
Latn |
| Íslenska | アイスランド語 | is |
Latn |
| Bahasa Indonesia | インドネシア語 | id |
Latn |
| Italiano | イタリア語 | it |
Latn |
| 日本語 | 日本語 | ja |
Jpan |
| 한국어 | 韓国語 | ko |
Kore |
| Latviešu | ラトビア語 | lv |
Latn |
| Lietuvių | リトアニア語 | lt |
Latn |
| Македонски | マケドニア語 | mk |
Cyrl |
| Bahasa Melayu | マレー語 | ms |
Latn |
| മലയാളം | マラヤーラム語 | ml |
Mlym |
| मराठी | マラーティー語 | mr |
Deva |
| नेपाली | ネパール語 | ne |
Deva |
| Norsk | ノルウェー語 | no |
Latn(Bokmål) |
| فارسی | ペルシャ語 | fa |
Arab |
| Polski | ポーランド語 | pl |
Latn |
| Português | ポルトガル語 | pt |
Latn(ブラジル) |
| Română | ルーマニア語 | ro |
Latn |
| Русский | ロシア語 | ru |
Cyrl |
| Русский(старая орфография) | ロシア語 | ru-PETR1708 |
Cyrl(旧正書法) |
| Српски | セルビア語 | sr |
Cyrl と Latn |
| Српски(латиница) | セルビア語 | sr-Latn |
Latn |
| Slovenčina | スロバキア語 | sk |
Latn |
| Slovenščina | スロベニア語 | sl |
Latn |
| Español | スペイン語 | es |
Latn(ヨーロッパ) |
| Svenska | スウェーデン語 | sv |
Latn |
| タガログ語 | タガログ語 | tl |
Latn |
| Türkçe | トルコ語 | tr |
Latn |
| Українська | ウクライナ語 | uk |
Cyrl |
| Tiếng Việt | ベトナム語 | vi |
Latn |
| イディッシュ語 | イディッシュ語 | yi |
Hebr |
試験運用版の言語
試験運用版の言語は開発が積極的に進められていますが、評価されていません。言語でフィルタするには、次のフィールドに言語を入力します。
| 言語 | 言語(日本語名) | 言語ヒントコード | スクリプトとメモ |
|---|---|---|---|
| Αρχαία ελληνικά | 古代ギリシャ語 | grc |
Grek |
| Azərbaycan | アゼルバイジャン語 | az |
Latn |
| Azərbaycan(qədim yazı) | アゼルバイジャン語 | az-Cyrl |
Cyrl(旧正書法) |
| Euskara | バスク語 | eu |
Latn |
| Bosanski | ボスニア語 | bs |
Latn |
| セブ語 | セブアノ語 | ceb |
Latn |
| エスペラント語 | エスペラント語 | eo |
Latn |
| Galego | ガリシア語 | gl |
Latn |
| ქართული | ジョージア語 | ka |
Geor |
| Kreyòl Ayisyen | クレオール語(ハイチ) | ht |
Latn |
| Gaeilge | アイルランド語 | ga |
Latn |
| Jawa | ジャワ語 | jv |
Latn |
| Қазақ | カザフ語 | kk |
Cyrl |
| キルギス語 | キルギス語 | ky |
Cyrl |
| Latine | ラテン語 | la |
Latn |
| Malti | マルタ語 | mt |
Latn |
| Монгол | モンゴル語 | mn |
Cyrl |
| پښتو | パシュト語 | ps |
Arab |
| संस्कृतम् | サンスクリット語 | sa |
Deva |
| スワヒリ語 | スワヒリ語 | sw |
Latn |
| اردو | ウルドゥー語 | ur |
Arab |
| oʻzbekcha | ウズベク語 | uz |
Latn(Latin) |
| oʻzbekcha | ウズベク語 | uz-Cyrl |
Cyrl(旧正書法) |
| Cymraeg | ウェールズ語 | cy |
Latn |
| IsiZulu | ズールー語 | zu |
Latn |
マッピング言語
マッピングされた言語は、別の言語コードまたは一般的な文字認識ツールに関連付けられます。言語でフィルタするには、次のフィールドに言語を入力します。
| 言語 | 言語(日本語名) | 言語ヒントコード | スクリプトとメモ | マッピング先 |
|---|---|---|---|---|
| بهسا اچيه | アチェ語 | ace |
Latn | ラテン文字モデル |
| Lwo | アチョリ語 | ach |
Latn | ラテン文字モデル |
| ダンメ語 | アダングメ語 | ada |
Latn | ラテン文字モデル |
| アカン語 | アカン語 | ak |
Latn | ラテン文字モデル |
| Anicinâbemowin | アルゴンキン語 | alg |
Latn | ラテン文字モデル |
| Mapudungu | アラウカニア語 / マプチェ語 | arn |
Latn | ラテン文字モデル |
| Asturianu | アストゥリアス語 | ast |
Latn | ラテン文字モデル |
| Dene | アサバスカ語 | ath |
Latn | ラテン文字モデル |
| Aymar aru | アイマラ語 | ay |
Latn | ラテン文字モデル |
| Bhāṣa Bali | バリ語 | ban |
Latn | ラテン文字モデル |
| Bamanankan | バンバラ語 | bm |
Latn | ラテン文字モデル |
| Narrow Bantu | バントゥー語 | bnt |
Latn | ラテン文字モデル |
| башҡорт теле | バシキール語 | ba |
Cyrl | キリル文字モデル |
| Toba–Batak | バタク文字 | btk |
Latn | ラテン文字モデル |
| Chibemba | ベンバ語 | bem |
Latn | ラテン文字モデル |
| Bikol Naga | ビコール語 | bik |
Latn | ラテン文字モデル |
| Bichelamar | ビスラマ語 | bi |
Latn | ラテン文字モデル |
| Brezhoneg | ブルトン語 | br |
Latn | ラテン文字モデル |
| нохчийн мотт / noxçiyn mott | チェチェン語 | ce |
Cyrl | キリル文字モデル |
| 汉语 | 中国語 | zh-Hans |
Hans(簡体、標準中国語) | zh |
| 漢語 | 中国語 | zh-Hant |
Hant(繁体、標準中国語) | zh |
| 普通話 | 中国語 | zh-Hant-HK |
Hant(標準中国語、香港) | zh |
| Chahta' | チョクトー語 | cho |
Latn | ラテン文字モデル |
| Чӑвашла | チュヴァシ語 | cv |
Cyrl | キリル文字モデル |
| Cree–Montagnais–Naskapi | クリー語 | cr |
Latn | ラテン文字モデル |
| Mvskoke | クリーク語 | mus |
Latn | ラテン文字モデル |
| qırımtatar tili、къырымтатар тили | クリミア タタール語 | crh |
Latn | キリル文字モデル |
| Dakhótiyapi、Dakȟótiyapi | ダコタ語 | dak |
Latn | ラテン文字モデル |
| ドゥアラ | ドゥアラ語 | dua |
Latn | ラテン文字モデル |
| Ikɔ Efik | エフィク語 | efi |
Latn | ラテン文字モデル |
| English(イギリス) | 英語 | en-GB |
Latn(イギリス) | en |
| Èʋegbe | エウェ語 | ee |
Latn | ラテン文字モデル |
| føroyskt mál | フェロー語 | fo |
Latn | ラテン文字モデル |
| Na Vosa Vakaviti | フィジー語 | fj |
Latn | ラテン文字モデル |
| fɔ̀ngbè | フォン語 | fon |
Latn | ラテン文字モデル |
| Français canadien | フランス語 | fr-CA |
Latn(カナダ) | fr |
| Fulani、Fulah、Peul | フラニ語 | ff |
Latn | ラテン文字モデル |
| Gã | ガ語 | gaa |
Latn | ラテン文字モデル |
| ルガンダ語 | ガンダ語 | lg |
Latn | ラテン文字モデル |
| Basa Gayo | ガヨ語 | gay |
Latn | ラテン文字モデル |
| キリバス | キリバス語 | gil |
Latn | ラテン文字モデル |
| ゴート文字 | ゴート文字 | got |
Latn | ラテン文字モデル |
| Guaraní | グアラニ語 | gn |
Latn | ラテン文字モデル |
| Harshen/Halshen Hausa هَرْشَن هَوْسَ | ハウサ語 | ha |
Latn | ラテン文字モデル |
| ʻŌlelo Hawaiʻi | ハワイ語 | haw |
Latn | ラテン文字モデル |
| Otjiherero | ヘレロ語 | hz |
Latn | ラテン文字モデル |
| Ilonggo | ヒリガイノン語 | hil |
Latn | ラテン文字モデル |
| Jaku Iban | イバン語 | iba |
Latn | ラテン文字モデル |
| Asụsụ Igbo | イボ語 | ig |
Latn | ラテン文字モデル |
| Ilokano | イロカノ語 | ilo |
Latn | ラテン文字モデル |
| Taqbaylit | カビル語 | kab |
Latn | ラテン文字モデル |
| ジンポー語 | カチン | kac |
Latn | ラテン文字モデル |
| カラーリット語 | カラーリット語 | kl |
Latn | ラテン文字モデル |
| Kikamba | カンバ語 | kam |
Latn | ラテン文字モデル |
| カヌリ語 | カヌリ語 | kr |
Latn | ラテン文字モデル |
| Qaraqalpaq tili、Қарақалпақ тили、قاراقالپاق تىلى | カラカルパク語 | kaa |
Cyrl / Latn | キリル文字モデル |
| Ka Ktien Khasi | カーシ語 | kha |
Latn | ラテン文字モデル |
| Gĩkũyũ | キクユ語 | ki |
Latn | ラテン文字モデル |
| キニヤルワンダ語 | キニヤルワンダ語 | rw |
Latn | ラテン文字モデル |
| коми кыв | コミ語 | kv |
Cyrl | キリル文字モデル |
| Kikongo | コンゴ語 | kg |
Latn | ラテン文字モデル |
| Kosraean | コスラエ語 | kos |
Latn | ラテン文字モデル |
| Oshikwanyama | クワニャマ語 | kj |
Latn | ラテン文字モデル |
| Ngala | リンガラ語 | ln |
Latn | ラテン文字モデル |
| Plattdütsch、Plattdeutsch、Nedersaksisch | 低地ドイツ語 | nds |
Latn | ラテン文字モデル |
| siLozi | ロジ語 | loz |
Latn | ラテン文字モデル |
| Kiluba | ルバカタンガ語 | lu |
Latn | ラテン文字モデル |
| Dholuo | ルオ語 | luo |
Latn | ラテン文字モデル |
| Madhura、Basa Mathura、بَهاسَ مَدورا | マドゥラ語 | mad |
Latn | ラテン文字モデル |
| マラガシ語 | マラガシ語 | mg |
Latn | ラテン文字モデル |
| Mandinka、لغة مندنكا | マンディンゴ語 | man |
Latn | ラテン文字モデル |
| Gaelg、Gailck | マン島語 | gv |
Latn | ラテン文字モデル |
| Te reo Māori | マオリ語 | mi |
Latn | ラテン文字モデル |
| Ebon | マーシャル語 | mh |
Latn | ラテン文字モデル |
| Mɛnde yia | メンデ語 | men |
Latn | ラテン文字モデル |
| Middle English | 中英語 | enm |
Latn | ラテン文字モデル |
| Mittelhochdeutsch | 中高ドイツ語 | gmh |
Latn | ラテン文字モデル |
| Baso Minangkabau、باسو مينڠكاباو | ミナンカバウ語 | min |
Latn | ラテン文字モデル |
| Kanienʼkéha | モホーク語 | moh |
Latn | ラテン文字モデル |
| Nkundu | Mongo | lol |
Latn | ラテン文字モデル |
| Nāhuatl | ナワトル語 | nah |
Latn | ラテン文字モデル |
| Diné bizaad | ナヴァホ語 | nv |
Latn | ラテン文字モデル |
| ンドンガ語 | ンドンガ語 | ng |
Latn | ラテン文字モデル |
| ko e vagahau Niuē | ニウエ語 | niu |
Latn | ラテン文字モデル |
| Zimbabwe Ndebele | 北ンデベレ語 | nd |
Latn | ラテン文字モデル |
| Sesotho sa Leboa | 北ソト語 | nso |
Latn | ラテン文字モデル |
| Chichewa、Chinyanja | ニャンジャ語 | ny |
Latn | ラテン文字モデル |
| Runyankore | ニャンコレ語 | nyn |
Latn | ラテン文字モデル |
| Chitonga | トンガ語(ニアサ) | tog |
Latn | ラテン文字モデル |
| Appolo | ンジマ語 | nzi |
Latn | ラテン文字モデル |
| Occitan、lenga d'òc、provençal | オック語 | oc |
Latn | ラテン文字モデル |
| Anishinaabemowin、ᐊᓂᔑᓈᐯᒧᐎᓐ | オジブワ語 | oj |
Latn | ラテン文字モデル |
| Ænglisc、Englisc、Anglisc | 古英語 | ang |
Latn | ラテン文字モデル |
| Franceis、François、Romanz | 古フランス語 | fro |
Latn | ラテン文字モデル |
| Diutisk、Althochdeutsch | 古高ドイツ語 | goh |
Latn | ラテン文字モデル |
| Dǫnsk tunga | 古ノルド語 | non |
Latn | ラテン文字モデル |
| Occitan ancian | 古プロヴァンス語 | pro |
Latn | ラテン文字モデル |
| ирон ӕвзаг | オセット語 | os |
Cyrl | キリル文字モデル |
| パンパンガ語 | パンパンガ | pam |
Latn | ラテン文字モデル |
| Salitan Pangasinan | パンガシナン語 | pag |
Latn | ラテン文字モデル |
| Papiamentu | パピアメント語 | pap |
Latn | ラテン文字モデル |
| Português (Portugal) | ポルトガル語 | pt-PT |
Latn(ヨーロッパ) | pt |
| Kechua / Runa Simi | ケチュア語 | qu |
Latn | ラテン文字モデル |
| Rumantsch | ロマンシュ語 | rm |
Latn | ラテン文字モデル |
| Romani čhib | ロマ語 | rom |
Latn | ラテン文字モデル |
| Ikirundi | ルンディ語 | rn |
Latn | ラテン文字モデル |
| サカ語 | サカ語 | sah |
Cyrl | キリル文字モデル |
| Gagana faʻa Sāmoa | サモア語 | sm |
Latn | ラテン文字モデル |
| yângâ tî sängö | サンゴ語 | sg |
Latn | ラテン文字モデル |
| (Braid)Scots、Lallans、Doric | スコットランド語 | sco |
Latn | ラテン文字モデル |
| Gàidhlig | スコットランド ゲール語 | gd |
Latn | ラテン文字モデル |
| chiShona | ショナ語 | sn |
Latn | ラテン文字モデル |
| Songhay | ソンガイ語 | son |
Latn | ラテン文字モデル |
| セソト語 | 南ソト語 | st |
Latn | ラテン文字モデル |
| Español(Latinoamérica) | スペイン語 | es-419 |
Latn(ラテンアメリカ) | es |
| ᮘᮞ ᮞᮥᮔ᮪ᮓ、Basa Sunda | スンダ語 | su |
Latn | ラテン文字モデル |
| siSwati | スワート語 | ss |
Latn | ラテン文字モデル |
| Reo Tahiti | タヒチ語 | ty |
Latn | ラテン文字モデル |
| тоҷикӣ | タジク語 | tg |
Cyrl | キリル文字モデル |
| татар теле | タタール語 | tt |
Cyrl / Latn | キリル文字モデル |
| KʌThemnɛ | テムネ語 | tem |
Latn | ラテン文字モデル |
| lea faka-Tonga | トンガ語 | to |
Latn | ラテン文字モデル |
| Xitsonga | ツォンガ語 | ts |
Latn | ラテン文字モデル |
| Setswana | ツワナ語 | tn |
Latn | ラテン文字モデル |
| Türkmençe | トルクメン語 | tk |
Latn | キリル文字モデル |
| удмурт кыл | ウドムルト語 | udm |
Cyrl | キリル文字モデル |
| Tshivenḓa | ヴェンダ語 | ve |
Latn | ラテン文字モデル |
| Vod | ヴォート語 | vot |
Cyrl / Latn | キリル文字モデル |
| Frysk | 西フリジア語 | fy |
Latn | ラテン文字モデル |
| ウォロフ語 | ウォロフ語 | wo |
Latn | ラテン文字モデル |
| isiXhosa | コーサ語 | xh |
Latn | ラテン文字モデル |
| Èdè Yorùbá | ヨルバ語 | yo |
Latn | ラテン文字モデル |
| Diidxazá | サポテカ語 | zap |
Latn | ラテン文字モデル |
手書き文字のスクリプト
このセクションでは、手書き入力認識でサポートされているスクリプトについて説明します。各スクリプトを使用する言語については、サポートされている言語、試験運用版の言語、マッピングされている言語の表を参照してください。スクリプトでフィルタするには、次のフィールドにスクリプトを入力します。
| スクリプトタグ | 名前 | サポートレベル |
|---|---|---|
| Beng | ベンガル語 | 試験運用版 |
| Cyrl | キリル文字 | 試験運用版 |
| Deva | デバナーガリ文字 | 試験運用版 |
| Grek | ギリシャ語 | 試験運用版 |
| ハニ語 | 中国語 | 試験運用版 |
| Jpan | 日本語 | サポート対象 |
| Kore | 韓国語 | サポート対象 |
| Latn | ラテン語 | サポート対象 |
| vi | ベトナム語 | 試験運用版 |