OCR 言語のサポート

Cloud Vision API のテキスト認識機能では、多様な言語を検出でき、1 つの画像内の複数の言語を検出できます。

サービスに言語のヒントを提供することは必須ではありませんが、サービスで画像に使用されている言語の検出が困難な場合に行うことができます。ヒントは、TEXT_DETECTION および DOCUMENT_TEXT_DETECTION リクエストで、リクエストの ImageContext 内に languageHints リストとして指定します。

各言語コード パラメータは一般に BCP-47 識別子で構成されています。このパラメータでは、言語-地域の形式が可能です。ここで、言語は第一言語を表し、地域(省略可能)は特定の言語の地域(通常は国の識別子)を表します。たとえば、中国語は中華人民共和国で使用される簡体中国語(zh-CN)、または台湾で使用される繁体中国語(zh-TW)で表されます。

TEXT_DETECTIONDOCUMENT_TEXT_DETECTION によってサポートされる言語のリスト(および関連する languageHint コード)は、以下のとおりです。

言語名 languageHints コード メモ
アフリカーンス語 af
アラビア語 ar
アッサム語 as
アゼルバイジャン語 az
ベラルーシ語 be
ベンガル語 bn
ブルガリア語 bg
カタルーニャ語 ca
中国語 zh* 新規: DOCUMENT_TEXT_DETECTION でもサポートされています。
クロアチア語 hr
チェコ語 cs
デンマーク語 da
オランダ語 nl
英語 en
エストニア語 et
フィリピン語 fil または tl
フィンランド語 fi
フランス語 fr
ドイツ語 de
ギリシャ語 el 新規: DOCUMENT_TEXT_DETECTION でもサポートされています。
ヘブライ語 he または iw 新規: iw は DOCUMENT_TEXT_DETECTION でもサポートされています。
ヒンディー語 hi
ハンガリー語 hu
アイスランド語 is
インドネシア語 id
イタリア語 it
日本語 ja 新規: DOCUMENT_TEXT_DETECTION でもサポートされています。
カザフ語 kk
韓国語 ko 新規: DOCUMENT_TEXT_DETECTION でもサポートされています。
キルギス語 ky
ラトビア語 lv
リトアニア語 lt
マケドニア語 mk
マラーティー語 mr
モンゴル語 mn
ネパール語 ne
ノルウェー語 no
パシュトゥーン語 ps
ペルシャ語 fa
ポーランド語 pl
ポルトガル語 pt
ルーマニア語 ro
ロシア語 ru
サンスクリット語 sa
セルビア語 sr
スロバキア語 sk
スロベニア語 sl
スペイン語 es
スウェーデン語 sv
タミル語 ta
タイ語 th 新規: DOCUMENT_TEXT_DETECTION でもサポートされています。
トルコ語 tr
ウクライナ語 uk
ウルドゥー語 ur
ウズベク語 uz
ベトナム語 vi

* zh のコード languageHints を指定した場合、簡体中国語(zh-CN)と繁体中国語(zh-TW)の両方がサポートされます。中国語のテキストを認識するために、これらの言語コードのいずれも使用できます。

このページは役立ちましたか?評価をお願いいたします。

フィードバックを送信...

Cloud Vision API ドキュメント