画像アノテーション リクエストに対するレスポンス。
JSON 表現 |
---|
{ "textAnnotations": [ { object ( |
フィールド | |
---|---|
textAnnotations[] |
存在する場合、テキスト(OCR)検出が正常に完了しています。 |
fullTextAnnotation |
存在する場合、テキスト(OCR)検出またはドキュメント(OCR)テキスト検出が正常に完了しています。このアノテーションは、OCR で検出されたテキストの構造的階層を提供します。 |
error |
設定されている場合、オペレーションのエラー メッセージを表します。 |
context |
存在する場合は、この画像の取得元を特定するためにコンテキスト情報が必要になります。 |
EntityAnnotation
検出されたエンティティの特徴のセット。
JSON 表現 |
---|
{ "mid": string, "locale": string, "description": string, "score": number, "confidence": number, "topicality": number, "boundingPoly": { object ( |
フィールド | |
---|---|
mid |
不透明エンティティの ID。一部の ID は Google Knowledge Graph Search API で使用できます。 |
locale |
エンティティ テキスト |
description |
エンティティ テキストの説明。 |
score |
結果の全体的なスコア。範囲は [0, 1] です。 |
confidence |
サポートを終了しました。代わりに |
topicality |
画像に対する ICA(Image Content Annotation)ラベルの関連度。たとえば、「Eiffel Tower」が検出された画像と遠方にある塔(Tower)が検出された画像の場合、塔があることの信頼度が同一であっても、「Tower」の関連度は「Eiffel Tower」が検出された画像の方が高くなります。範囲は [0, 1] です。 |
boundingPoly |
このエンティティが属する画像領域。 |
properties[] |
エンティティの中には、エンティティを修飾するスコアや文字列など、オプションのユーザー指定 |
BoundingPoly
検出された画像アノテーションの境界ポリゴン。
JSON 表現 |
---|
{ "vertices": [ { object ( |
フィールド | |
---|---|
vertices[] |
境界ポリゴンの頂点。 |
normalizedVertices[] |
境界ポリゴンの正規化された頂点。 |
Vertex
頂点は、画像上の 2D の点を表します。注: 頂点の座標は元の画像と同じスケールです。
JSON 表現 |
---|
{ "x": integer, "y": integer } |
フィールド | |
---|---|
x |
X 座標。 |
y |
Y 座標。 |
NormalizedVertex
頂点は、画像上の 2D の点を表します。注: 正規化された頂点座標は、元の画像と相対しており、0~1 の範囲になります。
JSON 表現 |
---|
{ "x": number, "y": number } |
フィールド | |
---|---|
x |
X 座標。 |
y |
Y 座標。 |
プロパティ
Property
は、ユーザー指定の名前と値のペアで構成されます。
JSON 表現 |
---|
{ "name": string, "value": string, "uint64Value": string } |
フィールド | |
---|---|
name |
プロパティの名前。 |
value |
プロパティの値。 |
uint64Value |
数値プロパティの値。 |
TextAnnotation
TextAnnotation
には、OCR で抽出されたテキストの構造化された表現が含まれます。OCR で抽出されたテキスト構造の階層は次のようになります。
TextAnnotation
-> Page -> Block -> Paragraph -> Word -> Symbol
TextAnnotation.TextProperty
メッセージ定義をご覧ください。
JSON 表現 |
---|
{
"pages": [
{
object ( |
フィールド | |
---|---|
pages[] |
OCR によって検出されたページのリスト。 |
text |
ページで検出された UTF-8 テキスト。 |
ページ
OCR から検出されたページ。
JSON 表現 |
---|
{ "property": { object ( |
フィールド | |
---|---|
property |
ページで検出された追加情報。 |
width |
ページの幅。PDF の場合、単位はポイントです。画像(TIFF を含む)の場合、単位はピクセルです。 |
height |
ページの高さ。PDF の場合、単位はポイントです。画像(TIFF を含む)の場合、単位はピクセルです。 |
blocks[] |
このページのテキスト、画像などのブロックのリスト。 |
confidence |
ページの OCR 結果の信頼度。範囲は [0, 1] です。 |
TextProperty
構造コンポーネントで検出された追加情報。
JSON 表現 |
---|
{ "detectedLanguages": [ { object ( |
フィールド | |
---|---|
detectedLanguages[] |
検出された言語と信頼度のリスト。 |
detectedBreak |
検出されたテキスト セグメントの開始または終了。 |
DetectedLanguage
検出された構造コンポーネントの言語。
JSON 表現 |
---|
{ "languageCode": string, "confidence": number } |
フィールド | |
---|---|
languageCode |
「en-US」や「sr-Latn」などの BCP-47 言語コード。詳細については、https://www.unicode.org/reports/tr35/#Unicode_locale_identifier をご覧ください。 |
confidence |
検出された言語の信頼度。範囲は [0, 1] です。 |
DetectedBreak
検出された構造コンポーネントの開始または終了。
JSON 表現 |
---|
{
"type": enum ( |
フィールド | |
---|---|
type |
検出された区切りのタイプ。 |
isPrefix |
区切りが要素の前にある場合は True。 |
BreakType
検出された区切りのタイプを示す列挙型。改行、スペースなどです。
列挙型 | |
---|---|
UNKNOWN |
不明な区切りラベルタイプ。 |
SPACE |
標準スペース。 |
SURE_SPACE |
広幅のスペース。 |
EOL_SURE_SPACE |
行折り返しの区切り。 |
HYPHEN |
テキストに存在しない行末ハイフン。SPACE 、LEADER_SPACE 、LINE_BREAK と組み合わせて出現することはありません。 |
LINE_BREAK |
段落を終了する改行。 |
ブロック
ページ上の論理的な要素。
JSON 表現 |
---|
{ "property": { object ( |
フィールド | |
---|---|
property |
ブロックについて検出された追加情報。 |
boundingBox |
ブロックの境界ボックス。頂点は、左上、右上、右下、左下の順に並んでいます。境界ボックスの回転が検出された場合、回転はテキストを「自然な」方向で読み取るときの左上隅を中心と定義して表されます。例:
頂点の順序は (0, 1, 2, 3) のままです。 |
paragraphs[] |
このブロック内の段落のリスト(このブロックのタイプがテキストの場合)。 |
blockType |
このブロックの検出されたブロックタイプ(テキスト、イメージなど)。 |
confidence |
このブロックの OCR 実行結果の信頼性。範囲は [0, 1] です。 |
Paragraph
多数の単語を特定の順序で示すテキストの構造単位。
JSON 表現 |
---|
{ "property": { object ( |
フィールド | |
---|---|
property |
段落について検出された追加情報。 |
boundingBox |
段落の境界ボックス。頂点は、左上、右上、右下、左下の順に並んでいます。境界ボックスの回転が検出された場合、回転はテキストを「自然な」方向で読み取るときの左上隅を中心と定義して表されます。例: * テキストが水平の場合、0----1 | | 3----2 なります。* 左上隅を中心に 180 度回転すると、2----3 | | 1----0 となり、頂点の順序は(0、1、2、3)のままです。 |
words[] |
この段落にあるすべての単語のリスト。 |
confidence |
この段落の OCR 結果の信頼度。範囲は [0, 1] です。 |
Word
単語の表現。
JSON 表現 |
---|
{ "property": { object ( |
フィールド | |
---|---|
property |
単語について検出された追加情報。 |
boundingBox |
単語の境界ボックス。頂点は、左上、右上、右下、左下の順に並んでいます。境界ボックスの回転が検出された場合、回転はテキストを「自然な」方向で読み取るときの左上隅を中心と定義して表されます。例: * テキストが水平の場合、0----1 | | 3----2 なります。* 左上隅を中心に 180 度回転すると、2----3 | | 1----0 となり、頂点の順序は(0、1、2、3)のままです。 |
symbols[] |
単語内の記号のリスト。記号の順序は、自然な読み順に従います。 |
confidence |
単語に対する OCR 結果の信頼度。範囲は [0, 1] です。 |
記号
1 つの記号表現。
JSON 表現 |
---|
{ "property": { object ( |
フィールド | |
---|---|
property |
記号について検出された追加情報。 |
boundingBox |
記号の境界ボックス。頂点は、左上、右上、右下、左下の順に並んでいます。境界ボックスの回転が検出された場合、回転はテキストを「自然な」方向で読み取るときの左上隅を中心と定義して表されます。例: * テキストが水平の場合、0----1 | | 3----2 なります。* 左上隅を中心に 180 度回転すると、2----3 | | 1----0 となり、頂点の順序は(0、1、2、3)のままです。 |
text |
記号の実際の UTF-8 表現。 |
confidence |
記号の OCR 結果の信頼度。範囲は [0, 1] です。 |
BlockType
OCR で特定されたブロックのタイプ(テキスト、画像など)。
列挙型 | |
---|---|
UNKNOWN |
不明なブロックタイプ。 |
TEXT |
標準テキスト ブロック。 |
TABLE |
テーブル ブロック。 |
PICTURE |
画像ブロック。 |
RULER |
水平線 / 垂直線ボックス。 |
BARCODE |
バーコード ブロック。 |
ImageAnnotationContext
ファイルから(PDF など)画像が生成された場合は、このメッセージに画像のソースに関する情報が表示されます。
JSON 表現 |
---|
{ "uri": string, "pageNumber": integer } |
フィールド | |
---|---|
uri |
画像の生成に使用されるファイルの URI。 |
pageNumber |
ファイルが PDF または TIFF の場合、このフィールドには、画像の生成に使用されたファイル内のページ番号が示されます。 |