AnnotateImageResponse

Respons terhadap permintaan anotasi gambar.

Representasi JSON
{
  "textAnnotations": [
    {
      object (EntityAnnotation)
    }
  ],
  "fullTextAnnotation": {
    object (TextAnnotation)
  },
  "error": {
    object (Status)
  },
  "context": {
    object (ImageAnnotationContext)
  }
}
Kolom
textAnnotations[]

object (EntityAnnotation)

Jika ada, deteksi teks (OCR) telah berhasil diselesaikan.

fullTextAnnotation

object (TextAnnotation)

Jika ada, deteksi teks (OCR) atau deteksi teks dokumen (OCR) telah berhasil diselesaikan. Anotasi ini memberikan hierarki struktural untuk teks yang terdeteksi OCR.

error

object (Status)

Jika ditetapkan, mewakili pesan error untuk operasi. Perlu diketahui bahwa anotasi gambar yang terisi selalu benar, bahkan saat error disetel.

context

object (ImageAnnotationContext)

Jika ada, informasi kontekstual diperlukan untuk memahami asal gambar ini.

EntityAnnotation

Kumpulan fitur entity yang terdeteksi.

Representasi JSON
{
  "mid": string,
  "locale": string,
  "description": string,
  "score": number,
  "confidence": number,
  "topicality": number,
  "boundingPoly": {
    object (BoundingPoly)
  },
  "properties": [
    {
      object (Property)
    }
  ]
}
Kolom
mid

string

ID entity tersembunyi. Beberapa ID mungkin tersedia di API Penelusuran Pustaka Pengetahuan Google.

locale

string

Kode bahasa untuk lokalitas tempat description tekstual entitas dinyatakan.

description

string

Deskripsi tekstual entitas, yang dinyatakan dalam bahasa locale.

score

number

Skor hasil secara keseluruhan. Rentang [0, 1].

confidence
(deprecated)

number

Tidak digunakan lagi. Sebagai gantinya, gunakan score. Keakuratan deteksi entity dalam gambar. Misalnya, untuk gambar yang mendeteksi entitas "Menara Eiffel", kolom ini merepresentasikan keyakinan bahwa ada menara dalam kueri gambar. Rentang [0, 1].

topicality

number

Relevansi label ICA (Image Content Annotation) terhadap gambar. Misalnya, relevansi "menara" cenderung lebih tinggi untuk gambar yang berisi "Menara Eiffel" yang terdeteksi daripada gambar yang berisi bangunan menjulang tinggi yang terdeteksi, meskipun keyakinan bahwa ada menara di setiap gambar mungkin sama. Rentang [0, 1].

boundingPoly

object (BoundingPoly)

Region gambar entity ini berasal. Tidak diproduksi untuk fitur LABEL_DETECTION.

properties[]

object (Property)

Beberapa entitas mungkin memiliki kolom Property (nama/nilai) opsional yang disediakan pengguna. Seperti, skor atau string yang memenuhi syarat untuk entity.

BoundingPoly

Poligon pembatas untuk anotasi gambar yang terdeteksi.

Representasi JSON
{
  "vertices": [
    {
      object (Vertex)
    }
  ],
  "normalizedVertices": [
    {
      object (NormalizedVertex)
    }
  ]
}
Kolom
vertices[]

object (Vertex)

Puncak poligon pembatas.

normalizedVertices[]

object (NormalizedVertex)

Verteks poligon pembatas yang dinormalisasi.

Vertex

verteks mewakili titik 2D pada gambar. CATATAN: koordinat verteks memiliki skala yang sama dengan gambar asli.

Representasi JSON
{
  "x": integer,
  "y": integer
}
Kolom
x

integer

Koordinat x.

y

integer

Koordinat y.

NormalizedVertex

verteks mewakili titik 2D pada gambar. CATATAN: koordinat verteks yang dinormalisasi akan relatif terhadap gambar asli dan memiliki rentang dari 0 hingga 1.

Representasi JSON
{
  "x": number,
  "y": number
}
Kolom
x

number

Koordinat x.

y

number

Koordinat y.

Properti

Property terdiri dari pasangan nama/nilai yang diberikan pengguna.

Representasi JSON
{
  "name": string,
  "value": string,
  "uint64Value": string
}
Kolom
name

string

Nama properti.

value

string

Nilai properti.

uint64Value

string

Nilai properti numerik.

TextAnnotation

TextAnnotation berisi representasi terstruktur dari teks yang diekstrak OCR. Hierarki struktur teks yang diekstrak OCR adalah seperti ini:

TextAnnotation-> Page -> Block -> Paragraph -> Word -> Symbol

Setiap komponen struktural, mulai dari Halaman, mungkin memiliki properti, yang menjelaskan bahasa yang terdeteksi, jeda, dll. Untuk mengetahui informasi selengkapnya, lihat definisi pesan TextAnnotation.TextProperty berikut.

Representasi JSON
{
  "pages": [
    {
      object (Page)
    }
  ],
  "text": string
}
Kolom
pages[]

object (Page)

Daftar halaman yang terdeteksi oleh OCR.

text

string

Teks UTF-8 terdeteksi di halaman.

Page

Halaman yang terdeteksi dari OCR.

Representasi JSON
{
  "property": {
    object (TextProperty)
  },
  "width": integer,
  "height": integer,
  "blocks": [
    {
      object (Block)
    }
  ],
  "confidence": number
}
Kolom
property

object (TextProperty)

Informasi tambahan terdeteksi di halaman.

width

integer

Lebar halaman. Untuk PDF, satuannya adalah poin. Untuk gambar (termasuk TIFF), satuannya adalah piksel.

height

integer

Tinggi halaman. Untuk PDF, satuannya adalah poin. Untuk gambar (termasuk TIFF), satuannya adalah piksel.

blocks[]

object (Block)

Daftar blok teks, gambar, dll. pada halaman ini.

confidence

number

Keyakinan hasil OCR pada halaman. Rentang [0, 1].

TextProperty

Informasi tambahan terdeteksi pada komponen struktural.

Representasi JSON
{
  "detectedLanguages": [
    {
      object (DetectedLanguage)
    }
  ],
  "detectedBreak": {
    object (DetectedBreak)
  }
}
Kolom
detectedLanguages[]

object (DetectedLanguage)

Daftar bahasa yang terdeteksi bersama dengan tingkat keyakinan.

detectedBreak

object (DetectedBreak)

Mendeteksi awal atau akhir dari awal segmen teks.

DetectedLanguage

Bahasa yang terdeteksi untuk komponen struktural.

Representasi JSON
{
  "languageCode": string,
  "confidence": number
}
Kolom
languageCode

string

Kode bahasa BCP-47, seperti "en-US" atau "sr-Latn". Untuk mengetahui informasi selengkapnya, lihat https://www.unicode.org/reports/tr35/#Unicode_locale_identifier.

confidence

number

Keyakinan bahasa yang terdeteksi. Rentang [0, 1].

DetectedBreak

Awal atau akhir yang terdeteksi dari sebuah komponen struktural.

Representasi JSON
{
  "type": enum (BreakType),
  "isPrefix": boolean
}
Kolom
type

enum (BreakType)

Jenis jeda yang terdeteksi.

isPrefix

boolean

True jika jeda menambahkan elemen.

BreakType

Enum untuk menunjukkan jenis jeda yang ditemukan. Baris baru, spasi, dll.

Enum
UNKNOWN Jenis label jeda yang tidak diketahui.
SPACE Spasi reguler.
SURE_SPACE Spasi pasti (sangat lebar).
EOL_SURE_SPACE Jeda penggabungan baris.
HYPHEN Tanda hubung baris akhir yang tidak ada dalam teks; tidak terjadi bersamaan dengan SPACE, LEADER_SPACE, atau LINE_BREAK.
LINE_BREAK Jeda baris yang mengakhiri paragraf.

Block

Elemen logika pada halaman.

Representasi JSON
{
  "property": {
    object (TextProperty)
  },
  "boundingBox": {
    object (BoundingPoly)
  },
  "paragraphs": [
    {
      object (Paragraph)
    }
  ],
  "blockType": enum (BlockType),
  "confidence": number
}
Kolom
property

object (TextProperty)

Informasi tambahan yang terdeteksi untuk blokir.

boundingBox

object (BoundingPoly)

Kotak pembatas untuk blokir. Titik sudut berada dalam urutan dari sudut kiri-atas, kanan-atas, kanan-bawah, kiri-bawah. Jika rotasi kotak pembatas terdeteksi, rotasi akan ditampilkan di sekitar sudut kiri atas seperti yang didefinisikan saat teks dibaca dalam orientasi 'asli'. Contoh:

  • saat teks horizontal, bentuknya akan terlihat seperti ini:
    0----1
    |    |
    3----2
  • saat diputar 180 derajat di sudut kiri atas, menjadi:
    2----3
    |    |
    1----0

dan urutan vertexnya akan tetap (0, 1, 2, 3).

paragraphs[]

object (Paragraph)

Daftar paragraf dalam blok ini (jika blok ini berupa teks jenis).

blockType

enum (BlockType)

Jenis blok yang terdeteksi (teks, gambar, dll.) untuk blok ini.

confidence

number

Keyakinan hasil OCR pada blok. Rentang [0, 1].

Paragraf

Unit struktural teks yang mewakili sejumlah kata dalam urutan tertentu.

Representasi JSON
{
  "property": {
    object (TextProperty)
  },
  "boundingBox": {
    object (BoundingPoly)
  },
  "words": [
    {
      object (Word)
    }
  ],
  "confidence": number
}
Kolom
property

object (TextProperty)

Informasi tambahan terdeteksi untuk paragraf.

boundingBox

object (BoundingPoly)

Kotak pembatas untuk paragraf. Titik sudut berada dalam urutan dari sudut kiri-atas, kanan-atas, kanan-bawah, kiri-bawah. Jika rotasi kotak pembatas terdeteksi, rotasi akan ditampilkan di sekitar sudut kiri atas seperti yang didefinisikan saat teks dibaca dalam orientasi 'asli'. Misalnya: * saat teks horizontal, tampilannya mungkin seperti ini: 0----1 | | 3----2 * saat diputar 180 derajat mengitari sudut kiri atas menjadi: 2----3 | | 1----0 dan urutan titik sudut akan tetap (0, 1, 2, 3).

words[]

object (Word)

Daftar semua kata dalam paragraf ini.

confidence

number

Keyakinan hasil OCR untuk paragraf Rentang [0, 1].

Word

Representasi kata.

Representasi JSON
{
  "property": {
    object (TextProperty)
  },
  "boundingBox": {
    object (BoundingPoly)
  },
  "symbols": [
    {
      object (Symbol)
    }
  ],
  "confidence": number
}
Kolom
property

object (TextProperty)

Informasi tambahan yang terdeteksi untuk kata tersebut.

boundingBox

object (BoundingPoly)

Kotak pembatas untuk kata. Titik sudut berada dalam urutan dari sudut kiri-atas, kanan-atas, kanan-bawah, kiri-bawah. Jika rotasi kotak pembatas terdeteksi, rotasi akan ditampilkan di sekitar sudut kiri atas seperti yang didefinisikan saat teks dibaca dalam orientasi 'asli'. Misalnya: * saat teks horizontal, tampilannya mungkin seperti ini: 0----1 | | 3----2 * saat diputar 180 derajat mengitari sudut kiri atas menjadi: 2----3 | | 1----0 dan urutan titik sudut akan tetap (0, 1, 2, 3).

symbols[]

object (Symbol)

Daftar simbol dalam kata. Urutan simbol mengikuti urutan pembacaan alamiahnya.

confidence

number

Tingkat keyakinan hasil OCR untuk kata tersebut. Rentang [0, 1].

Simbol

Representasi simbol tunggal.

Representasi JSON
{
  "property": {
    object (TextProperty)
  },
  "boundingBox": {
    object (BoundingPoly)
  },
  "text": string,
  "confidence": number
}
Kolom
property

object (TextProperty)

Informasi tambahan terdeteksi untuk simbol.

boundingBox

object (BoundingPoly)

Kotak pembatas untuk simbol. Titik sudut berada dalam urutan dari sudut kiri-atas, kanan-atas, kanan-bawah, kiri-bawah. Jika rotasi kotak pembatas terdeteksi, rotasi akan ditampilkan di sekitar sudut kiri atas seperti yang didefinisikan saat teks dibaca dalam orientasi 'asli'. Misalnya: * saat teks horizontal, tampilannya mungkin seperti ini: 0----1 | | 3----2 * saat diputar 180 derajat mengitari sudut kiri atas menjadi: 2----3 | | 1----0 dan urutan titik sudut akan tetap (0, 1, 2, 3).

text

string

Representasi aktual UTF-8 dari simbol.

confidence

number

Tingkat keyakinan hasil OCR untuk simbol tersebut. Rentang [0, 1].

BlockType

Jenis blok (teks, gambar, dll.) seperti yang diidentifikasi oleh OCR.

Enum
UNKNOWN Jenis blok yang tidak diketahui.
TEXT Blok teks biasa.
TABLE Blok tabel.
PICTURE Pemblokiran gambar.
RULER Kotak garis horizontal/vertikal.
BARCODE Blok kode batang.

ImageAnnotationContext

Jika gambar dihasilkan dari file (misalnya PDF), pesan ini memberikan informasi tentang sumber gambar tersebut.

Representasi JSON
{
  "uri": string,
  "pageNumber": integer
}
Kolom
uri

string

URI file yang digunakan untuk menghasilkan gambar.

pageNumber

integer

Jika filenya berupa PDF atau TIFF, kolom ini akan memberikan nomor halaman dalam file yang digunakan untuk menghasilkan gambar.