Respons terhadap permintaan anotasi gambar.
Representasi JSON |
---|
{ "textAnnotations": [ { object ( |
Kolom | |
---|---|
textAnnotations[] |
Jika ada, deteksi teks (OCR) telah berhasil diselesaikan. |
fullTextAnnotation |
Jika ada, deteksi teks (OCR) atau deteksi teks dokumen (OCR) telah berhasil diselesaikan. Anotasi ini memberikan hierarki struktural untuk teks yang terdeteksi OCR. |
error |
Jika ditetapkan, mewakili pesan error untuk operasi. Perlu diketahui bahwa anotasi gambar yang terisi selalu benar, bahkan saat |
context |
Jika ada, informasi kontekstual diperlukan untuk memahami asal gambar ini. |
EntityAnnotation
Kumpulan fitur entity yang terdeteksi.
Representasi JSON |
---|
{ "mid": string, "locale": string, "description": string, "score": number, "confidence": number, "topicality": number, "boundingPoly": { object ( |
Kolom | |
---|---|
mid |
ID entity tersembunyi. Beberapa ID mungkin tersedia di API Penelusuran Pustaka Pengetahuan Google. |
locale |
Kode bahasa untuk lokalitas tempat |
description |
Deskripsi tekstual entitas, yang dinyatakan dalam bahasa |
score |
Skor hasil secara keseluruhan. Rentang [0, 1]. |
confidence |
Tidak digunakan lagi. Sebagai gantinya, gunakan |
topicality |
Relevansi label ICA (Image Content Annotation) terhadap gambar. Misalnya, relevansi "menara" cenderung lebih tinggi untuk gambar yang berisi "Menara Eiffel" yang terdeteksi daripada gambar yang berisi bangunan menjulang tinggi yang terdeteksi, meskipun keyakinan bahwa ada menara di setiap gambar mungkin sama. Rentang [0, 1]. |
boundingPoly |
Region gambar entity ini berasal. Tidak diproduksi untuk fitur |
properties[] |
Beberapa entitas mungkin memiliki kolom |
BoundingPoly
Poligon pembatas untuk anotasi gambar yang terdeteksi.
Representasi JSON |
---|
{ "vertices": [ { object ( |
Kolom | |
---|---|
vertices[] |
Puncak poligon pembatas. |
normalizedVertices[] |
Verteks poligon pembatas yang dinormalisasi. |
Vertex
verteks mewakili titik 2D pada gambar. CATATAN: koordinat verteks memiliki skala yang sama dengan gambar asli.
Representasi JSON |
---|
{ "x": integer, "y": integer } |
Kolom | |
---|---|
x |
Koordinat x. |
y |
Koordinat y. |
NormalizedVertex
verteks mewakili titik 2D pada gambar. CATATAN: koordinat verteks yang dinormalisasi akan relatif terhadap gambar asli dan memiliki rentang dari 0 hingga 1.
Representasi JSON |
---|
{ "x": number, "y": number } |
Kolom | |
---|---|
x |
Koordinat x. |
y |
Koordinat y. |
Properti
Property
terdiri dari pasangan nama/nilai yang diberikan pengguna.
Representasi JSON |
---|
{ "name": string, "value": string, "uint64Value": string } |
Kolom | |
---|---|
name |
Nama properti. |
value |
Nilai properti. |
uint64Value |
Nilai properti numerik. |
TextAnnotation
TextAnnotation
berisi representasi terstruktur dari teks yang diekstrak OCR. Hierarki struktur teks yang diekstrak OCR adalah seperti ini:
TextAnnotation
-> Page -> Block -> Paragraph -> Word -> Symbol
TextAnnotation.TextProperty
berikut.
Representasi JSON |
---|
{
"pages": [
{
object ( |
Kolom | |
---|---|
pages[] |
Daftar halaman yang terdeteksi oleh OCR. |
text |
Teks UTF-8 terdeteksi di halaman. |
Page
Halaman yang terdeteksi dari OCR.
Representasi JSON |
---|
{ "property": { object ( |
Kolom | |
---|---|
property |
Informasi tambahan terdeteksi di halaman. |
width |
Lebar halaman. Untuk PDF, satuannya adalah poin. Untuk gambar (termasuk TIFF), satuannya adalah piksel. |
height |
Tinggi halaman. Untuk PDF, satuannya adalah poin. Untuk gambar (termasuk TIFF), satuannya adalah piksel. |
blocks[] |
Daftar blok teks, gambar, dll. pada halaman ini. |
confidence |
Keyakinan hasil OCR pada halaman. Rentang [0, 1]. |
TextProperty
Informasi tambahan terdeteksi pada komponen struktural.
Representasi JSON |
---|
{ "detectedLanguages": [ { object ( |
Kolom | |
---|---|
detectedLanguages[] |
Daftar bahasa yang terdeteksi bersama dengan tingkat keyakinan. |
detectedBreak |
Mendeteksi awal atau akhir dari awal segmen teks. |
DetectedLanguage
Bahasa yang terdeteksi untuk komponen struktural.
Representasi JSON |
---|
{ "languageCode": string, "confidence": number } |
Kolom | |
---|---|
languageCode |
Kode bahasa BCP-47, seperti "en-US" atau "sr-Latn". Untuk mengetahui informasi selengkapnya, lihat https://www.unicode.org/reports/tr35/#Unicode_locale_identifier. |
confidence |
Keyakinan bahasa yang terdeteksi. Rentang [0, 1]. |
DetectedBreak
Awal atau akhir yang terdeteksi dari sebuah komponen struktural.
Representasi JSON |
---|
{
"type": enum ( |
Kolom | |
---|---|
type |
Jenis jeda yang terdeteksi. |
isPrefix |
True jika jeda menambahkan elemen. |
BreakType
Enum untuk menunjukkan jenis jeda yang ditemukan. Baris baru, spasi, dll.
Enum | |
---|---|
UNKNOWN |
Jenis label jeda yang tidak diketahui. |
SPACE |
Spasi reguler. |
SURE_SPACE |
Spasi pasti (sangat lebar). |
EOL_SURE_SPACE |
Jeda penggabungan baris. |
HYPHEN |
Tanda hubung baris akhir yang tidak ada dalam teks; tidak terjadi bersamaan dengan SPACE , LEADER_SPACE , atau LINE_BREAK . |
LINE_BREAK |
Jeda baris yang mengakhiri paragraf. |
Block
Elemen logika pada halaman.
Representasi JSON |
---|
{ "property": { object ( |
Kolom | |
---|---|
property |
Informasi tambahan yang terdeteksi untuk blokir. |
boundingBox |
Kotak pembatas untuk blokir. Titik sudut berada dalam urutan dari sudut kiri-atas, kanan-atas, kanan-bawah, kiri-bawah. Jika rotasi kotak pembatas terdeteksi, rotasi akan ditampilkan di sekitar sudut kiri atas seperti yang didefinisikan saat teks dibaca dalam orientasi 'asli'. Contoh:
dan urutan vertexnya akan tetap (0, 1, 2, 3). |
paragraphs[] |
Daftar paragraf dalam blok ini (jika blok ini berupa teks jenis). |
blockType |
Jenis blok yang terdeteksi (teks, gambar, dll.) untuk blok ini. |
confidence |
Keyakinan hasil OCR pada blok. Rentang [0, 1]. |
Paragraf
Unit struktural teks yang mewakili sejumlah kata dalam urutan tertentu.
Representasi JSON |
---|
{ "property": { object ( |
Kolom | |
---|---|
property |
Informasi tambahan terdeteksi untuk paragraf. |
boundingBox |
Kotak pembatas untuk paragraf. Titik sudut berada dalam urutan dari sudut kiri-atas, kanan-atas, kanan-bawah, kiri-bawah. Jika rotasi kotak pembatas terdeteksi, rotasi akan ditampilkan di sekitar sudut kiri atas seperti yang didefinisikan saat teks dibaca dalam orientasi 'asli'. Misalnya: * saat teks horizontal, tampilannya mungkin seperti ini: 0----1 | | 3----2 * saat diputar 180 derajat mengitari sudut kiri atas menjadi: 2----3 | | 1----0 dan urutan titik sudut akan tetap (0, 1, 2, 3). |
words[] |
Daftar semua kata dalam paragraf ini. |
confidence |
Keyakinan hasil OCR untuk paragraf Rentang [0, 1]. |
Word
Representasi kata.
Representasi JSON |
---|
{ "property": { object ( |
Kolom | |
---|---|
property |
Informasi tambahan yang terdeteksi untuk kata tersebut. |
boundingBox |
Kotak pembatas untuk kata. Titik sudut berada dalam urutan dari sudut kiri-atas, kanan-atas, kanan-bawah, kiri-bawah. Jika rotasi kotak pembatas terdeteksi, rotasi akan ditampilkan di sekitar sudut kiri atas seperti yang didefinisikan saat teks dibaca dalam orientasi 'asli'. Misalnya: * saat teks horizontal, tampilannya mungkin seperti ini: 0----1 | | 3----2 * saat diputar 180 derajat mengitari sudut kiri atas menjadi: 2----3 | | 1----0 dan urutan titik sudut akan tetap (0, 1, 2, 3). |
symbols[] |
Daftar simbol dalam kata. Urutan simbol mengikuti urutan pembacaan alamiahnya. |
confidence |
Tingkat keyakinan hasil OCR untuk kata tersebut. Rentang [0, 1]. |
Simbol
Representasi simbol tunggal.
Representasi JSON |
---|
{ "property": { object ( |
Kolom | |
---|---|
property |
Informasi tambahan terdeteksi untuk simbol. |
boundingBox |
Kotak pembatas untuk simbol. Titik sudut berada dalam urutan dari sudut kiri-atas, kanan-atas, kanan-bawah, kiri-bawah. Jika rotasi kotak pembatas terdeteksi, rotasi akan ditampilkan di sekitar sudut kiri atas seperti yang didefinisikan saat teks dibaca dalam orientasi 'asli'. Misalnya: * saat teks horizontal, tampilannya mungkin seperti ini: 0----1 | | 3----2 * saat diputar 180 derajat mengitari sudut kiri atas menjadi: 2----3 | | 1----0 dan urutan titik sudut akan tetap (0, 1, 2, 3). |
text |
Representasi aktual UTF-8 dari simbol. |
confidence |
Tingkat keyakinan hasil OCR untuk simbol tersebut. Rentang [0, 1]. |
BlockType
Jenis blok (teks, gambar, dll.) seperti yang diidentifikasi oleh OCR.
Enum | |
---|---|
UNKNOWN |
Jenis blok yang tidak diketahui. |
TEXT |
Blok teks biasa. |
TABLE |
Blok tabel. |
PICTURE |
Pemblokiran gambar. |
RULER |
Kotak garis horizontal/vertikal. |
BARCODE |
Blok kode batang. |
ImageAnnotationContext
Jika gambar dihasilkan dari file (misalnya PDF), pesan ini memberikan informasi tentang sumber gambar tersebut.
Representasi JSON |
---|
{ "uri": string, "pageNumber": integer } |
Kolom | |
---|---|
uri |
URI file yang digunakan untuk menghasilkan gambar. |
pageNumber |
Jika filenya berupa PDF atau TIFF, kolom ini akan memberikan nomor halaman dalam file yang digunakan untuk menghasilkan gambar. |