Indeks
ImageAnnotator
(antar muka)AnnotateFileRequest
(pesan)AnnotateFileResponse
(pesan)AnnotateImageRequest
(pesan)AnnotateImageResponse
(pesan)BatchAnnotateFilesRequest
(pesan)BatchAnnotateFilesResponse
(pesan)BatchAnnotateImagesRequest
(pesan)BatchAnnotateImagesResponse
(pesan)Block
(pesan)Block.BlockType
(enum)BoundingPoly
(pesan)EntityAnnotation
(pesan)Feature
(pesan)Feature.Type
(enum)Image
(pesan)ImageAnnotationContext
(pesan)ImageContext
(pesan)InputConfig
(pesan)NormalizedVertex
(pesan)Page
(pesan)Paragraph
(pesan)Property
(pesan)Symbol
(pesan)TextAnnotation
(pesan)TextAnnotation.DetectedBreak
(pesan)TextAnnotation.DetectedBreak.BreakType
(enum)TextAnnotation.DetectedLanguage
(pesan)TextAnnotation.TextProperty
(pesan)TextDetectionParams
(pesan)Vertex
(pesan)Word
(pesan)
ImageAnnotator
Layanan yang menjalankan tugas deteksi Google Cloud Vision API pada gambar klien, seperti deteksi wajah, tempat terkenal, logo, label, dan teks. Layanan ImageAnnotator menampilkan entity yang terdeteksi dari gambar.
BatchAnnotateFile |
---|
Layanan yang menjalankan deteksi dan anotasi gambar untuk batch file. Sekarang hanya "aplikasi/pdf", "gambar/tiff" dan "gambar/gif" yang didukung. Layanan ini akan mengekstrak maksimal 5 (pelanggan dapat menentukan 5 dalam AnnotateFileRequest.pages) frame (gif) atau halaman (pdf atau tiff) dari setiap file yang disediakan dan melakukan deteksi serta anotasi untuk setiap gambar yang diekstrak.
|
BatchAnnotateImages |
---|
Menjalankan deteksi dan anotasi gambar untuk sekumpulan gambar.
|
AnnotateFileRequest
Permintaan untuk menganotasi satu file, misalnya file PDF, TIFF, atau GIF.
Kolom | |
---|---|
input_config |
Wajib. Informasi tentang file input. |
features[] |
Wajib. Fitur yang diminta. |
image_context |
Konteks tambahan yang mungkin menyertai gambar dalam file. |
pages[] |
Halaman file untuk menjalankan anotasi gambar. Halaman dimulai dari 1, kami berasumsi bahwa halaman pertama file adalah halaman 1. Maksimal 5 halaman didukung per permintaan. Halaman bisa negatif. Halaman 1 berarti halaman pertama. Halaman 2 berarti halaman kedua. Halaman -1 berarti halaman terakhir. Halaman -2 berarti halaman kedua dari halaman terakhir. Jika file berupa GIF, bukan PDF atau TIFF, halaman akan merujuk ke frame GIF. Jika kolom ini kosong, secara default layanan akan melakukan anotasi gambar untuk 5 halaman pertama file. |
AnnotateFileResponse
Respons terhadap permintaan anotasi file tunggal. File dapat berisi satu atau beberapa gambar, yang masing-masing memiliki respons tersendiri.
Kolom | |
---|---|
input_config |
Informasi tentang file yang menghasilkan respons ini. |
responses[] |
Respons individual terhadap gambar yang ditemukan dalam file. Kolom ini akan kosong jika kolom |
total_pages |
Kolom ini menunjukkan jumlah total halaman dalam file, |
error |
Jika ditetapkan, menunjukkan pesan error untuk permintaan yang gagal. Kolom |
AnnotateImageRequest
Permintaan untuk menjalankan tugas Google Cloud Vision API pada gambar yang diberikan pengguna, dengan fitur yang diminta pengguna, dan dengan informasi konteks.
Kolom | |
---|---|
image |
Gambar yang akan diproses. |
features[] |
Fitur yang diminta. |
image_context |
Konteks tambahan yang mungkin menyertai gambar. |
AnnotateImageResponse
Respons terhadap permintaan anotasi gambar.
Kolom | |
---|---|
text_annotations[] |
Jika ada, deteksi teks (OCR) telah berhasil diselesaikan. |
full_text_annotation |
Jika ada, deteksi teks (OCR) atau deteksi teks dokumen (OCR) telah berhasil diselesaikan. Anotasi ini memberikan hierarki struktural untuk teks yang terdeteksi OCR. |
error |
Jika ditetapkan, mewakili pesan error untuk operasi. Perlu diketahui bahwa anotasi gambar yang terisi selalu benar, bahkan saat |
context |
Jika ada, informasi kontekstual diperlukan untuk memahami asal gambar ini. |
BatchAnnotateFilesRequest
Daftar permintaan untuk memberi anotasi file menggunakan BatchAnnotateFiles API.
Kolom | |
---|---|
requests[] |
Wajib. Daftar permintaan anotasi file. Saat ini kami hanya mendukung satu AnnotateFileRequest di BatchAnnotateFilesRequest. |
parent |
Opsional. Project target dan lokasi untuk melakukan panggilan. Format Jika tidak ada induk yang ditentukan, region akan dipilih secara otomatis. ID lokasi yang didukung: Contoh: |
BatchAnnotateFilesResponse
Daftar respons anotasi file.
Kolom | |
---|---|
responses[] |
Daftar respons anotasi file, setiap respons sesuai dengan setiap AnnotateFileRequest di BatchAnnotateFilesRequest. |
BatchAnnotateImagesRequest
Beberapa permintaan anotasi gambar dikelompokkan menjadi satu panggilan layanan.
Kolom | |
---|---|
requests[] |
Wajib. Permintaan anotasi gambar individu untuk batch ini. |
parent |
Opsional. Project target dan lokasi untuk melakukan panggilan. Format Jika tidak ada induk yang ditentukan, region akan dipilih secara otomatis. ID lokasi yang didukung: Contoh: |
BatchAnnotateImagesResponse
Respons terhadap permintaan anotasi gambar batch.
Kolom | |
---|---|
responses[] |
Setiap respons terhadap permintaan anotasi gambar dalam batch. |
Blokir
Elemen logika pada halaman.
Kolom | |
---|---|
property |
Informasi tambahan yang terdeteksi untuk blokir. |
bounding_box |
Kotak pembatas untuk blokir. Titik sudut berada dalam urutan dari sudut kiri-atas, kanan-atas, kanan-bawah, kiri-bawah. Jika rotasi kotak pembatas terdeteksi, rotasi akan ditampilkan di sekitar sudut kiri atas seperti yang didefinisikan saat teks dibaca dalam orientasi 'asli'. Contoh:
dan urutan vertexnya akan tetap (0, 1, 2, 3). |
paragraphs[] |
Daftar paragraf dalam blok ini (jika blok ini berupa teks jenis). |
block_type |
Jenis blok yang terdeteksi (teks, gambar, dll.) untuk blok ini. |
confidence |
Keyakinan hasil OCR pada blok. Rentang [0, 1]. |
BlockType
Jenis blok (teks, gambar, dll.) seperti yang diidentifikasi oleh OCR.
Enum | |
---|---|
UNKNOWN |
Jenis blok yang tidak diketahui. |
TEXT |
Blok teks biasa. |
TABLE |
Blok tabel. |
PICTURE |
Pemblokiran gambar. |
RULER |
Kotak garis horizontal/vertikal. |
BARCODE |
Blok kode batang. |
BoundingPoly
Poligon pembatas untuk anotasi gambar yang terdeteksi.
Kolom | |
---|---|
vertices[] |
Puncak poligon pembatas. |
normalized_vertices[] |
Verteks poligon pembatas yang dinormalisasi. |
EntityAnnotation
Kumpulan fitur entitas yang terdeteksi.
Kolom | |
---|---|
mid |
ID entity tersembunyi. Beberapa ID mungkin tersedia di API Penelusuran Pustaka Pengetahuan Google. |
locale |
Kode bahasa untuk lokalitas tempat |
description |
Deskripsi tekstual entitas, yang dinyatakan dalam bahasa |
score |
Skor hasil secara keseluruhan. Rentang [0, 1]. |
confidence |
Tidak digunakan lagi. Sebagai gantinya, gunakan |
topicality |
Relevansi label ICA (Image Content Annotation) terhadap gambar. Misalnya, relevansi "menara" cenderung lebih tinggi untuk gambar yang berisi "Menara Eiffel" yang terdeteksi daripada gambar yang berisi bangunan menjulang tinggi yang terdeteksi, meskipun keyakinan bahwa ada menara di setiap gambar mungkin sama. Rentang [0, 1]. |
bounding_poly |
Region gambar entity ini berasal. Tidak diproduksi untuk fitur |
properties[] |
Beberapa entitas mungkin memiliki kolom |
Fitur
Jenis deteksi Google Cloud Vision API yang akan dijalankan, dan jumlah hasil maksimum yang akan ditampilkan untuk jenis tersebut. Beberapa objek Feature
dapat dispesifikasi dalam daftar features
.
Kolom | |
---|---|
type |
Jenis fitur. |
model |
Model yang akan digunakan untuk fitur. Nilai yang didukung: "builtin/stable" (default jika tidak disetel) dan "builtin/latest". |
Jenis
Jenis fitur Google Cloud Vision API yang akan diekstrak.
Enum | |
---|---|
TYPE_UNSPECIFIED |
Jenis fitur belum ditetapkan. |
TEXT_DETECTION |
Menjalankan deteksi teks / pengenalan karakter optik (OCR). Deteksi teks dioptimalkan untuk area teks dalam gambar yang lebih besar; jika gambar berupa dokumen, gunakan DOCUMENT_TEXT_DETECTION . |
DOCUMENT_TEXT_DETECTION |
Jalankan OCR dokumen teks padat. Gunakan prioritas saat DOCUMENT_TEXT_DETECTION dan TEXT_DETECTION keduanya ada |
Gambar
Image klien untuk menjalankan tugas Google Cloud Vision API.
Kolom | |
---|---|
content |
Konten gambar, direpresentasikan sebagai aliran byte. Catatan: Seperti semua kolom Saat ini, kolom ini hanya berfungsi untuk permintaan BatchAnnotateImages. Kode ini tidak berfungsi untuk permintaan AsyncBatchAnnotateImages. |
ImageAnnotationContext
Jika gambar dibuat dari file (misalnya PDF), pesan ini memberikan informasi tentang sumber gambar tersebut.
Kolom | |
---|---|
uri |
URI file yang digunakan untuk menghasilkan gambar. |
page_number |
Jika filenya berupa PDF atau TIFF, kolom ini akan memberikan nomor halaman dalam file yang digunakan untuk menghasilkan gambar. |
ImageContext
Konteks gambar dan/atau parameter khusus fitur.
Kolom | |
---|---|
language_hints[] |
Daftar bahasa yang akan digunakan untuk TEXT_DETECTION. Dalam kebanyakan, nilai kosong memberikan hasil terbaik karena memungkinkan deteksi bahasa secara otomatis. Untuk bahasa yang didasarkan pada alfabet Latin, setelan |
text_detection_params |
Parameter untuk deteksi teks dan deteksi teks dokumen. |
InputConfig
Lokasi input dan metadata yang diinginkan.
Kolom | |
---|---|
content |
Konten file, direpresentasikan sebagai aliran byte. Catatan: Seperti semua kolom Saat ini, kolom ini hanya berfungsi untuk permintaan BatchAnnotateFiles saja. Kode ini tidak berfungsi untuk permintaan AsyncBatchAnnotateFiles. |
mime_type |
Jenis file. Saat ini, hanya "aplikasi/pdf", "gambar/tiff", dan "gambar/gif" yang didukung. Karakter pengganti tidak didukung. |
NormalizedVertex
verteks mewakili titik 2D pada gambar. CATATAN: koordinat verteks yang dinormalisasi akan relatif terhadap gambar asli dan memiliki rentang dari 0 hingga 1.
Kolom | |
---|---|
x |
Koordinat x. |
y |
Koordinat y. |
Halaman
Halaman yang terdeteksi dari OCR.
Kolom | |
---|---|
property |
Informasi tambahan terdeteksi di halaman. |
width |
Lebar halaman. Untuk PDF, satuannya adalah poin. Untuk gambar (termasuk TIFF), satuannya adalah piksel. |
height |
Tinggi halaman. Untuk PDF, satuannya adalah poin. Untuk gambar (termasuk TIFF), satuannya adalah piksel. |
blocks[] |
Daftar blok teks, gambar, dll. pada halaman ini. |
confidence |
Keyakinan hasil OCR pada halaman. Rentang [0, 1]. |
Paragraf
Unit struktural teks yang mewakili sejumlah kata dalam urutan tertentu.
Kolom | |
---|---|
property |
Informasi tambahan terdeteksi untuk paragraf. |
bounding_box |
Kotak pembatas untuk paragraf. Titik sudut berada dalam urutan dari sudut kiri-atas, kanan-atas, kanan-bawah, kiri-bawah. Jika rotasi kotak pembatas terdeteksi, rotasi akan ditampilkan di sekitar sudut kiri atas seperti yang didefinisikan saat teks dibaca dalam orientasi 'asli'. Misalnya: * saat teks horizontal, tampilannya mungkin seperti ini: 0----1 | | 3----2 * saat diputar 180 derajat mengitari sudut kiri atas menjadi: 2----3 | | 1----0 dan urutan titik sudut akan tetap (0, 1, 2, 3). |
words[] |
Daftar semua kata dalam paragraf ini. |
confidence |
Keyakinan hasil OCR untuk paragraf Rentang [0, 1]. |
Properti
Property
terdiri dari pasangan nama/nilai yang diberikan pengguna.
Kolom | |
---|---|
name |
Nama properti. |
value |
Nilai properti. |
uint64_value |
Nilai properti numerik. |
Simbol
Representasi simbol tunggal.
Kolom | |
---|---|
property |
Informasi tambahan terdeteksi untuk simbol. |
bounding_box |
Kotak pembatas untuk simbol. Titik sudut berada dalam urutan dari sudut kiri-atas, kanan-atas, kanan-bawah, kiri-bawah. Jika rotasi kotak pembatas terdeteksi, rotasi akan ditampilkan di sekitar sudut kiri atas seperti yang didefinisikan saat teks dibaca dalam orientasi 'asli'. Misalnya: * saat teks horizontal, tampilannya mungkin seperti ini: 0----1 | | 3----2 * saat diputar 180 derajat mengitari sudut kiri atas menjadi: 2----3 | | 1----0 dan urutan titik sudut akan tetap (0, 1, 2, 3). |
text |
Representasi aktual UTF-8 dari simbol. |
confidence |
Tingkat keyakinan hasil OCR untuk simbol tersebut. Rentang [0, 1]. |
TextAnnotation
TextAnnotation
berisi representasi terstruktur dari teks yang diekstrak OCR. Hierarki struktur teks yang diekstrak OCR adalah seperti ini:
TextAnnotation
-> Halaman -> Blok -> Paragraf -> Kata -> Simbol
TextAnnotation.TextProperty
berikut.
Kolom | |
---|---|
pages[] |
Daftar halaman yang terdeteksi oleh OCR. |
text |
Teks UTF-8 terdeteksi di halaman. |
DetectedBreak
Awal atau akhir yang terdeteksi dari sebuah komponen struktural.
Kolom | |
---|---|
type |
Jenis jeda yang terdeteksi. |
is_prefix |
True jika jeda menambahkan elemen. |
BreakType
Enum untuk menunjukkan jenis jeda yang ditemukan. Baris baru, spasi, dll.
Enum | |
---|---|
UNKNOWN |
Jenis label jeda yang tidak diketahui. |
SPACE |
Spasi reguler. |
SURE_SPACE |
Spasi pasti (sangat lebar). |
EOL_SURE_SPACE |
Jeda penggabungan baris. |
HYPHEN |
Tanda hubung baris akhir yang tidak ada dalam teks; tidak terjadi bersamaan dengan SPACE , LEADER_SPACE , atau LINE_BREAK . |
LINE_BREAK |
Jeda baris yang mengakhiri paragraf. |
DetectedLanguage
Bahasa yang terdeteksi untuk komponen struktural.
Kolom | |
---|---|
language_code |
Kode bahasa BCP-47, seperti "en-US" atau "sr-Latn". Untuk mengetahui informasi selengkapnya, lihat https://www.unicode.org/reports/tr35/#Unicode_locale_identifier. |
confidence |
Keyakinan bahasa yang terdeteksi. Rentang [0, 1]. |
TextProperty
Informasi tambahan terdeteksi pada komponen struktural.
Kolom | |
---|---|
detected_languages[] |
Daftar bahasa yang terdeteksi bersama dengan tingkat keyakinan. |
detected_break |
Mendeteksi awal atau akhir dari awal segmen teks. |
TextDetectionParams
Parameter untuk deteksi teks. Ini digunakan untuk mengontrol fitur TEXT_DETECTION dan DOCUMENT_TEXT_DETECTION.
Kolom | |
---|---|
enable_text_detection_confidence_score |
Secara default, Cloud Vision API hanya menyertakan skor keyakinan untuk hasil DOCUMENT_TEXT_DETECTION. Tetapkan tanda ke benar (true) untuk menyertakan skor keyakinan untuk TEXT_DETECTION juga. |
advanced_ocr_options[] |
Daftar opsi OCR lanjutan untuk menyempurnakan perilaku OCR. |
Vertex
verteks mewakili titik 2D pada gambar. CATATAN: koordinat verteks memiliki skala yang sama dengan gambar asli.
Kolom | |
---|---|
x |
Koordinat x. |
y |
Koordinat y. |
Word
Representasi kata.
Kolom | |
---|---|
property |
Informasi tambahan yang terdeteksi untuk kata tersebut. |
bounding_box |
Kotak pembatas untuk kata. Titik sudut berada dalam urutan dari sudut kiri-atas, kanan-atas, kanan-bawah, kiri-bawah. Jika rotasi kotak pembatas terdeteksi, rotasi akan ditampilkan di sekitar sudut kiri atas seperti yang didefinisikan saat teks dibaca dalam orientasi 'asli'. Misalnya: * saat teks horizontal, tampilannya mungkin seperti ini: 0----1 | | 3----2 * saat diputar 180 derajat mengitari sudut kiri atas menjadi: 2----3 | | 1----0 dan urutan titik sudut akan tetap (0, 1, 2, 3). |
symbols[] |
Daftar simbol dalam kata. Urutan simbol mengikuti urutan pembacaan alamiahnya. |
confidence |
Tingkat keyakinan hasil OCR untuk kata tersebut. Rentang [0, 1]. |