Daftar fitur

Vision API saat ini memungkinkan Anda menggunakan fitur berikut:

Semua jenis fitur

Deteksi teks

Gambar rambu jalan
  • Pengenalan karakter optik (OCR) untuk gambar; pengenalan teks dan konversi menjadi teks berkode mesin. Mengidentifikasi dan mengekstrak teks UTF-8 dalam gambar.
  • Gambar: Dioptimalkan untuk sparsearea teks dalam gambar yang lebih besar.
  • Response: Menampilkan daftar kata yang diidentifikasi dengan teks, kotak pembatas, dan textAnnotations, serta struktur hierarki untuk teks yang terdeteksi OCR (fullTextAnnotation).
    • Hierarki struktur teks yang diekstrak:
      • TextAnnotation -> Page -> Block -> Paragraph -> Word -> Symbol.
      • Setiap komponen struktural dari Halaman dapat memiliki propertinya sendiri seperti bahasa yang terdeteksi, jeda, dll.
  • Bahasa yang didukung: Berfungsi dengan bahasa yang saat ini didukung, dipetakan, dan eksperimental bahasa
  • Nilai fitur enum: TEXT_DETECTION.

Deteksi teks dokumen (teks padat / tulisan tangan)

Gambar padat dengan anotasi
gambar tulisan tangan
  • Pengenalan karakter optik (OCR) untuk file (PDF/TIFF) atau gambar teks padat; pengenalan teks padat dan konversi menjadi teks berkode mesin.
  • File: Dioptimalkan untuk file dokumen (PDF/TIFF).
  • Gambar: Dioptimalkan untuk area teks padat dalam gambar (gambar yang merupakan dokumen), dan gambar yang berisi tulisan tangan.
  • Response: Menampilkan hierarki struktural untuk teks yang terdeteksi OCR (fullTextAnnotation).
    • Hierarki struktur teks yang diekstrak:
      • TextAnnotation -> Page -> Block -> Paragraph -> Word -> Symbol.
      • Setiap komponen struktural dari Halaman dapat memiliki propertinya sendiri seperti bahasa yang terdeteksi, jeda, dll.
  • Bahasa yang didukung: Berfungsi dengan bahasa yang saat ini didukung, dipetakan, dan eksperimental bahasa
  • Nilai fitur enum: DOCUMENT_TEXT_DETECTION.
    • Lebih diutamakan jika ada DOCUMENT_TEXT_DETECTION dan TEXT_DETECTION.

Deteksi penanda 1

Gambar Katedral St Basil's
  • Memberikan nama tempat terkenal, skor keyakinan, dan kotak pembatas pada gambar untuk tempat terkenal tersebut.
  • Memberikan koordinat untuk entitas yang terdeteksi.

Deteksi logo 2

logo yang dianotasi
  • Memberikan deskripsi tekstual dari entitas yang diidentifikasi, skor keyakinan, dan poligon pembatas untuk logo dalam file.

Deteksi label 3

Gambar jalan Shanghai
  • Memberikan label umum untuk gambar.
  • Untuk setiap label, menampilkan deskripsi tekstual, skor keyakinan, dan rating keaktualan.

Properti gambar 4

Gambar Bali dengan properti
  • Menampilkan warna dominan dalam gambar.
  • Setiap warna direpresentasikan dalam ruang warna RGBA, memiliki skor keyakinan, dan menampilkan fraksi piksel yang ditempati oleh warna [0, 1].

Lokalisasi objek 5

gambar dengan kotak pembatas
  • Memberikan anotasi label umum dan kotak pembatas untuk beberapa objek yang dikenali dalam satu gambar.
  • Untuk setiap objek yang terdeteksi, elemen berikut akan ditampilkan: deskripsi tekstual, skor keyakinan, dan vertex [0,1] yang dinormalisasi untuk poligon pembatas di sekitar objek.

Deteksi petunjuk pemangkasan 6

gambar dengan versi yang dipangkas
  • Memberikan poligon pembatas untuk gambar yang dipangkas, skor keyakinan, dan fraksi tingkat kepentingan region penting ini sehubungan dengan gambar asli untuk setiap permintaan.
  • Anda dapat memberikan hingga 16 nilai rasio gambar (lebar:tinggi) untuk satu gambar.

Halaman dan entity web 7

gambar dengan tabel entitas web
  • Memberikan serangkaian konten Web terkait ke gambar.
  • Menampilkan informasi berikut:
    • Entity web: Entity yang disimpulkan (label/deskripsi) dari gambar serupa di Web.
    • Gambar yang sepenuhnya cocok: Daftar URL untuk gambar yang sepenuhnya cocok dalam ukuran apa pun di Internet.
    • Gambar cocok yang sebagian: Daftar URL untuk gambar yang memiliki fitur titik kunci yang sama, seperti versi gambar asli yang dipangkas.
    • Halaman dengan gambar yang cocok: Daftar Halaman Web (diidentifikasi oleh URL halaman, judul halaman, URL gambar yang cocok) dengan gambar yang memenuhi kondisi yang dijelaskan di atas.
    • Gambar yang mirip secara visual: Daftar URL untuk gambar yang memiliki beberapa fitur dengan gambar asli.
    • Label perkiraan terbaik: Perkiraan terbaik terkait topik gambar yang diminta yang disimpulkan dari gambar serupa di Internet.

Deteksi konten vulgar (SafeSearch)

  • Memberikan rating kemungkinan untuk kategori konten eksplisit berikut: adult, spoof, medical, violence, dan racy.
  • Rating kemungkinan dibedakan menjadi enam nilai berbeda: UNKNOWN, VERY_UNLIKELY, UNLIKELY, POSSIBLE, LIKELY, atau VERY_LIKELY.

Deteksi wajah

gambar contoh dengan deteksi wajah
  • Menemukan wajah dengan poligon pembatas, dan mengidentifikasi "titik acuan" wajah tertentu seperti mata, telinga, hidung, mulut, dll. beserta nilai keyakinan yang sesuai.
  • Menampilkan rating kemungkinan untuk emosi (kegembiraan, kesedihan, kemarahan, kejutan) dan properti gambar umum (underexposed, blur, headwear present).
  • Rating biasanya dibedakan menjadi 6 nilai berbeda: UNKNOWN, VERY_UNLIKELY, UNLIKELY, POSSIBLE, LIKELY, or VERY_LIKELY.
  • Pengenalan Wajah individu tertentu tidak didukung.

1. Kredit gambar: Nikolay Vorobyev di Unsplash (anotasi ditambahkan).

2. Kredit gambar: Robert Scoble (CC BY 2.0, anotasi ditambahkan).

3. Kredit gambar: Alex Knight di Unsplash.

4. Kredit gambar: Jeremy Bishop di Unsplash.

5. Kredit gambar: Bogdan Dada di Unsplash (anotasi ditambahkan).

6. Kredit gambar: Yasmin Dangor di Unsplash (gambar asli dan gambar yang dipangkas ditampilkan).

7. Kredit gambar: Quinten de Graaf di Unsplash.