Mendeteksi label pada gambar menggunakan command line

Halaman ini menunjukkan cara mengirim tiga permintaan deteksi fitur dan anotasi ke Vision API menggunakan antarmuka REST dan perintah curl.

Vision API memungkinkan integrasi teknologi pengenalan visi Google yang mudah ke dalam aplikasi developer. Anda dapat mengirim data gambar dan jenis fitur yang diinginkan ke Vision API, yang kemudian menampilkan respons yang sesuai berdasarkan atribut gambar yang Anda minati. Untuk mengetahui informasi selengkapnya tentang jenis fitur yang ditawarkan, lihat Daftar semua fitur Vision API.

Sebelum memulai

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. Install the Google Cloud CLI.
  3. To initialize the gcloud CLI, run the following command:

    gcloud init
  4. Create or select a Google Cloud project.

    • Create a Google Cloud project:

      gcloud projects create PROJECT_ID

      Replace PROJECT_ID with a name for the Google Cloud project you are creating.

    • Select the Google Cloud project that you created:

      gcloud config set project PROJECT_ID

      Replace PROJECT_ID with your Google Cloud project name.

  5. Make sure that billing is enabled for your Google Cloud project.

  6. Enable the Vision API:

    gcloud services enable vision.googleapis.com
  7. Grant roles to your user account. Run the following command once for each of the following IAM roles: roles/storage.objectViewer

    gcloud projects add-iam-policy-binding PROJECT_ID --member="user:USER_IDENTIFIER" --role=ROLE
    • Replace PROJECT_ID with your project ID.
    • Replace USER_IDENTIFIER with the identifier for your user account. For example, user:myemail@example.com.

    • Replace ROLE with each individual role.
  8. Install the Google Cloud CLI.
  9. To initialize the gcloud CLI, run the following command:

    gcloud init
  10. Create or select a Google Cloud project.

    • Create a Google Cloud project:

      gcloud projects create PROJECT_ID

      Replace PROJECT_ID with a name for the Google Cloud project you are creating.

    • Select the Google Cloud project that you created:

      gcloud config set project PROJECT_ID

      Replace PROJECT_ID with your Google Cloud project name.

  11. Make sure that billing is enabled for your Google Cloud project.

  12. Enable the Vision API:

    gcloud services enable vision.googleapis.com
  13. Grant roles to your user account. Run the following command once for each of the following IAM roles: roles/storage.objectViewer

    gcloud projects add-iam-policy-binding PROJECT_ID --member="user:USER_IDENTIFIER" --role=ROLE
    • Replace PROJECT_ID with your project ID.
    • Replace USER_IDENTIFIER with the identifier for your user account. For example, user:myemail@example.com.

    • Replace ROLE with each individual role.

Membuat permintaan anotasi gambar

Setelah menyelesaikan langkah Sebelum memulai, Anda dapat menggunakan Vision API untuk menganotasi file gambar.

Dalam contoh ini, Anda menggunakan curl untuk mengirim permintaan ke Vision API menggunakan gambar berikut:

Cloud Storage URI:

gs://cloud-samples-data/vision/using_curl/shanghai.jpeg

HTTPS URL:

https://console.cloud.google.com/storage/browser/cloud-samples-data/vision/using_curl/shanghai.jpeg

Gambar jalan Shanghai.
Kredit gambar: Steve Long di Unsplash.

Membuat JSON permintaan

File request.json berikut menunjukkan cara meminta tiga fitur images:annotate dan membatasi hasil dalam respons.

Buat file permintaan JSON dengan teks berikut, dan simpan sebagai file teks biasa request.json di direktori kerja Anda:

request.json

{
  "requests": [
    {
      "image": {
        "source": {
          "imageUri": "gs://cloud-samples-data/vision/using_curl/shanghai.jpeg"
        }
      },
      "features": [
        {
          "type": "LABEL_DETECTION",
          "maxResults": 3
        },
        {
          "type": "OBJECT_LOCALIZATION",
          "maxResults": 1
        },
        {
          "type": "TEXT_DETECTION",
          "maxResults": 1,
          "model": "builtin/latest"
        }
      ]
    }
  ]
}

Kirim permintaan

Anda menggunakan curl dan konten isi dari request.json untuk mengirim permintaan ke Vision API. Masukkan baris berikut pada command line Anda:

curl -X POST \
    -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "x-goog-user-project: PROJECT_ID" \
    -H "Content-Type: application/json; charset=utf-8" \
    https://vision.googleapis.com/v1/images:annotate -d @request.json

Menafsirkan respons

Anda akan melihat respons JSON yang mirip dengan yang di bawah ini.

Isi JSON permintaan menentukan maxResults untuk setiap jenis anotasi. Akibatnya, Anda akan melihat hal berikut dalam JSON respons:

Hasil deteksi label

  1. deskripsi: "Orang", skor: 0,950
  2. deskripsi: "Jalan", skor: 0,891
  3. deskripsi: "Moda transportasi", skor: 0,890
Gambar jalan Shanghai yang berisi hasil deteksi label.
Kredit gambar: Steve Long pada Unsplash (anotasi ditambahkan).

Hasil deteksi teks

  • teks: 牛牛面馆\n
  • verteks: (x: 159, y: 212), (x: 947, y: 212), (x: 947, y: 354), (x: 159, y: 354 )
Gambar jalan Shanghai yang berisi hasil deteksi teks.
Kredit gambar: Steve Long pada Unsplash (anotasi ditambahkan).

Hasil deteksi objek

  • nama: "Orang", skor: 0,944
  • verteks yang dinormalisasi: (x: 0,260, y: 0,468), (x: 0,407, y: 0,468), (x: 0,407, y: 0,895), (x: 0,260, y: 0,895)
Gambar jalan Shanghai yang berisi hasil deteksi objek.
Kredit gambar: Steve Long pada Unsplash (anotasi ditambahkan).

Selamat! Anda telah mengirimkan permintaan pertama ke Vision API.

Pembersihan

Agar tidak menimbulkan biaya pada akun Google Cloud Anda untuk resource yang digunakan pada halaman ini, hapus project Google Cloud yang berisi resource tersebut.

Optional: Revoke credentials from the gcloud CLI.

gcloud auth revoke

Langkah berikutnya

  • Lihat daftar semua jenis fitur dan penggunaannya.
  • Mulai Vision API dalam bahasa pilihan Anda dengan menggunakan Library Klien Vision API.
  • Gunakan Panduan cara kerja untuk mempelajari lebih lanjut fitur tertentu, melihat contoh anotasi, dan mendapatkan anotasi untuk setiap file atau gambar.
  • Pelajari anotasi gambar dan file (PDF/TIFF/GIF) dalam batch.
  • Lihat daftar lengkap contoh kode library klien.