Tutorial deteksi pergantian shot

Audiens

Tutorial ini dirancang agar Anda dapat dengan cepat mulai menjelajahi dan mengembangkan aplikasi dengan Video Intelligence API. Tutorial ini dirancang untuk orang yang sudah memahami pemrograman dasar, meskipun tanpa banyak pengetahuan pemrograman, Anda tetap dapat mengikutinya. Setelah mempelajari tutorial ini, Anda akan dapat menggunakan Dokumentasi referensi untuk membuat aplikasi dasar Anda sendiri.

Tutorial ini menjelaskan langkah-langkah aplikasi Video Intelligence API menggunakan kode Python. Tujuannya di sini bukan untuk menjelaskan library klien Python, tetapi untuk menjelaskan cara melakukan panggilan ke Video Intelligence API. Aplikasi di Java dan Node.js pada dasarnya serupa.

Jika Anda mencari contoh khusus kode atau contoh dalam bahasa lain, lihat panduan cara kerja pendamping.

Prasyarat

Tutorial ini memiliki beberapa prasyarat:

Membuat anotasi video menggunakan deteksi perubahan shot

Tutorial ini membahas aplikasi Video API dasar, menggunakan permintaan SHOT_CHANGE_DETECTION. Permintaan SHOT_CHANGE_DETECTION memberikan hasil anotasi:

  • Daftar semua pengambilan gambar yang terjadi dalam video
  • Untuk setiap pengambilan gambar, berikan waktu mulai dan waktu berakhir pengambilan gambar

Kita akan menampilkan seluruh kode terlebih dahulu. (Perhatikan bahwa kami telah menghapus sebagian besar komentar dari kode ini untuk menunjukkan seberapa singkat kode tersebut. Kami akan memberikan lebih banyak komentar saat membahas kode.)

import argparse

from google.cloud import videointelligence



def analyze_shots(path):
    """Detects camera shot changes."""
    video_client = videointelligence.VideoIntelligenceServiceClient()
    features = [videointelligence.Feature.SHOT_CHANGE_DETECTION]
    operation = video_client.annotate_video(
        request={"features": features, "input_uri": path}
    )
    print("\nProcessing video for shot change annotations:")

    result = operation.result(timeout=120)
    print("\nFinished processing.")


    for i, shot in enumerate(result.annotation_results[0].shot_annotations):
        start_time = (
            shot.start_time_offset.seconds + shot.start_time_offset.microseconds / 1e6
        )
        end_time = (
            shot.end_time_offset.seconds + shot.end_time_offset.microseconds / 1e6
        )
        print("\tShot {}: {} to {}".format(i, start_time, end_time))


if __name__ == "__main__":
    parser = argparse.ArgumentParser(
        description=__doc__, formatter_class=argparse.RawDescriptionHelpFormatter
    )
    parser.add_argument("path", help="GCS path for shot change detection.")
    args = parser.parse_args()

    analyze_shots(args.path)

Aplikasi sederhana ini melakukan tugas-tugas berikut:

  • Mengimpor library yang diperlukan untuk menjalankan aplikasi.
  • Mengambil file video yang disimpan di URI Cloud Storage sebagai argumen dan meneruskannya ke fungsi main().
  • Mendapatkan kredensial untuk menjalankan layanan Video Intelligence API.
  • Membuat permintaan anotasi video untuk dikirim ke layanan video.
  • Mengirim permintaan dan menampilkan operasi yang berjalan lama.
  • Melakukan loop pada operasi yang berjalan lama hingga video diproses dan menampilkan nilai yang tersedia.
  • Mengurai respons untuk layanan dan menampilkan respons kepada pengguna.

Kita akan membahas langkah-langkah ini secara lebih mendetail di bawah.

Mengimpor library

import argparse

from google.cloud import videointelligence

Kita mengimpor argparse untuk mengizinkan aplikasi menerima nama file input sebagai argumen.

Untuk menggunakan Video Intelligence API, kita juga mengimpor library google.cloud.videointelligence, yang menyimpan direktori panggilan API dan konstanta enumerasi.

Menjalankan aplikasi

parser = argparse.ArgumentParser(
    description=__doc__, formatter_class=argparse.RawDescriptionHelpFormatter
)
parser.add_argument("path", help="GCS path for shot change detection.")
args = parser.parse_args()

analyze_shots(args.path)

Di sini, kita mengurai argumen yang diteruskan untuk URI Google Cloud Storage nama file video dan meneruskannya ke fungsi main().

Melakukan autentikasi ke API

Sebelum berkomunikasi dengan layanan Video Intelligence API, Anda harus mengautentikasi layanan Anda menggunakan kredensial yang diperoleh sebelumnya. Dalam aplikasi, cara termudah untuk mendapatkan kredensial adalah dengan menggunakan Kredensial Default Aplikasi (ADC). Secara default, ADC akan mencoba mendapatkan kredensial dari file lingkungan GOOGLE_APPLICATION_CREDENTIALS, yang harus ditetapkan agar mengarah ke file kunci JSON akun layanan Anda. (Anda harus menyiapkan akun layanan dan lingkungan untuk menggunakan ADC di Panduan memulai. Lihat Menyiapkan Akun Layanan untuk mengetahui informasi selengkapnya.)

Membuat permintaan

video_client = videointelligence.VideoIntelligenceServiceClient()
features = [videointelligence.Feature.SHOT_CHANGE_DETECTION]
operation = video_client.annotate_video(
    request={"features": features, "input_uri": path}
)

Setelah layanan Video Intelligence API kami siap, kita dapat membuat permintaan ke layanan tersebut. Permintaan ke Video Intelligence API diberikan sebagai objek JSON. Lihat Referensi Video Intelligence API untuk mengetahui informasi lengkap tentang struktur spesifik permintaan tersebut.

Cuplikan kode ini melakukan tugas-tugas berikut:

  1. Membuat JSON untuk permintaan POST ke metode annotate_video().
  2. Memasukkan lokasi Google Cloud Storage dari nama file video yang diteruskan ke dalam permintaan.
  3. Menunjukkan bahwa metode annotate harus melakukan SHOT_CHANGE_DETECTION.

Membuat operasi yang berjalan lama

Saat pertama kali menjalankan permintaan terhadap Video Intelligence API, kita tidak mendapatkan hasil langsung; sebagai gantinya, kita mendapatkan nama operasi, yang disimpan dalam kolom name respons, yang kemudian dapat kita gunakan untuk memeriksa hasil pada waktu lain.

Meneruskan nama operasi tersebut (yang merupakan string numerik) ke metode operations Layanan Operasi Video Intelligence API akan menampilkan status operasi saat ini. Contoh respons ditampilkan di bawah ini:

{
   "response":{
      "@type":"type.googleapis.com/google.cloud.videointelligence.v1.AnnotateVideoResponse"
   },
   "name":"us-west1.17159971042783089144",
   "metadata":{
      "annotationProgress":[
         {
            "inputUri":"/video/gbikes_dinosaur.mp4",
            "updateTime":"2017-01-27T19:45:54.297807Z",
            "startTime":"2017-01-27T19:45:54.275023Z"
         }
      ],
      "@type":"type.googleapis.com/google.cloud.videointelligence.v1.AnnotateVideoProgress"
   }
}

Perhatikan bahwa kolom response saat ini hanya berisi kolom @type, yang menunjukkan jenis respons tersebut. Setelah hasil benar-benar tersedia, kolom respons akan berisi hasil dari jenis tersebut.

Memeriksa operasi

result = operation.result(timeout=120)
print("\nFinished processing.")

Dengan menggunakan permintaan operasi yang ada untuk operasi yang ada, kita membuat loop while untuk memeriksa status operasi tersebut secara berkala. Setelah operasi menunjukkan bahwa operasinya adalah done, kita keluar dari loop dan dapat mengurai respons.

Mengurai respons

for i, shot in enumerate(result.annotation_results[0].shot_annotations):
    start_time = (
        shot.start_time_offset.seconds + shot.start_time_offset.microseconds / 1e6
    )
    end_time = (
        shot.end_time_offset.seconds + shot.end_time_offset.microseconds / 1e6
    )
    print("\tShot {}: {} to {}".format(i, start_time, end_time))

Setelah operasi selesai, respons akan berisi AnnotateVideoResponse, yang terdiri dari daftar annotationResults, satu untuk setiap video yang dikirim dalam permintaan. Karena hanya mengirim satu video dalam permintaan, kita mengambil shotAnnotations pertama dari hasil. Kita akan membahas semua 'segmen' untuk video.

Menjalankan aplikasi

Untuk menjalankan aplikasi, cukup teruskan URI Cloud Storage video:

$ python shotchange.py gs://cloud-samples-data/video/gbikes_dinosaur.mp4
operationId=us-west1.12468772851081463748
Operation us-west1.12468772851081463748 started: 2017-01-30T01:53:45.981043Z
Processing video for shot change annotations:
Finished processing.
  Shot 0: 0.0 to 5.166666
  Shot 1: 5.233333 to 10.066666
  Shot 2: 10.1 to 28.133333
  Shot 3: 28.166666 to 42.766666

Selamat! Anda telah melakukan tugas anotasi menggunakan Video Intelligence API.