Mempersiapkan data pelatihan Anda

Halaman ini menjelaskan cara menyiapkan data pelatihan dan pengujian agar Klasifikasi Kecerdasan Video AutoML dapat membuat model anotasi video.

Menyiapkan video Anda

  • AutoML Video Intelligence Classification mendukung format video berikut (ditampilkan di bawah) untuk melatih model Anda atau meminta prediksi (menganotasi video). Ukuran file maksimum adalah 50 GB (durasi hingga 3 jam). Setiap file video dengan stempel waktu rusak atau kosong dalam container tidak didukung.

    • .MOV
    • .MPEG4
    • .MP4
    • .AVI
  • Data pelatihan harus semirip mungkin dengan data yang menjadi dasar prediksi. Misalnya, jika dalam kasus penggunaan Anda terdapat video buram dengan resolusi rendah (seperti video dari kamera keamanan), data pelatihan Anda harus terdiri dari video buram dengan resolusi rendah. Secara umum, Anda juga harus mempertimbangkan untuk menyediakan beberapa sudut, resolusi, dan latar belakang untuk video pelatihan Anda.

  • Model AutoML Video umumnya tidak dapat memprediksi label yang tidak dapat ditetapkan oleh manusia. Jadi, jika manusia tidak bisa dilatih untuk menetapkan label dengan melihat video selama 1-2 detik, model tersebut kemungkinan tidak bisa dilatih untuk melakukan hal yang sama.

  • Kami merekomendasikan sekitar 1.000 video pelatihan atau segmen video per label. Jumlah minimum per label adalah 10. Secara umum, diperlukan lebih banyak contoh per label untuk melatih model dengan beberapa label per video, dan skor yang dihasilkan lebih sulit untuk ditafsirkan.

  • Model ini akan berfungsi optimal jika ada 100x lebih banyak video untuk label yang paling umum daripada label yang paling tidak umum. Sebaiknya Anda menghapus label berfrekuensi rendah.

  • Pertimbangkan untuk menyertakan label None_of_the_above dan video yang tidak cocok dengan label yang Anda tentukan. Misalnya, untuk set data hewan, sertakan video hewan di luar varietas berlabel Anda, dan beri label sebagai None_of_the_above. Hal ini dapat meningkatkan akurasi model Anda. Perhatikan bahwa, meskipun nama label apa pun dapat berfungsi, None_of_the_above diperlakukan secara khusus oleh sistem.

Set data pelatihan, validasi, dan pengujian

Data dalam set data dibagi menjadi tiga set data saat melatih model: set data pelatihan, set data validasi, dan set data pengujian.

  • Set data pelatihan digunakan untuk membangun model. Saat menelusuri pola dalam data pelatihan, beberapa algoritma dan parameter akan dicoba.
  • Saat pola diidentifikasi, set data validasi akan digunakan untuk menguji algoritma dan pola. Algoritma dan pola dengan kinerja terbaik dipilih dari yang diidentifikasi selama tahap pelatihan.
  • Setelah algoritma dan pola dengan performa terbaik diidentifikasi, algoritma dan pola tersebut diuji untuk tingkat kesalahan, kualitas, dan akurasi menggunakan set data pengujian.

Set data validasi dan pengujian digunakan untuk menghindari bias dalam model. Selama tahap validasi, parameter model optimal digunakan, yang dapat menghasilkan metrik yang bias. Penggunaan set data pengujian untuk menilai kualitas model setelah tahap validasi akan memberikan penilaian yang tidak bias terhadap kualitas model.

Untuk mengidentifikasi data pelatihan, pengujian, dan validasi, gunakan file CSV seperti yang dijelaskan di bagian berikutnya.

Membuat file CSV dengan URI dan label video

Setelah file diupload ke Google Cloud Storage, Anda dapat membuat file CSV yang mencantumkan semua data pelatihan dan label kategori untuk data tersebut. File CSV dapat memiliki nama file apa pun, harus berada di bucket yang sama dengan file video Anda, harus berenkode UTF-8, dan harus diakhiri dengan ekstensi .csv.

Ada tiga file yang dapat digunakan untuk melatih dan memverifikasi model Anda:

File Deskripsi
Daftar file pelatihan model

Berisi jalur untuk melatih, menguji, dan memvalidasi file CSV.

File ini digunakan untuk mengidentifikasi lokasi hingga tiga file CSV terpisah yang menjelaskan data pelatihan dan pengujian Anda.

Berikut beberapa contoh isi file CSV daftar file:

Contoh 1:


      TRAIN,gs://automl-video-demo-data/hmdb_split1_5classes_train.csv
      TEST,gs://automl-video-demo-data/hmdb_split1_5classes_test.csv
      

Contoh 2:


      UNASSIGNED,gs://automl-video-demo-data/hmdb_split1_5classes_all.csv
      
Data pelatihan

Digunakan untuk melatih model. Berisi jalur ke file video, waktu mulai dan berakhir untuk segmen video, serta label yang mengidentifikasi subjek segmen video.

Jika menentukan file CSV data pelatihan, Anda juga harus menentukan file CSV data pengujian.

Data pengujian

Digunakan untuk menguji model selama fase pelatihan. Berisi jalur ke file video, waktu mulai dan berakhir untuk segmen video, serta label yang mengidentifikasi subjek segmen video.

Jika menentukan file CSV data pengujian, Anda juga harus menentukan file CSV data pelatihan.

Data yang belum ditetapkan

Digunakan untuk pelatihan dan pengujian model. Berisi jalur ke file video, waktu mulai dan berakhir untuk segmen video, serta label yang mengidentifikasi subjek segmen video. Baris dalam file yang belum ditetapkan secara otomatis dibagi menjadi data pelatihan dan pengujian. 80% untuk pelatihan dan 20% untuk pengujian.

Anda dapat menentukan hanya file CSV data yang belum ditetapkan tanpa pelatihan dan pengujian file CSV data. Anda juga dapat menentukan hanya file CSV data pelatihan dan pengujian tanpa file CSV data yang belum ditetapkan.

File pelatihan, pengujian, dan yang tidak ditetapkan memiliki satu baris untuk setiap video dalam set yang Anda upload, dengan kolom berikut di setiap baris:

  1. Konten yang akan dikategorikan atau dianotasi. Kolom ini berisi URI Google Cloud Storage untuk video. URI Google Cloud Storage peka huruf besar/kecil.

  2. Label yang mengidentifikasi cara video dikategorikan. . Label harus diawali dengan huruf dan hanya berisi huruf, angka, serta garis bawah. Anda dapat menentukan beberapa label untuk video dengan menambahkan beberapa baris dalam file CSV yang masing-masing mengidentifikasi segmen video yang sama, dengan label yang berbeda untuk setiap baris.

  3. Waktu mulai dan berakhir segmen video. Kedua kolom yang dipisahkan koma ini mengidentifikasi waktu mulai dan berakhir segmen video untuk dianalisis, dalam hitungan detik. Waktu mulai harus kurang dari waktu berakhir. Kedua nilai tersebut harus tidak negatif dan berada dalam rentang waktu video. Contoh, 0.09845,1.3600555. Untuk menggunakan seluruh konten video, tentukan waktu mulai 0 dan waktu berakhir dari durasi lengkap video tersebut atau "inf". Misalnya, 0,inf.

Berikut adalah beberapa contoh baris untuk file data CSV:

Label tunggal:

gs://<your-video-path>/vehicle.mp4,u-turn,0,5.4

Beberapa label pada segmen video yang sama:

gs://<your-video-path>/vehicle.mp4,right-turn,0,8.285
gs://<your-video-path>/vehicle.mp4,left-turn,0,8.285
gs://<your-video-path>/vehicle.mp4,u-turn,0,8.285

Menggunakan inf untuk menunjukkan akhir video:

gs://<your-video-path>/vehicle.mp4,right-turn,0,inf

Untuk mendapatkan hasil terbaik, Anda harus menyertakan minimal beberapa ratus segmen video pelatihan per label untuk membuat model yang akurat. Jumlah ini dapat bervariasi tergantung pada kompleksitas data Anda.

Anda juga dapat memberikan video dalam file data CSV tanpa menentukan label apa pun. Anda kemudian harus menggunakan UI Video AutoML untuk menerapkan label ke data sebelum melatih model. Caranya, Anda hanya perlu menyediakan URI Cloud Storage untuk video, diikuti dengan tiga koma, seperti yang ditunjukkan dalam contoh berikut.

gs://<your-video-path>/vehicle.mp4,,,

Anda tidak perlu menentukan data validasi untuk memverifikasi hasil model yang dilatih. AutoML Video secara otomatis membagi baris yang diidentifikasi untuk pelatihan menjadi data pelatihan dan validasi. 70% untuk pelatihan dan 30% untuk validasi.

Simpan konten sebagai file CSV di bucket Google Cloud Storage.

Error umum terkait CSV

  • Menggunakan karakter Unicode dalam label. Misalnya, karakter Jepang tidak didukung.
  • Penggunaan spasi dan karakter non-alfanumerik dalam label.
  • Baris kosong
  • Kolom kosong (baris dengan dua koma berturut-turut).
  • Kapitalisasi jalur video Cloud Storage salah.
  • Kontrol akses salah dikonfigurasi untuk file video Anda. Akun layanan Anda harus memiliki akses baca atau akses yang lebih besar, atau file harus dapat dibaca secara publik.
  • Referensi ke file non-video (seperti file PDF atau PSD). Demikian juga, file yang bukan file video tetapi telah diganti namanya dengan ekstensi video akan menyebabkan error.
  • URI video mengarah ke bucket yang berbeda dengan project saat ini. Hanya video dalam bucket project yang dapat diakses.
  • File berformat non-CSV.