Dengan algoritma bawaan di AI Platform Training, Anda dapat mengirimkan data pelatihan, memilih algoritma, dan membiarkan AI Platform Training menangani prapemrosesan dan pelatihan untuk Anda, tanpa menulis kode apa pun untuk aplikasi pelatihan. Algoritma gambar bawaan memungkinkan Anda melakukan pelatihan di TPU dengan konfigurasi minimal. SavedModel TensorFlow yang dihasilkan kompatibel untuk ditayangkan di CPU dan GPU.
Ringkasan
Dalam tutorial ini, Anda akan melatih model deteksi objek gambar tanpa menulis kode apa pun. Anda mengirimkan set data COCO ke Pelatihan AI Platform untuk pelatihan, lalu men-deploy model di Pelatihan AI Platform untuk mendapatkan prediksi. Model yang dihasilkan mengklasifikasikan objek umum dalam gambar pemandangan sehari-hari yang kompleks.
Sebelum memulai
Untuk menyelesaikan tutorial ini di command line, gunakan Cloud Shell atau lingkungan mana pun tempat Google Cloud CLI diinstal.
Selesaikan langkah-langkah berikut untuk menyiapkan akun GCP, mengaktifkan API yang diperlukan, serta menginstal dan mengaktifkan Google Cloud CLI:
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the AI Platform Training & Prediction and Compute Engine APIs.
- Install the Google Cloud CLI.
-
To initialize the gcloud CLI, run the following command:
gcloud init
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the AI Platform Training & Prediction and Compute Engine APIs.
- Install the Google Cloud CLI.
-
To initialize the gcloud CLI, run the following command:
gcloud init
Memberi otorisasi Cloud TPU untuk mengakses project Anda
Ikuti langkah-langkah berikut untuk memberikan otorisasi pada nama akun layanan Cloud TPU yang terkait dengan project Google Cloud Anda:
Dapatkan nama akun layanan Cloud TPU Anda dengan memanggil
projects.getConfig
. Contoh:PROJECT_ID=PROJECT_ID curl -H "Authorization: Bearer $(gcloud auth print-access-token)" \ https://ml.googleapis.com/v1/projects/$PROJECT_ID:getConfig
Simpan nilai kolom
serviceAccountProject
dantpuServiceAccount
yang ditampilkan oleh API.Lakukan inisialisasi akun layanan Cloud TPU:
curl -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" -d '{}' \ https://serviceusage.googleapis.com/v1beta1/projects/<serviceAccountProject>/services/tpu.googleapis.com:generateServiceIdentity
Sekarang, tambahkan akun layanan Cloud TPU sebagai anggota dalam project Anda, dengan peran Cloud ML Service Agent. Selesaikan langkah-langkah berikut di konsol Google Cloud atau menggunakan perintah gcloud
:
Konsol
- Login ke konsol Google Cloud dan pilih project tempat Anda menggunakan TPU.
- Pilih IAM & Admin > IAM.
- Klik tombol Tambahkan untuk menambahkan anggota ke project.
- Masukkan akun layanan TPU di kotak teks Anggota.
- Klik menu drop-down Roles.
- Aktifkan peran Cloud ML Service Agent (Service Agents > Cloud ML Service Agent).
gcloud
Tetapkan variabel lingkungan yang berisi project ID dan akun layanan Cloud TPU Anda:
PROJECT_ID=PROJECT_ID SVC_ACCOUNT=your-tpu-sa-123@your-tpu-sa.google.com.iam.gserviceaccount.com
Berikan peran
ml.serviceAgent
ke akun layanan Cloud TPU:gcloud projects add-iam-policy-binding $PROJECT_ID \ --member serviceAccount:$SVC_ACCOUNT --role roles/ml.serviceAgent
Untuk mengetahui detail selengkapnya tentang cara memberikan peran ke akun layanan, lihat dokumentasi IAM.
Penyiapan
Kami telah mengubah set data COCO untuk digunakan dengan tutorial ini, dan
menghostingnya di bucket Cloud Storage publik,
gs://cloud-samples-data/ai-platform/built-in/image/coco/
.
Konsol
Memilih algoritme
Buka halaman Tugas Pelatihan AI Platform di konsol Google Cloud:
Klik tombol Tugas pelatihan baru. Dari opsi yang ditampilkan di bawah, klik Pelatihan algoritma bawaan. Halaman Create a new training job akan ditampilkan.
Pembuatan tugas pelatihan dibagi menjadi empat langkah. Langkah pertama adalah Algoritma pelatihan. Pilih deteksi objek gambar, lalu klik Berikutnya.
Data pelatihan
Di bagian Training data, pilih data pelatihan untuk set data contoh, yang dihosting di bucket Cloud Storage publik kami:
Pilih Gunakan beberapa file yang disimpan di satu direktori Cloud Storage.
Untuk Jalur direktori, isi: "cloud-samples-data/ai-platform/built-in/image/coco/"
Untuk Nama karakter pengganti, isi "train*" untuk memilih semua file pelatihan di direktori.
Jalur GCS lengkap ditampilkan di bawah: "gs://cloud-samples-data/ai-platform/built-in/image/coco/train*"
Di bagian Validation data, pilih data validasi untuk set data contoh, yang dihosting di bucket Cloud Storage publik kami:
Pilih Gunakan beberapa file yang disimpan di satu direktori Cloud Storage.
Untuk Jalur direktori, isi: "cloud-samples-data/ai-platform/built-in/image/coco/"
Untuk Nama karakter pengganti, isi "val*" untuk memilih semua file validasi dalam direktori.
Jalur GCS lengkap ditampilkan di bawah: "gs://cloud-samples-data/ai-platform/built-in/image/coco/val*"
Tentukan Output directory di bucket Cloud Storage Anda tempat Anda ingin AI Platform Training menyimpan model, checkpoint, dan output tugas pelatihan lainnya yang telah dilatih. Anda dapat mengisi jalur persis di bucket, atau menggunakan tombol Browse untuk memilih jalur.
gcloud
Siapkan variabel lingkungan untuk project ID, bucket Cloud Storage, jalur Cloud Storage ke data pelatihan, dan pilihan algoritma Anda.
Algoritma bawaan AI Platform Training berada dalam container Docker yang dihosting di Container Registry.
PROJECT_ID="YOUR_PROJECT_ID"
BUCKET_NAME="YOUR_BUCKET_NAME"
REGION="us-central1"
gcloud config set project $PROJECT_ID
gcloud config set compute/region $REGION
# Set paths to the training and validation data.
TRAINING_DATA_PATH="gs://cloud-samples-data/ai-platform/built-in/image/coco/train*"
VALIDATION_DATA_PATH="gs://cloud-samples-data/ai-platform/built-in/image/coco/val*"
# Specify the Docker container for your built-in algorithm selection.
IMAGE_URI="gcr.io/cloud-ml-algos/image_object_detection:latest"
Mengirim tugas pelatihan
Untuk mengirimkan tugas, Anda harus menentukan beberapa argumen pelatihan dasar dan beberapa argumen dasar yang terkait dengan algoritma deteksi objek gambar.
Argumen umum untuk tugas pelatihan:
Argumen tugas pelatihan | |
---|---|
Argumen | Deskripsi |
job-id |
ID unik untuk tugas pelatihan Anda. Anda dapat menggunakannya untuk menemukan log status tugas pelatihan setelah mengirimkannya. |
job-dir |
Jalur Cloud Storage tempat AI Platform Training menyimpan file pelatihan setelah menyelesaikan tugas pelatihan yang berhasil. |
scale-tier |
Menentukan jenis mesin untuk pelatihan. Gunakan BASIC untuk memilih
konfigurasi hanya satu mesin.
|
master-image-uri |
URI Container Registry yang digunakan untuk menentukan container Docker yang akan digunakan untuk tugas pelatihan. Gunakan penampung untuk algoritma deteksi objek gambar bawaan yang ditentukan sebelumnya sebagai IMAGE_URI .
|
region |
Tentukan region yang tersedia untuk menjalankan tugas pelatihan Anda. Untuk
tutorial ini, Anda dapat menggunakan region us-central1 .
|
Argumen khusus untuk algoritma deteksi objek gambar bawaan:
Argumen algoritme | |
---|---|
Argumen | Deskripsi |
training_data_path |
Jalur ke pola jalur TFRecord yang digunakan untuk pelatihan. |
validation_data_path |
Jalur ke pola jalur TFRecord yang digunakan untuk validasi. |
pretrained_checkpoint_path |
Jalur checkpoint terlatih sebelumnya. Anda dapat menggunakan beberapa pos pemeriksaan yang dipublikasikan. |
num_classes |
Jumlah class dalam data pelatihan/validasi. |
max_steps |
Jumlah langkah yang akan dijalankan tugas pelatihan. |
train_batch_size |
Jumlah gambar yang akan digunakan per langkah pelatihan. |
num_eval_images |
Jumlah total gambar yang digunakan untuk evaluasi. Jika 0, semua gambar di validation_data_path akan
digunakan untuk evaluasi.
|
learning_rate_decay_type |
Metode yang digunakan untuk mengurangi kecepatan pembelajaran selama pelatihan. |
warmup_learning_rate |
Kecepatan belajar di awal fase pemanasan. |
warmup_steps |
Jumlah langkah yang akan dijalankan selama fase pemanasan, atau durasi
fase pemanasan dalam langkah.
Tugas pelatihan menggunakan warmup_learning_rate selama fase pemanasan. Setelah fase pemanasan selesai, tugas pelatihan akan menggunakan
initial_learning_rate .
|
initial_learning_rate |
Kecepatan belajar awal setelah fase pemanasan selesai. |
stepwise_learning_rate_steps |
Langkah-langkah untuk menurunkan/mengubah kecepatan pembelajaran untuk jenis peluruhan kecepatan pembelajaran
bertahap. Misalnya, 100.200 berarti kecepatan belajar akan berubah (sehubungan dengan stepwise_learning_rate_levels ) pada langkah 100
dan langkah 200. Perhatikan bahwa hal ini hanya akan dipatuhi jika
learning_rate_decay_type ditetapkan ke stepwise.
|
stepwise_learning_rate_levels |
Nilai rasio pembelajaran dari setiap langkah untuk jenis penurunan rasio pembelajaran
bertahap. Perhatikan bahwa hal ini hanya akan dipatuhi jika
learning_rate_decay_type ditetapkan ke stepwise.
|
image_size |
Ukuran gambar (lebar dan tinggi) yang digunakan untuk pelatihan. |
optimizer_type |
Pengoptimal yang digunakan untuk pelatihan. Formatnya harus salah satu dari: {momentum, adam, adadelta, adagrad, rmsprop}
|
optimizer_arguments |
Argumen untuk pengoptimal. Ini adalah daftar yang dipisahkan koma dari
pasangan "name=value". File ini harus kompatibel dengan
optimizer_type . Contoh:
|
fpn_type |
Jenis Feature Pyramid Network (FPN) multi-level.
Harus berupa salah satu dari {fpn, nasfpn} .
|
resnet_depth |
Kedalaman backbone ResNet.
Harus berupa salah satu dari {18,34,50,101,152,200} .
|
max_num_bboxes_in_training |
Jumlah maksimum kotak pembatas yang diusulkan untuk digunakan dalam pelatihan. |
max_num_bboxes_in_prediction |
Jumlah maksimum kotak pembatas yang diusulkan untuk digunakan dalam output prediksi. |
bbox_aspect_ratios |
Skala ukuran anchor dasar yang mewakili anchor rasio lebar tinggi yang ditambahkan di setiap tingkat. Angka ini menunjukkan rasio lebar terhadap tinggi. Misalnya, "1.0,2.0,0.5" menambahkan tiga anchor di setiap tingkat skala. |
nms_iou_threshold |
Nilai minimum untuk menentukan apakah kotak pembatas tumpang-tindih sehubungan dengan IOU untuk penekanan non-maksimum. |
nms_score_threshold |
Nilai minimum untuk menentukan kapan harus menghapus kotak pembatas berdasarkan skor. |
focal_loss_alpha |
Nilai alfa kerugian fokus (param penyeimbangan). |
focal_loss_gamma |
Nilai gamma kehilangan fokus (parameter pemfokusan). |
aug_scale_min |
Skala minimum yang diterapkan selama augmentasi gambar. Nilainya
antara [0, 1.0] .
|
aug_scale_max |
Skala maksimum yang diterapkan selama augmentasi gambar. Nilainya
antara [1.0, inf] .
|
aug_rand_hflip |
Boolean. Jika ditetapkan ke True, setelan ini akan meningkatkan pelatihan dengan pengalihan horisontal acak. |
Untuk daftar mendetail semua flag algoritma deteksi objek gambar lainnya, lihat referensi deteksi objek gambar bawaan.
Konsol
Argumen algoritme
Di bagian pertama tab Algorithm arguments, isi nilai berikut:
- Jumlah class: 91
- Langkah maksimum: 15.000
- Ukuran batch pelatihan: 64
- Jumlah gambar evaluasi: 5.000
Di Bagian Model pada tab Argumen algoritma:
Untuk Jalur checkpoint terlatih, isi
gs://cloud-samples-data/ai-platform/built-in/image/pretrained_checkpoints/detection/
.Biarkan semua kolom lain tetap pada setelan defaultnya, lalu klik Berikutnya.
Setelan pekerjaan
Pada tab Setelan tugas:
- Masukkan ID Tugas yang unik (seperti "object_detection_example").
- Masukkan region yang tersedia (seperti "us-central1").
- Untuk memilih jenis mesin, pilih "CUSTOM" untuk scale tier.
Bagian untuk menampilkan Spesifikasi cluster kustom.
- Untuk Jenis master, pilih complex_model_m.
- Untuk Jenis pekerja, pilih cloud_tpu. Jumlah pekerja ditetapkan secara default ke 1.
Klik Selesai untuk mengirimkan tugas pelatihan.
gcloud
Siapkan semua argumen untuk tugas pelatihan dan algoritme, sebelum menggunakan
gcloud
untuk mengirimkan tugas:DATASET_NAME="coco" ALGORITHM="object_detection" MODEL_NAME="${DATASET_NAME}_${ALGORITHM}_model" # Give a unique name to your training job. DATE="$(date '+%Y%m%d_%H%M%S')" JOB_ID="${MODEL_NAME}_${DATE}" # Make sure you have access to this Cloud Storage bucket. JOB_DIR="gs://${BUCKET_NAME}/algorithms_training/${MODEL_NAME}/${DATE}"
Kirim tugas:
gcloud ai-platform jobs submit training $JOB_ID \ --region=$REGION \ --config=config.yaml \ --job-dir=$JOB_DIR \ -- \ --training_data_path=$TRAINING_DATA_PATH \ --validation_data_path=$VALIDATION_DATA_PATH \ --train_batch_size=64 \ --num_eval_images=500 \ --train_steps_per_eval=2000 \ --max_steps=15000 \ --num_classes=90 \ --warmup_steps=500 \ --initial_learning_rate=0.08 \ --fpn_type="nasfpn" \ --aug_scale_min=0.8 \ --aug_scale_max=1.2
Setelah tugas berhasil dikirim, Anda dapat melihat log menggunakan perintah
gcloud
berikut:gcloud ai-platform jobs describe $JOB_ID gcloud ai-platform jobs stream-logs $JOB_ID
Memahami direktori lowongan
Setelah tugas pelatihan berhasil diselesaikan, AI Platform Training akan membuat model terlatih di bucket Cloud Storage Anda, beserta beberapa artefak lainnya. Anda dapat menemukan struktur direktori berikut dalam JOB_DIR
:
- model/ (direktori TensorFlow SavedModel yang juga berisi file
deployment_config.yaml
)- saved_model.pb
- deployment_config.yaml
- eval/
- events.out.tfevents.[timestamp].cmle-training-[timestamp]
- events.out.tfevents...
- ...
- variables/
- variables.data-00000-of-00001
- variables.index
Direktori tugas juga berisi berbagai file titik periksa model.
Pastikan struktur direktori di JOB_DIR
Anda cocok dengan:
gcloud storage ls $JOB_DIR/* --all-versions
Men-deploy model terlatih
AI Platform Training mengatur model terlatih Anda menggunakan resource model dan versi. Model AI Platform Training adalah penampung untuk versi model machine learning Anda.
Untuk men-deploy model, Anda membuat resource model di AI Platform Training, membuat versi model tersebut, lalu menggunakan model dan versi untuk meminta prediksi online.
Untuk informasi selengkapnya tentang cara men-deploy model ke AI Platform Training, lihat cara men-deploy model TensorFlow.
Konsol
Di halaman Tugas, Anda dapat menemukan daftar semua tugas pelatihan. Klik nama tugas pelatihan yang baru saja Anda kirimkan ("object_detection" atau nama tugas yang Anda gunakan).
Di halaman Detail tugas, Anda dapat melihat progres umum tugas, atau mengklik Lihat log untuk melihat progresnya secara lebih mendetail.
Jika tugas berhasil, tombol Deploy model akan muncul di bagian atas. Klik Deploy model.
Pilih Deploy as new model, lalu masukkan nama model, seperti "algorithms_object_detection_model". Selanjutnya, klik Konfirmasi.
Di halaman Create version, masukkan nama versi, seperti "v1", dan biarkan semua kolom lainnya menggunakan setelan defaultnya. Klik Simpan.
gcloud
Proses pelatihan dengan algoritma deteksi objek gambar bawaan menghasilkan file, deployment_config.yaml
, yang memudahkan deployment model Anda di AI Platform Training untuk prediksi.
Salin file ke direktori lokal Anda dan lihat kontennya:
gcloud storage cp $JOB_DIR/model/deployment_config.yaml . cat deployment_config.yaml
File
deployment_config.yaml
Anda akan terlihat seperti berikut:deploymentUri: gs://BUCKET_NAME/algorithms_training/coco_object_detection/model framework: TENSORFLOW labels: global_step: '1000' job_id: coco_object_detection_20190227060114 runtimeVersion: '1.14'
Buat model dan versi di AI Platform Training:
gcloud ai-platform models create $MODEL_NAME --regions $REGION # Create a model and a version using the file above. VERSION_NAME="v_${DATE}" gcloud ai-platform versions create $VERSION_NAME \ --model $MODEL_NAME \ --config deployment_config.yaml
Pembuatan versi memerlukan waktu beberapa menit.
Mendapatkan prediksi online
Saat meminta prediksi, Anda harus memastikan bahwa data input Anda diformat sebagai JSON.
Download file artefak pelatihan:
gcloud storage cp $JOB_DIR/artifacts/* .
Menyiapkan input prediksi untuk satu gambar.
Untuk mengirim permintaan prediksi online menggunakan Google Cloud CLI, seperti dalam contoh ini, tulis setiap instance ke baris dalam file JSON yang dibatasi baris baru.
Jalankan perintah berikut di terminal untuk membuat input untuk satu instance yang dapat Anda kirim ke AI Platform Prediction:
Skrip Python berikut mengenkode satu gambar menggunakan
base64
, memformatnya untuk prediksi, menambahkan kunci instance, dan menulis hasilnya ke file bernamaprediction_instances.json
:import json import base64 import tensorflow as tf IMAGE_URI='gs://cloud-samples-data/ai-platform/built-in/image/tutorial_examples/coco_sample.jpeg' with tf.gfile.Open(IMAGE_URI, 'rb') as image_file: encoded_string = base64.b64encode(image_file.read()).decode('utf-8') image_bytes = {'b64': str(encoded_string)} instances = {'image_bytes': image_bytes, 'key': '1'} with open("prediction_instances.json","w") as f: f.write(json.dumps(instances))
Kirim permintaan prediksi:
gcloud ai-platform predict --model $MODEL_NAME \ --version $VERSION_NAME \ --json-instances prediction_instances.json
Untuk setiap objek yang terdeteksi dalam gambar, output prediksi mencakup class, skor, dan lokasi kotak pembatas.
Tentang data
Set data Common Objects in Context (COCO) Microsoft adalah set data deteksi objek, segmentasi, dan pemberian teks skala besar.
Langkah selanjutnya
- Pelajari lebih lanjut cara menggunakan algoritma deteksi objek gambar bawaan.