Setiap model gambar Vertex AI Generative AI tersedia dalam versi
yang berbeda. Model gambar mencakup model teks dan generatif, seperti
imagegeneration
dan imagetext
. Versi tersebut berbeda-beda menurut fitur yang
ditawarkannya.
Pembuatan, pengeditan, dan penyesuaian gambar
Melihat kartu model Imagen untuk Pembuatan
Melihat kartu model Imagen untuk Pengeditan dan Penyesuaian
Versi model pembuatan gambar berikut tersedia untuk tugas pembuatan gambar dan pengeditan gambar.
Imagen 3 | Imagen 2 (v.006, default) | Imagen 2 (v.005) | Imagen (v.002) | |
---|---|---|---|---|
Nama dan versi model |
Imagen 3: imagen-3.0-generate-001 Imagen 3 Cepat: imagen-3.0-fast-generate-001 Ini adalah varian model latensi rendah yang dapat Anda gunakan untuk pembuatan prototipe atau kasus penggunaan latensi rendah. Penyesuaian dan Pengeditan Imagen 3: imagen-3.0-capability-001
|
imagegeneration@006 |
imagegeneration@005 |
imagegeneration@002 |
Pembuatan gambar | Ketersediaan Umum | Ketersediaan Umum (pengguna yang disetujui) | Ketersediaan Umum (pengguna yang disetujui) | Ketersediaan Umum (pengguna yang disetujui) |
Penyesuaian Gambar (pemelajaran beberapa tahap) | Ketersediaan Umum (pengguna yang disetujui)
|
Tidak didukung | Tidak didukung | Tidak didukung |
Pengeditan gambar |
|
|
Tidak didukung. Dukungan fitur untuk model ini dapat berubah dan diperbarui pada masa mendatang. |
|
Verifikasi dan watermark digital (pembuatan gambar) | Didukung (diaktifkan secara default) | Didukung (diaktifkan secara default) | Didukung (tidak diaktifkan secara default) | Didukung (tidak diaktifkan secara default) |
Setelan keamanan yang dapat dikonfigurasi pengguna |
|
|
Tidak didukung | Tidak didukung |
Peningkatan dimensi gambar | Tidak didukung | Tidak didukung | Tidak didukung | Didukung (2x atau 4x) |
Rasio aspek dan resolusi |
|
|
|
|
Bahasa | Ketersediaan umum:
Pratinjau:
|
Ketersediaan umum:
Pratinjau:
|
Ketersediaan umum:
Pratinjau:
|
Ketersediaan umum:
|
Penyesuaian model | Tidak didukung. Dukungan fitur untuk model ini dapat mengalami perubahan dan pembaruan pada masa mendatang. |
Tidak didukung | Tidak didukung | Ketersediaan penyesuaian model:
|
Teks keterangan visual dan Visual Question Answering (VQA)
Melihat kartu model Imagen for Captioning & VQA
Versi model imagetext
berikut tersedia untuk tugas
penulisan teks gambar dan Visual Question Answering (VQA).
Versi model:imagetext@001 (default) |
|
---|---|
Teks keterangan visual (video berdurasi pendek) | Token: 32 (~32 kata) Bahasa: Inggris, Spanyol, Prancis, Jerman, Italia |
Visual Question Answering, VQA (bentuk singkat) | Token (permintaan): 80 Token (respons): 64 Bahasa: Inggris |
Cara menentukan versi model gambar
Untuk menggunakan versi model visi, tambahkan nomor versi tiga digit ke
model. Misalnya, untuk menentukan versi model imagegeneration
, tambahkan versi model (misalnya, @006
) ke nama model:
POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagegeneration@006:predict
POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagetext@001:predict
Namun, format ini tidak berlaku untuk model Imagen 3.
Anda harus selalu menentukan versi model stabil untuk penggunaan produksi, karena menggunakan opsi default tanpa versi model yang ditentukan dapat menyebabkan perubahan pada perilaku model.
Jika Anda menghapus versi model, Imagen akan menggunakan versi model default:
POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagegeneration:predict
POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagetext:predict
Sebagai praktik terbaik, selalu tentukan versi model. Jika Anda memilih untuk menggunakan nama model tanpa versi model, pastikan nama model tersebut berada di lingkungan pengujian.
Langkah selanjutnya
- Pelajari cara mengirim permintaan ke model tertentu:
- Pelajari parameter model lebih lanjut menggunakan referensi API:
- Pembuatan gambar (model
imagegeneration
) - Teks gambar (model
imagetext
) - Visual question and answering (VQA) (model
imagetext
)
- Pembuatan gambar (model