Versi dan siklus proses model Imagen di Vertex AI

Setiap model gambar Vertex AI Generative AI tersedia dalam versi yang berbeda. Model gambar mencakup model teks dan generatif, seperti imagegeneration dan imagetext. Versi tersebut berbeda-beda menurut fitur yang ditawarkannya.

Pembuatan, pengeditan, dan penyesuaian gambar

Melihat kartu model Imagen untuk Pembuatan

Melihat kartu model Imagen untuk Pengeditan dan Penyesuaian

Versi model pembuatan gambar berikut tersedia untuk tugas pembuatan gambar dan pengeditan gambar.

Imagen 3 Imagen 2 (v.006, default) Imagen 2 (v.005) Imagen (v.002)
Nama dan versi model Imagen 3: imagen-3.0-generate-001


Imagen 3 Cepat: imagen-3.0-fast-generate-001

Ini adalah varian model latensi rendah yang dapat Anda gunakan untuk pembuatan prototipe atau kasus penggunaan latensi rendah.


Penyesuaian dan Pengeditan Imagen 3: imagen-3.0-capability-001
imagegeneration@006 imagegeneration@005 imagegeneration@002
Pembuatan gambar Ketersediaan Umum Ketersediaan Umum (pengguna yang disetujui) Ketersediaan Umum (pengguna yang disetujui) Ketersediaan Umum (pengguna yang disetujui)
Penyesuaian Gambar (pemelajaran beberapa tahap) Ketersediaan Umum (pengguna yang disetujui)
  • Penyesuaian subjek (produk, orang, dan hewan peliharaan)
  • Penyesuaian gaya
  • Penyesuaian terkontrol (goresan dan tepi canny)
  • Memberi petunjuk penyesuaian (transfer gaya)
Tidak didukung Tidak didukung Tidak didukung
Pengeditan gambar
  • Pengeditan (berbasis mask)
    • Inpainting (menyisipkan, menghapus)
    • Outpainting
    • Pengeditan gambar produk
  • Pengeditan (berbasis mask)
    • Inpainting (menyisipkan, menghapus)
    • Outpainting
    • Pengeditan gambar produk
Tidak didukung. Dukungan fitur untuk model ini dapat berubah dan diperbarui pada masa mendatang.
  • Pengeditan (berbasis mask)
  • Pengeditan (tanpa mask)
  • Pengeditan gambar produk (Fitur pratinjau)
Verifikasi dan watermark digital (pembuatan gambar) Didukung (diaktifkan secara default) Didukung (diaktifkan secara default) Didukung (tidak diaktifkan secara default) Didukung (tidak diaktifkan secara default)
Setelan keamanan yang dapat dikonfigurasi pengguna
  • Pembuatan orang - izinkan semua usia, hanya pembuatan orang/wajah dewasa, atau blokir semua pembuatan orang
  • Setelan keamanan - memblokir sebagian besar, beberapa, atau sedikit instance konten yang difilter
  • Pembuatan orang - izinkan semua usia, hanya pembuatan orang/wajah dewasa, atau blokir semua pembuatan orang
  • Setelan keamanan - memblokir sebagian besar, beberapa, atau sedikit instance konten yang difilter
Tidak didukung Tidak didukung
Peningkatan dimensi gambar Tidak didukung Tidak didukung Tidak didukung Didukung (2x atau 4x)
Rasio aspek dan resolusi
  • 1:1 - 1024x1024 piksel (persegi)
  • 9:16 - 768x1408 piksel
  • 16:9 - 1408x768 piksel
  • 3:4 - 896x1280 piksel
  • 4:3 - 1280x896 piksel
  • 1:1 - 1536x1536 piksel (persegi)
  • 9:16 - 1152x2016 piksel
  • 16:9 - 2016x1134 piksel
  • 3:4- 1344x1792 piksel
  • 4:3 - 1792x1344 piksel
  • 1:1 - 1536x1536 piksel (persegi)
  • 9:16 - 1152x2016 piksel
  • 1:1 - 1024x1024 piksel (persegi)
Bahasa

Ketersediaan umum:

  • Inggris

Pratinjau:

  • China (aksara sederhana)
  • China (aksara tradisional)
  • Hindi
  • Jepang
  • Korea
  • Portugis
  • Spanyol

Ketersediaan umum:

  • Inggris

Pratinjau:

  • China (aksara sederhana)
  • China (aksara tradisional)
  • Hindi
  • Jepang
  • Korea
  • Portugis
  • Spanyol

Ketersediaan umum:

  • Inggris

Pratinjau:

  • China (aksara sederhana)
  • China (aksara tradisional)
  • Hindi
  • Jepang
  • Korea
  • Portugis
  • Spanyol

Ketersediaan umum:

  • Inggris
Penyesuaian model Tidak didukung.

Dukungan fitur untuk model ini dapat mengalami perubahan dan pembaruan pada masa mendatang.
Tidak didukung Tidak didukung

Ketersediaan penyesuaian model:

  • Penyesuaian model subjek
  • Penyesuaian model gaya

Teks keterangan visual dan Visual Question Answering (VQA)

Melihat kartu model Imagen for Captioning & VQA

Versi model imagetext berikut tersedia untuk tugas penulisan teks gambar dan Visual Question Answering (VQA).

Versi model:
imagetext@001 (default)
Teks keterangan visual (video berdurasi pendek) Token: 32 (~32 kata)
Bahasa: Inggris, Spanyol, Prancis, Jerman, Italia
Visual Question Answering, VQA (bentuk singkat) Token (permintaan): 80
Token (respons): 64
Bahasa: Inggris

Cara menentukan versi model gambar

Untuk menggunakan versi model visi, tambahkan nomor versi tiga digit ke model. Misalnya, untuk menentukan versi model imagegeneration, tambahkan versi model (misalnya, @006) ke nama model:

  • POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagegeneration@006:predict
  • POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagetext@001:predict

Namun, format ini tidak berlaku untuk model Imagen 3.

Anda harus selalu menentukan versi model stabil untuk penggunaan produksi, karena menggunakan opsi default tanpa versi model yang ditentukan dapat menyebabkan perubahan pada perilaku model.

Jika Anda menghapus versi model, Imagen akan menggunakan versi model default:

  • POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagegeneration:predict
  • POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagetext:predict

Sebagai praktik terbaik, selalu tentukan versi model. Jika Anda memilih untuk menggunakan nama model tanpa versi model, pastikan nama model tersebut berada di lingkungan pengujian.

Langkah selanjutnya