Halaman ini diterjemahkan oleh Cloud Translation API.

API pembuatan gambar

Imagen API memungkinkan Anda membuat gambar berkualitas tinggi dalam hitungan detik, menggunakan perintah teks untuk memandu pembuatan. Anda juga dapat meningkatkan skala gambar menggunakan Imagen API.

Melihat kartu model Imagen untuk Pembuatan Gambar

Model yang Didukung

Perhatian: Mulai 24 Juni 2025, Imagen versi 1 dan 2 tidak digunakan lagi. Model Imagen imagegeneration@002, imagegeneration@005, dan imagegeneration@006 akan dihapus pada 24 September 2025 . Untuk mengetahui informasi selengkapnya tentang cara bermigrasi ke Imagen 3, lihat Bermigrasi ke Imagen 3.

Perhatian: Model pratinjau Imagen 4 berikut akan dihapus pada 30 November 2025: imagen-4.0-generate-preview-06-06, imagen-4.0-ultra-generate-preview-06-06, dan imagen-4.0-fast-generate-preview-06-06. Untuk menghindari gangguan layanan, migrasikan semua alur kerja yang menggunakan model pratinjau Imagen 4 sebelum 30 November 2025 ke model Imagen 4 yang Tersedia Secara Umum berikut: imagen-4.0-generate-001, imagen-4.0-ultra-generate-001, imagen-4.0-fast-generate-001.

Imagen API mendukung model berikut:

imagen-4.0-generate-001
imagen-4.0-fast-generate-001
imagen-4.0-ultra-generate-001
imagen-3.0-generate-002
imagen-3.0-generate-001
imagen-3.0-fast-generate-001
imagen-3.0-capability-001
imagegeneration@006
imagegeneration@005
imagegeneration@002

Untuk mengetahui informasi selengkapnya tentang fitur yang didukung setiap model, lihat Model Imagen.

Contoh sintaksis

Sintaksis untuk membuat gambar dari perintah teks.

Sintaks

Sintaksis untuk membuat gambar.

REST

curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \

https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/publishers/google/models/${MODEL_VERSION}:predict \
-d '{
  "instances": [
    {
      "prompt": "..."
    }
  ],
  "parameters": {
    "sampleCount": ...
  }
}'

Python

generation_model = ImageGenerationModel.from_pretrained("MODEL_VERSION")

response = generation_model.generate_images(
    prompt="...",
    negative_prompt="...",
    aspect_ratio=...,
)
response.images[0].show()

Buat gambar

REST

Parameter
`prompt`	`string` Wajib. Perintah teks untuk gambar.
`addWatermark`	`bool` Opsional. Menambahkan watermark tak terlihat ke gambar yang dihasilkan. Nilai defaultnya adalah `true`, kecuali untuk model berikut: `imagegeneration@002` `imagegeneration@005`
`aspectRatio`	`string` Opsional. Rasio aspek untuk gambar output yang dihasilkan. Nilai defaultnya adalah "1:1". Parameter ini tidak berlaku untuk output yang di-upscale.
`enhancePrompt`	`boolean` Opsional. Parameter opsional untuk menggunakan fitur penulisan ulang perintah berbasis LLM guna menghasilkan gambar berkualitas lebih tinggi yang lebih mencerminkan maksud perintah asli. Menonaktifkan fitur ini dapat memengaruhi kualitas gambar dan kepatuhan terhadap perintah.
`language`	`string` Opsional. Kode bahasa yang sesuai dengan bahasa perintah teks Anda. Nilai-nilai berikut didukung: `auto`: Deteksi otomatis. Jika Imagen mendeteksi bahasa yang didukung, perintah dan perintah negatif opsional akan diterjemahkan ke dalam bahasa Inggris. Jika bahasa yang terdeteksi tidak didukung, Imagen akan menggunakan teks input apa adanya, yang dapat menghasilkan output yang tidak terduga. Tidak ada kode error yang ditampilkan. `en`: Inggris (jika tidak ditentukan, nilai default) `zh` atau `zh-CN`: China (Aksara Sederhana) `zh-TW`: China (tradisional) `hi`: Hindi `ja`: Jepang `ko`: Korea `pt`: Portugis `es`: Spanyol
`negativePrompt`	`string` Opsional. Deskripsi tentang hal yang tidak boleh ada dalam gambar yang dihasilkan. `negativePrompt` tidak didukung oleh `imagen-3.0-generate-002` dan model yang lebih baru.
`outputOptions`	`outputOptions` Opsional. Mendeskripsikan format gambar output dalam objek `outputOptions`.
`personGeneration`	`string` Opsional. Mengizinkan pembuatan gambar orang oleh model. Nilai berikut didukung: `"dont_allow"`: Melarang penyertaan orang atau wajah dalam gambar. `"allow_adult"`: Hanya mengizinkan pembuatan konten dewasa. `"allow_all"`: Izinkan pembuatan gambar orang dari segala usia. Nilai defaultnya adalah `"allow_adult"`.
`safetySetting`	`string` Opsional. Menambahkan tingkat filter ke pemfilteran keamanan. Nilai berikut didukung: `"block_low_and_above"`: Tingkat pemfilteran terkuat, pemblokiran paling ketat. Nilai yang tidak digunakan lagi: `"block_most"`. `"block_medium_and_above"`: Memblokir beberapa perintah dan respons yang bermasalah. Nilai yang tidak digunakan lagi: `"block_some"`. `"block_only_high"`: Mengurangi jumlah permintaan yang diblokir karena filter keamanan. Dapat meningkatkan konten tidak pantas yang dihasilkan oleh Imagen. Nilai yang tidak digunakan lagi: `"block_few"`. `"block_none"`: Memblokir sangat sedikit perintah dan respons yang bermasalah. Akses ke fitur ini dibatasi. Nilai kolom sebelumnya: `"block_fewest"`. Nilai defaultnya adalah `"block_medium_and_above"`.
`sampleCount`	`int` Wajib. Jumlah gambar yang akan dibuat. Nilai defaultnya adalah 4.
`sampleImageSize`	`string` Opsional. Menentukan resolusi output gambar yang dihasilkan. Nilai yang diterima adalah `"1K"` atau `"2K"`. Nilai defaultnya adalah `"1K"`.
`seed`	`Uint32` Opsional. Seed acak untuk pembuatan gambar. Fitur ini tidak tersedia jika `addWatermark` ditetapkan ke `true`. Jika `enhancePrompt` disetel ke `true`, parameter `seed` tidak akan berfungsi, karena `enhancePrompt` menghasilkan perintah baru, yang menghasilkan gambar baru atau berbeda.
`storageUri`	Opsional: `string` URI Cloud Storage untuk menyimpan gambar yang dihasilkan.

Objek opsi output

Objek outputOptions menjelaskan output gambar.

Parameter

Parameter
`outputOptions.mimeType`	Opsional: `string` Format gambar yang akan digunakan untuk menyimpan output. Nilai berikut didukung: `"image/png"`: Menyimpan sebagai gambar PNG `"image/jpeg"`: Simpan sebagai gambar JPEG Nilai defaultnya adalah `"image/png"`.
`outputOptions.compressionQuality`	Opsional: `int` Tingkat kompresi jika jenis outputnya adalah `"image/jpeg"`. Nilai yang diterima adalah 0 hingga 100. Nilai defaultnya adalah 75.

outputOptions.mimeType

Opsional: string

Format gambar yang akan digunakan untuk menyimpan output. Nilai berikut didukung:

"image/png": Menyimpan sebagai gambar PNG
"image/jpeg": Simpan sebagai gambar JPEG

Nilai defaultnya adalah "image/png".

outputOptions.compressionQuality

Opsional: int

Tingkat kompresi jika jenis outputnya adalah "image/jpeg". Nilai yang diterima adalah 0 hingga 100. Nilai defaultnya adalah 75.

Respons

Isi respons dari permintaan REST.

Parameter
`predictions`	Array objek `VisionGenerativeModelResult`, satu untuk setiap `sampleCount` yang diminta. Jika ada gambar yang difilter oleh AI yang bertanggung jawab, gambar tersebut tidak disertakan, kecuali `includeRaiReason` ditetapkan ke `true`.

Objek hasil model generatif visi

Informasi tentang hasil model.

Parameter
`bytesBase64Encoded`	Gambar yang dihasilkan berenkode base64. Tidak ada jika gambar output tidak lulus filter AI yang bertanggung jawab.
`mimeType`	Jenis gambar yang dibuat. Tidak ada jika gambar output tidak lulus filter AI yang bertanggung jawab.
`raiFilteredReason`	Alasan filter responsible AI. Hanya ditampilkan jika `includeRaiReason` diaktifkan dan gambar ini difilter.
`safetyAttributes.categories`	Nama atribut keamanan. Hanya ditampilkan jika `includeSafetyAttributes` diaktifkan, dan gambar output lulus filter AI yang bertanggung jawab.
`safetyAttributes.scores`	Skor atribut keamanan. Hanya ditampilkan jika `includeSafetyAttributes` diaktifkan, dan gambar output lulus filter AI yang bertanggung jawab.

Python

Parameter
`prompt`	`string` Wajib. Perintah teks untuk gambar.
`add_watermark`	`bool` Opsional. Menambahkan watermark ke gambar yang dihasilkan. Nilai defaultnya adalah `true`, kecuali untuk model berikut: `imagegeneration@002` `imagegeneration@005`
`aspect_ratio`	`string` Opsional. Rasio aspek untuk gambar output yang dihasilkan. Nilai defaultnya adalah "1:1". Parameter ini tidak berlaku untuk output yang di-upscale.
`compression_quality`	`int` Opsional. Tingkat kompresi jika jenis MIME output adalah `"image/jpeg"`. Nilai defaultnya adalah 75.
`language`	`string` Opsional. Bahasa perintah teks untuk gambar. Nilai berikut didukung: `auto`: Deteksi otomatis. Jika Imagen mendeteksi bahasa yang didukung, perintah dan perintah negatif opsional akan diterjemahkan ke dalam bahasa Inggris. Jika bahasa yang terdeteksi tidak didukung, Imagen akan menggunakan teks input apa adanya, yang dapat menghasilkan output yang tidak terduga. Tidak ada kode error yang ditampilkan. `en`: Inggris (jika tidak ditentukan, nilai default) `zh` atau `zh-CN`: China (Aksara Sederhana) `zh-TW`: China (tradisional) `hi`: Hindi `ja`: Jepang `ko`: Korea `pt`: Portugis `es`: Spanyol Nilai defaultnya adalah `"auto"`.
`negative_prompt`	`string` Opsional. Deskripsi tentang hal yang tidak boleh ada dalam gambar yang dihasilkan. `negative_prompt` tidak didukung oleh `imagen-3.0-generate-002` dan model yang lebih baru.
`number_of_images`	`int` Wajib. Jumlah gambar yang akan dibuat. Nilai default adalah 1.
`output_gcs_uri`	`string` Opsional. URI Cloud Storage untuk menyimpan gambar yang dihasilkan.
`output_mime_type`	`string` Opsional. Format gambar yang akan digunakan untuk menyimpan output. Nilai berikut didukung: `"image/png"`: Menyimpan sebagai gambar PNG `"image/jpeg"`: Simpan sebagai gambar JPEG Nilai defaultnya adalah `"image/png"`.
`person_generation`	`string` Opsional. Mengizinkan pembuatan gambar orang oleh model. Nilai berikut didukung: `"dont_allow"`: Memblokir pembuatan gambar orang `"allow_adult"`: Buat orang dewasa, tetapi bukan anak-anak `"allow_all"`: Membuat orang dewasa dan anak-anak Nilai defaultnya adalah `"allow_adult"`.
`safety_filter_level`	`string` Opsional. Menambahkan tingkat filter ke pemfilteran keamanan. Nilai berikut didukung: `"block_low_and_above"`: Tingkat pemfilteran terkuat, yang menghasilkan pemblokiran paling ketat. Nilai yang tidak digunakan lagi: `"block_most"`. `"block_medium_and_above"`: Memblokir beberapa perintah dan respons yang bermasalah. Nilai yang tidak digunakan lagi: `"block_some"`. `"block_only_high"`: Memblokir lebih sedikit perintah dan respons yang bermasalah. Nilai yang tidak digunakan lagi: `"block_few"`. `"block_none"`: Memblokir sangat sedikit perintah dan respons yang bermasalah. Nilai yang tidak digunakan lagi: `"block_fewest"`. Nilai defaultnya adalah `"block_medium_and_above"`.
`sample_image_size`	`string` Opsional. Menentukan resolusi output gambar yang dihasilkan. Nilai yang diterima adalah `"1K"` atau `"2K"`. Nilai defaultnya adalah `"1K"`.
`seed`	`int` Opsional. Seed acak untuk pembuatan gambar. Fitur ini tidak tersedia jika `addWatermark` ditetapkan ke `true`. Jika `enhancePrompt` disetel ke `true`, maka `seed` tidak akan berfungsi, karena `enhancePrompt` membuat perintah baru, yang menghasilkan gambar baru atau berbeda.

Meningkatkan skala gambar

REST

Parameter
`mode`	`string` Wajib. Harus disetel ke `"upscale"` untuk permintaan peningkatan kualitas.
`upscaleConfig`	`UpscaleConfig` Wajib. Objek `UpscaleConfig`.
`outputOptions`	`OutputOptions` Opsional. Mendeskripsikan format gambar output dalam objek `outputOptions`.
`storageUri`	`string` Opsional. URI Cloud Storage untuk tempat menyimpan gambar yang dihasilkan.

Objek konfigurasi peningkatan kualitas

Parameter

Parameter
`upscaleConfig.upscaleFactor`	`string` Wajib. Faktor peningkatan skala. Nilai yang didukung adalah `"x2"` dan `"x4"`.

upscaleConfig.upscaleFactor

string

Wajib. Faktor peningkatan skala. Nilai yang didukung adalah "x2" dan "x4".

Respons

Isi respons dari permintaan REST.

Parameter
`predictions`	Array objek `VisionGenerativeModelResult`, satu untuk setiap `sampleCount` yang diminta. Jika ada gambar yang difilter oleh AI yang bertanggung jawab, gambar tersebut tidak disertakan, kecuali `includeRaiReason` ditetapkan ke `true`.

Contoh

Contoh berikut menunjukkan cara menggunakan model Imagen untuk membuat gambar.

Buat gambar

REST

Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:

PROJECT_ID: Google Cloud Project ID Anda.
MODEL_VERSION: Versi model Imagen yang akan digunakan. Untuk mengetahui informasi selengkapnya tentang model yang tersedia, lihat Model Imagen.
LOCATION: Region project Anda. Misalnya, us-central1, europe-west2, atau asia-northeast3. Untuk mengetahui daftar region yang tersedia, lihat Lokasi AI Generatif di Vertex AI.
TEXT_PROMPT: Perintah teks yang memandu gambar yang dihasilkan model. Kolom ini wajib diisi untuk pembuatan dan pengeditan.
IMAGE_COUNT: Jumlah gambar yang dihasilkan. Nilai bilangan bulat yang diterima: 1-8 (imagegeneration@002), 1-4 (semua versi model lainnya). Nilai default: 4.

Parameter opsional tambahan

Gunakan variabel opsional berikut bergantung pada kasus penggunaan Anda. Tambahkan beberapa atau semua parameter berikut dalam objek "parameters": {}. Daftar ini menampilkan parameter opsional umum dan tidak dimaksudkan untuk menjadi lengkap. Untuk mengetahui informasi selengkapnya tentang parameter opsional, lihat Referensi API Imagen: Membuat gambar.

"parameters": {
  "sampleCount": IMAGE_COUNT,
  "addWatermark": ADD_WATERMARK,
  "aspectRatio": "ASPECT_RATIO",
  "enhancePrompt": ENABLE_PROMPT_REWRITING,
  "includeRaiReason": INCLUDE_RAI_REASON,
  "includeSafetyAttributes": INCLUDE_SAFETY_ATTRIBUTES,
  "outputOptions": {
    "mimeType": "MIME_TYPE",
    "compressionQuality": COMPRESSION_QUALITY
  },
  "personGeneration": "PERSON_SETTING",
  "safetySetting": "SAFETY_SETTING",
  "seed": SEED_NUMBER,
  "storageUri": "OUTPUT_STORAGE_URI"
}

ADD_WATERMARK: boolean. Opsional. Apakah akan mengaktifkan watermark untuk gambar yang dihasilkan. Gambar apa pun yang dihasilkan saat kolom disetel ke true berisi SynthID digital yang dapat Anda gunakan untuk memverifikasi gambar yang diberi watermark. Jika Anda menghapus kolom ini, nilai default true akan digunakan; Anda harus menetapkan nilai ke false untuk menonaktifkan fitur ini. Anda dapat menggunakan kolom seed untuk mendapatkan output deterministik hanya jika kolom ini ditetapkan ke false.
ASPECT_RATIO: string. Opsional. Parameter mode pembuatan yang mengontrol rasio aspek. Nilai rasio yang didukung dan penggunaan yang dimaksudkan:
- 1:1 (default, persegi)
- 3:4 (Iklan, media sosial)
- 4:3 (TV, fotografi)
- 16:9 (lanskap)
- 9:16 (potret)
ENABLE_PROMPT_REWRITING: boolean. Opsional. Parameter untuk menggunakan fitur penulisan ulang perintah berbasis LLM guna menghasilkan gambar berkualitas lebih tinggi yang lebih mencerminkan maksud perintah asli. Menonaktifkan fitur ini dapat memengaruhi kualitas gambar dan kepatuhan terhadap perintah. Nilai default: true.
INCLUDE_RAI_REASON: boolean. Opsional. Apakah akan mengaktifkan kode alasan yang difilter Responsible AI dalam respons dengan input atau output yang diblokir. Nilai default: true.
INCLUDE_SAFETY_ATTRIBUTES: boolean. Opsional. Apakah akan mengaktifkan skor Responsible AI yang dibulatkan untuk daftar atribut keamanan dalam respons untuk input dan output yang tidak difilter. Kategori atribut keselamatan: "Death, Harm & Tragedy", "Firearms & Weapons", "Hate", "Health", "Illicit Drugs", "Politics", "Porn", "Religion & Belief", "Toxic", "Violence", "Vulgarity", "War & Conflict". Nilai default: false.
MIME_TYPE: string. Opsional. Jenis MIME konten gambar. Nilai yang tersedia:
- image/jpeg
- image/gif
- image/png
- image/webp
- image/bmp
- image/tiff
- image/vnd.microsoft.icon
COMPRESSION_QUALITY: bilangan bulat. Opsional. Hanya berlaku untuk file output JPEG. Tingkat detail yang dipertahankan model untuk gambar yang dihasilkan dalam format file JPEG. Nilai: 0 hingga 100, dengan angka yang lebih tinggi berarti kompresi yang lebih besar. Default: 75.
PERSON_SETTING: string. Opsional. Setelan keamanan yang mengontrol jenis generasi wajah atau orang yang diizinkan oleh model. Nilai yang tersedia:
- allow_adult (default): Mengizinkan pembuatan gambar khusus dewasa, kecuali untuk pembuatan gambar selebritas. Pembuatan gambar selebritas tidak diizinkan untuk setelan apa pun.
- dont_allow: Menonaktifkan penyertaan orang atau wajah dalam gambar yang dihasilkan.
SAFETY_SETTING: string. Opsional. Setelan yang mengontrol batas filter keamanan untuk gambar yang dihasilkan. Nilai yang tersedia:
- block_low_and_above: Nilai minimum keamanan tertinggi, sehingga menghasilkan jumlah gambar yang dihasilkan paling banyak yang difilter. Nilai sebelumnya: block_most.
- block_medium_and_above (default): Batas keamanan sedang yang menyeimbangkan pemfilteran untuk konten yang berpotensi berbahaya dan aman. Nilai sebelumnya: block_some.
- block_only_high: Batas keamanan yang mengurangi jumlah permintaan yang diblokir karena filter keamanan. Setelan ini dapat meningkatkan konten tidak pantas yang dibuat oleh Imagen. Nilai sebelumnya: block_few.
SEED_NUMBER: bilangan bulat. Opsional. Bilangan bulat non-negatif yang Anda berikan untuk membuat gambar output menjadi deterministik. Memberikan nomor seed yang sama akan selalu menghasilkan gambar output yang sama. Jika model yang Anda gunakan mendukung watermark digital, Anda harus menyetel "addWatermark": false untuk menggunakan kolom ini. Nilai bilangan bulat yang diterima: 1 - 2147483647.
OUTPUT_STORAGE_URI: string. Opsional. Bucket Cloud Storage untuk menyimpan gambar output. Jika tidak diberikan, byte gambar berenkode base64 akan ditampilkan dalam respons. Contoh nilai: gs://image-bucket/output/.

Metode HTTP dan URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict

Isi JSON permintaan:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT"
    }
  ],
  "parameters": {
    "sampleCount": IMAGE_COUNT
  }
}

Untuk mengirim permintaan Anda, pilih salah satu opsi berikut:

curl

Catatan: Perintah berikut mengasumsikan bahwa Anda telah login ke gcloud CLI menggunakan akun pengguna Anda dengan menjalankan gcloud init atau gcloud auth login , atau dengan menggunakan Cloud Shell, yang secara otomatis membuat Anda login ke gcloud CLI . Anda dapat memeriksa akun yang saat ini aktif dengan menjalankan gcloud auth list.

Simpan isi permintaan dalam file bernama request.json, dan jalankan perintah berikut:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict"

PowerShell

Catatan: Perintah berikut mengasumsikan bahwa Anda telah login ke gcloud CLI menggunakan akun pengguna Anda dengan menjalankan gcloud init atau gcloud auth login . Anda dapat memeriksa akun yang saat ini aktif dengan menjalankan gcloud auth list.

Simpan isi permintaan dalam file bernama request.json, dan jalankan perintah berikut:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict" | Select-Object -Expand Content

Contoh respons berikut adalah untuk permintaan dengan

"sampleCount":
  2

. Respons ini menampilkan dua objek prediksi, dengan byte gambar yang dihasilkan berenkode base64.

{
  "predictions": [
    {
      "bytesBase64Encoded": "BASE64_IMG_BYTES",
      "mimeType": "image/png"
    },
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    }
  ]
}

Jika Anda menggunakan model yang mendukung peningkatan kualitas perintah, respons akan menyertakan kolom prompt tambahan dengan perintah yang ditingkatkan kualitasnya yang digunakan untuk pembuatan:

{
  "predictions": [
    {
      "mimeType": "MIME_TYPE",
      "prompt": "ENHANCED_PROMPT_1",
      "bytesBase64Encoded": "BASE64_IMG_BYTES_1"
    },
    {
      "mimeType": "MIME_TYPE",
      "prompt": "ENHANCED_PROMPT_2",
      "bytesBase64Encoded": "BASE64_IMG_BYTES_2"
    }
  ]
}

Python

Sebelum mencoba contoh ini, ikuti petunjuk penyiapan Python di Panduan memulai Vertex AI menggunakan library klien. Untuk mengetahui informasi selengkapnya, lihat Dokumentasi referensi API Python Vertex AI.

Untuk melakukan autentikasi ke Vertex AI, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.

Dalam contoh ini, Anda memanggil metode generate_images pada ImageGenerationModel (versi @006) dan menyimpan gambar yang dihasilkan secara lokal. Kemudian, Anda dapat memilih menggunakan metode show() di notebook untuk menampilkan gambar yang dihasilkan. Untuk mengetahui informasi selengkapnya tentang versi dan fitur model, lihat versi model.


import vertexai
from vertexai.preview.vision_models import ImageGenerationModel

# TODO(developer): Update and un-comment below lines
# PROJECT_ID = "your-project-id"
# output_file = "input-image.png"
# prompt = "" # The text prompt describing what you want to see.

vertexai.init(project=PROJECT_ID, location="us-central1")

model = ImageGenerationModel.from_pretrained("imagen-3.0-generate-002")

images = model.generate_images(
    prompt=prompt,
    # Optional parameters
    number_of_images=1,
    language="en",
    # You can't use a seed value and watermark at the same time.
    # add_watermark=False,
    # seed=100,
    aspect_ratio="1:1",
    safety_filter_level="block_some",
    person_generation="allow_adult",
)

images[0].save(location=output_file, include_generation_parameters=False)

# Optional. View the generated image in a notebook.
# images[0].show()

print(f"Created output image using {len(images[0]._image_bytes)} bytes")
# Example response:
# Created output image using 1234567 bytes

Meningkatkan skala gambar

REST

Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:

LOCATION: Region project Anda. Misalnya, us-central1, europe-west2, atau asia-northeast3. Untuk mengetahui daftar region yang tersedia, lihat Lokasi AI Generatif di Vertex AI.
PROJECT_ID: Google Cloud Project ID Anda.
B64_BASE_IMAGE: Gambar dasar yang akan diedit atau di-upscale. Gambar harus ditentukan sebagai string byte berenkode base64. Batas ukuran: 10 MB.
IMAGE_SOURCE: Lokasi Cloud Storage gambar yang ingin Anda edit atau tingkatkan kualitasnya. Contoh: gs://output-bucket/source-photos/photo.png.
UPSCALE_FACTOR: Opsional. Faktor yang akan digunakan untuk meningkatkan skala gambar. Jika tidak ditentukan, faktor peningkatan kualitas akan ditentukan dari sisi terpanjang gambar input dan sampleImageSize. Nilai yang tersedia: x2 atau x4 .

Metode HTTP dan URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@002:predict

Isi JSON permintaan:

{
  "instances": [
    {
      "prompt": "",
      "image": {
        // use one of the following to specify the image to upscale
        "bytesBase64Encoded": "B64_BASE_IMAGE"
        "gcsUri": "IMAGE_SOURCE"
        // end of base image input options
      },
    }
  ],
  "parameters": {
    "sampleCount": 1,
    "mode": "upscale",
    "upscaleConfig": {
      "upscaleFactor": "UPSCALE_FACTOR"
    }
  }
}

Untuk mengirim permintaan Anda, pilih salah satu opsi berikut:

curl

Simpan isi permintaan dalam file bernama request.json, dan jalankan perintah berikut:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@002:predict"

PowerShell

Simpan isi permintaan dalam file bernama request.json, dan jalankan perintah berikut:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@002:predict" | Select-Object -Expand Content

Anda akan melihat respons JSON yang mirip dengan berikut ini:

{
  "predictions": [
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "iVBOR..[base64-encoded-upscaled-image]...YII="
    }
  ]
}

Langkah berikutnya

Untuk mengetahui informasi selengkapnya, lihat Ringkasan Imagen di Vertex AI dan Membuat gambar menggunakan perintah teks.

Sebelumnya

Membuat gambar menggunakan perintah teks