Mulai 29 April 2025, model Gemini 1.5 Pro dan Gemini 1.5 Flash tidak tersedia di project yang belum pernah menggunakan model ini, termasuk project baru. Untuk mengetahui detailnya, lihat Versi dan siklus proses model.

Halaman ini diterjemahkan oleh Cloud Translation API.

Membuat gambar dengan Gemini

Perhatian: Pembuatan Gambar Flash Gemini 2.0 tidak akan digunakan lagi mulai 26 September 2025 . gemini-2.0-flash-preview-image-generation akan dihapus pada 26 September 2025 . Migrasikan alur kerja apa pun ke gemini-2.5-flash-image-preview.

Pratinjau

Produk atau fitur ini adalah penawaran Pratinjau AI Generatif, yang tunduk pada "Persyaratan Penawaran Pra-GA" dari Persyaratan Khusus Layanan Google Cloud, serta Persyaratan Tambahan untuk Produk Pratinjau AI Generatif. Untuk penawaran Pratinjau AI Generatif ini, Pelanggan dapat memilih untuk menggunakannya untuk tujuan produksi atau komersial, atau mengungkapkan Output yang Dihasilkan kepada pihak ketiga, dan dapat memproses data pribadi sebagaimana diuraikan dalam Adendum Pemrosesan Data Cloud, dengan tunduk pada kewajiban dan batasan yang dijelaskan dalam perjanjian yang menjadi dasar Anda mengakses Google Cloud. Produk pra-GA tersedia "sebagaimana adanya" dan mungkin memiliki dukungan terbatas. Untuk mengetahui informasi selengkapnya, lihat deskripsi tahap peluncuran.

Pratinjau Gambar Gemini 2.5 Flash mendukung pembuatan respons dalam beberapa modalitas, termasuk teks dan gambar.

Pembuatan gambar

Pratinjau Publik Gemini Flash untuk pembuatan gambar (gemini-2.5-flash-image-preview) mendukung kemampuan untuk membuat gambar selain teks. Hal ini memperluas kemampuan Gemini untuk mencakup hal-hal berikut:

Buat gambar secara iteratif melalui percakapan dengan bahasa alami, sesuaikan gambar sambil mempertahankan konsistensi dan konteks.
Buat gambar dengan rendering teks panjang berkualitas tinggi.
Menghasilkan output teks-gambar yang disisipkan. Misalnya, postingan blog dengan teks dan gambar dalam satu giliran. Sebelumnya, hal ini memerlukan penggabungan beberapa model.
Membuat gambar menggunakan pengetahuan dunia dan kemampuan penalaran Gemini.

Dengan rilis eksperimental publik ini, Pratinjau Gemini 2.5 Flash Image dapat membuat gambar dalam 1024 piksel, mendukung pembuatan gambar orang, dan berisi filter keamanan yang diperbarui yang memberikan pengalaman pengguna yang lebih fleksibel dan tidak terlalu ketat.

API ini mendukung modalitas dan kemampuan berikut:

Teks ke gambar
- Contoh perintah: "Buat gambar Menara Eiffel dengan kembang api di latar belakang."
Teks ke gambar (rendering teks)
- Contoh perintah: "buat foto sinematik sebuah bangunan besar dengan proyeksi teks raksasa ini yang dipetakan di bagian depan bangunan: "Gemini 2.5 kini dapat membuat teks panjang""
Teks ke gambar dan teks (berselang-seling)
- Contoh perintah: "Buat resep paella bergambar. Buat gambar bersama teks saat Anda membuat resep."
- Contoh perintah: "Buat cerita tentang seekor dengan gaya animasi kartun 3D. Untuk setiap adegan, buat gambar"
Gambar dan teks ke gambar dan teks (disisipkan)
- Contoh perintah: (Dengan gambar ruangan yang dilengkapi perabot) "Sofa warna apa lagi yang cocok untuk ruangan saya? Dapatkah Anda memperbarui gambar?"
Pembuatan gambar yang disesuaikan dengan lokalitas
- Contoh perintah: "Buat gambar makanan sarapan."

Batasan:

Untuk performa terbaik, gunakan bahasa berikut: EN, es-MX, ja-JP, zh-CN, hi-IN.
Pembuatan gambar tidak mendukung input audio atau video.
Pembuatan gambar mungkin tidak selalu dipicu:
- Model hanya dapat menghasilkan teks. Coba minta output gambar secara eksplisit. Misalnya, "berikan gambar saat Anda melakukannya".
- Model dapat menghasilkan teks sebagai gambar. Coba minta output teks secara eksplisit. Misalnya, "buat teks naratif beserta ilustrasinya".
- Model dapat berhenti menghasilkan output di tengah proses. Coba lagi atau coba perintah lain.

Buat gambar

Bagian berikut membahas cara membuat gambar menggunakan Vertex AI Studio atau menggunakan API.

Untuk panduan dan praktik terbaik dalam membuat perintah, lihat Mendesain perintah multimodal.

Konsol

Untuk menggunakan pembuatan gambar:

Buka Vertex AI Studio > Create prompt.
Klik Ganti model, lalu pilih gemini-2.5-flash-image-preview dari menu.
Di panel Output, pilih Gambar dan teks dari menu drop-down.
Tulis deskripsi gambar yang ingin Anda buat di area teks Tulis perintah.
Klik tombol Prompt ().

Gemini akan membuat gambar berdasarkan deskripsi Anda. Proses ini akan memakan waktu beberapa detik, tetapi mungkin lebih lambat bergantung pada kapasitas.

Python

Instal

pip install --upgrade google-genai

Untuk mempelajari lebih lanjut, lihat dokumentasi referensi SDK.

Tetapkan variabel lingkungan untuk menggunakan Gen AI SDK dengan Vertex AI:

# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=global
export GOOGLE_GENAI_USE_VERTEXAI=True

from google import genai
from google.genai.types import GenerateContentConfig, Modality
from PIL import Image
from io import BytesIO

client = genai.Client()

response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents=("Generate an image of the Eiffel tower with fireworks in the background."),
    config=GenerateContentConfig(
        response_modalities=[Modality.TEXT, Modality.IMAGE],
        candidate_count=1,
        safety_settings=[
            {"method": "PROBABILITY"},
            {"category": "HARM_CATEGORY_DANGEROUS_CONTENT"},
            {"threshold": "BLOCK_MEDIUM_AND_ABOVE"},
        ],
    ),
)
for part in response.candidates[0].content.parts:
    if part.text:
        print(part.text)
    elif part.inline_data:
        image = Image.open(BytesIO((part.inline_data.data)))
        image.save("output_folder/example-image-eiffel-tower.png")
# Example response:
#   I will generate an image of the Eiffel Tower at night, with a vibrant display of
#   colorful fireworks exploding in the dark sky behind it. The tower will be
#   illuminated, standing tall as the focal point of the scene, with the bursts of
#   light from the fireworks creating a festive atmosphere.

Node.js

Instal

npm install @google/genai

Untuk mempelajari lebih lanjut, lihat dokumentasi referensi SDK.

Tetapkan variabel lingkungan untuk menggunakan Gen AI SDK dengan Vertex AI:

# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=global
export GOOGLE_GENAI_USE_VERTEXAI=True

const fs = require('fs');
const {GoogleGenAI, Modality} = require('@google/genai');

const GOOGLE_CLOUD_PROJECT = process.env.GOOGLE_CLOUD_PROJECT;
const GOOGLE_CLOUD_LOCATION =
  process.env.GOOGLE_CLOUD_LOCATION || 'us-central1';

async function generateContent(
  projectId = GOOGLE_CLOUD_PROJECT,
  location = GOOGLE_CLOUD_LOCATION
) {
  const ai = new GoogleGenAI({
    vertexai: true,
    project: projectId,
    location: location,
  });

  const response = await ai.models.generateContentStream({
    model: 'gemini-2.0-flash-exp',
    contents:
      'Generate an image of the Eiffel tower with fireworks in the background.',
    config: {
      responseModalities: [Modality.TEXT, Modality.IMAGE],
    },
  });

  const generatedFileNames = [];
  let imageIndex = 0;
  for await (const chunk of response) {
    const text = chunk.text;
    const data = chunk.data;
    if (text) {
      console.debug(text);
    } else if (data) {
      const fileName = `generate_content_streaming_image_${imageIndex++}.png`;
      console.debug(`Writing response image to file: ${fileName}.`);
      try {
        fs.writeFileSync(fileName, data);
        generatedFileNames.push(fileName);
      } catch (error) {
        console.error(`Failed to write image file ${fileName}:`, error);
      }
    }
  }

  return generatedFileNames;
}

REST

Jalankan perintah berikut di terminal untuk membuat atau menimpa file ini di direktori saat ini:

curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  https://${API_ENDPOINT}:generateContent \
  -d '{
    "contents": {
      "role": "USER",
      "parts": { "text": "Create a tutorial explaining how to make a peanut butter and jelly sandwich in three easy steps."},
    },
    "generation_config": {
      "response_modalities": ["TEXT", "IMAGE"],
     },
     "safetySettings": {
      "method": "PROBABILITY",
      "category": "HARM_CATEGORY_DANGEROUS_CONTENT",
      "threshold": "BLOCK_MEDIUM_AND_ABOVE"
    },
  }' 2>/dev/null >response.json

Catatan: Anda harus menyertakan responseModalities: ["TEXT", "IMAGE"] dalam konfigurasi Anda. Output hanya gambar tidak didukung dengan model ini.

Gemini akan membuat gambar berdasarkan deskripsi Anda. Proses ini akan memakan waktu beberapa detik, tetapi mungkin lebih lambat bergantung pada kapasitas.

Membuat kombinasi gambar dan teks

Pratinjau Gambar Flash Gemini 2.5 dapat membuat gambar kombinasi dengan respons teksnya. Misalnya, Anda dapat membuat gambar seperti apa tampilan setiap langkah resep yang dibuat untuk melengkapi teks langkah tersebut, tanpa harus membuat permintaan terpisah ke model untuk melakukannya.

Konsol

Untuk membuat kombinasi gambar dengan respons teks:

Buka Vertex AI Studio > Create prompt.
Klik Ganti model, lalu pilih gemini-2.5-flash-image-preview dari menu.
Di panel Output, pilih Gambar dan teks dari menu drop-down.
Tulis deskripsi gambar yang ingin Anda buat di area teks Tulis perintah. Misalnya, "Buat tutorial yang menjelaskan cara membuat sandwich selai kacang dan jeli dalam tiga langkah mudah. Untuk setiap langkah, berikan judul dengan nomor langkah, penjelasan, dan buat juga gambar, buat setiap gambar dalam rasio aspek 1:1."
Klik tombol Prompt ().

Gemini akan membuat respons berdasarkan deskripsi Anda. Proses ini akan memakan waktu beberapa detik, tetapi mungkin lebih lambat bergantung pada kapasitas.

Python

Instal

pip install --upgrade google-genai

Untuk mempelajari lebih lanjut, lihat dokumentasi referensi SDK.

Tetapkan variabel lingkungan untuk menggunakan Gen AI SDK dengan Vertex AI:

# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=global
export GOOGLE_GENAI_USE_VERTEXAI=True

from google import genai
from google.genai.types import GenerateContentConfig, Modality
from PIL import Image
from io import BytesIO

client = genai.Client()

response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents=(
        "Generate an illustrated recipe for a paella."
        "Create images to go alongside the text as you generate the recipe"
    ),
    config=GenerateContentConfig(response_modalities=[Modality.TEXT, Modality.IMAGE]),
)
with open("output_folder/paella-recipe.md", "w") as fp:
    for i, part in enumerate(response.candidates[0].content.parts):
        if part.text is not None:
            fp.write(part.text)
        elif part.inline_data is not None:
            image = Image.open(BytesIO((part.inline_data.data)))
            image.save(f"output_folder/example-image-{i+1}.png")
            fp.write(f"![image](example-image-{i+1}.png)")
# Example response:
#  A markdown page for a Paella recipe(`paella-recipe.md`) has been generated.
#   It includes detailed steps and several images illustrating the cooking process.

REST

Jalankan perintah berikut di terminal untuk membuat atau menimpa file ini di direktori saat ini:

curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  https://${API_ENDPOINT}:generateContent \
  -d '{
    "contents": {
      "role": "USER",
      "parts": { "text": "Create a tutorial explaining how to make a peanut butter and jelly sandwich in three easy steps. For each step, provide a title with the number of the step, an explanation, and also generate an image, generate each image in a 1:1 aspect ratio."},
    },
    "generation_config": {
      "response_modalities": ["TEXT", "IMAGE"],
     },
     "safetySettings": {
      "method": "PROBABILITY",
      "category": "HARM_CATEGORY_DANGEROUS_CONTENT",
      "threshold": "BLOCK_MEDIUM_AND_ABOVE"
    },
  }' 2>/dev/null >response.json

Catatan: Anda harus menyertakan responseModalities: ["TEXT", "IMAGE"] dalam konfigurasi Anda. Output hanya gambar tidak didukung dengan model ini.

Gemini akan membuat gambar berdasarkan deskripsi Anda. Proses ini akan memakan waktu beberapa detik, tetapi mungkin lebih lambat bergantung pada kapasitas.

Pembuatan gambar yang disesuaikan dengan lokalitas

Pratinjau Gambar Gemini 2.5 Flash juga dapat menyertakan informasi tentang lokasi Anda saat memberikan respons teks atau gambar. Misalnya, Anda dapat membuat gambar jenis lokasi atau pengalaman yang memperhitungkan lokasi Anda saat ini tanpa harus menentukan lokasi Anda ke model untuk melakukannya.

Konsol

Untuk menggunakan pembuatan gambar yang mendukung lokalitas:

Buka Vertex AI Studio > Create prompt.
Klik Ganti model, lalu pilih gemini-2.5-flash-image-preview dari menu.
Di panel Output, pilih Gambar dan teks dari menu drop-down.
Tulis deskripsi gambar yang ingin Anda buat di area teks Tulis perintah. Misalnya, "Buat foto sarapan biasa".
Klik tombol Prompt ().

Gemini akan membuat respons berdasarkan deskripsi Anda. Proses ini akan memakan waktu beberapa detik, tetapi mungkin lebih lambat bergantung pada kapasitas.

Python

Instal

pip install --upgrade google-genai

Untuk mempelajari lebih lanjut, lihat dokumentasi referensi SDK.

Tetapkan variabel lingkungan untuk menggunakan Gen AI SDK dengan Vertex AI:

# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=global
export GOOGLE_GENAI_USE_VERTEXAI=True

from google import genai
from google.genai.types import GenerateContentConfig, Modality
from PIL import Image
from io import BytesIO

client = genai.Client()

response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents=("Generate a photo of a breakfast meal."),
    config=GenerateContentConfig(response_modalities=[Modality.TEXT, Modality.IMAGE]),
)
for part in response.candidates[0].content.parts:
    if part.text:
        print(part.text)
    elif part.inline_data:
        image = Image.open(BytesIO((part.inline_data.data)))
        image.save("output_folder/example-breakfast-meal.png")
# Example response:
#   Generates a photo of a vibrant and appetizing breakfast meal.
#   The scene will feature a white plate with golden-brown pancakes
#   stacked neatly, drizzled with rich maple syrup and ...

REST

Jalankan perintah berikut di terminal untuk membuat atau menimpa file ini di direktori saat ini:

curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  https://${API_ENDPOINT}:generateContent \
  -d '{
    "contents": {
      "role": "USER",
      "parts": { "text": "Generate a photo of a typical breakfast."},
    },
    "generation_config": {
      "response_modalities": ["TEXT", "IMAGE"],
     },
     "safetySettings": {
      "method": "PROBABILITY",
      "category": "HARM_CATEGORY_DANGEROUS_CONTENT",
      "threshold": "BLOCK_MEDIUM_AND_ABOVE"
    },
  }' 2>/dev/null >response.json

Catatan: Anda harus menyertakan responseModalities: ["TEXT", "IMAGE"] dalam konfigurasi Anda. Output hanya gambar tidak didukung dengan model ini.

Gemini akan membuat gambar berdasarkan deskripsi Anda. Proses ini akan memakan waktu beberapa detik, tetapi mungkin lebih lambat bergantung pada kapasitas.

Membuat gambar dengan Gemini Tetap teratur dengan koleksi Simpan dan kategorikan konten berdasarkan preferensi Anda.

Pembuatan gambar

Buat gambar

Konsol

Python

Instal

Node.js

Instal

REST

Membuat kombinasi gambar dan teks

Konsol

Python

Instal

REST

Pembuatan gambar yang disesuaikan dengan lokalitas

Konsol

Python

Instal

REST

Membuat gambar dengan Gemini