Buat dan edit gambar dari deskripsi teks dalam hitungan detik menggunakan model pembuatan gambar Gemini 2.5 Flash Image dan Imagen dengan API yang tersedia dalam bahasa pemrograman Python, Java, dan Go.
Pelanggan baru mendapatkan kredit gratis senilai hingga $300 untuk membuat gambar dan lainnya di Vertex AI.
Ringkasan
AI text-to-image adalah jenis kecerdasan buatan yang dapat menghasilkan dan mengedit gambar dari deskripsi teks. Teknologi ini memiliki potensi untuk mengubah cara kita berinteraksi dengan konten visual dan cara pembuatannya. Alat dan resource AI text-to-image Google Cloud, termasuk model AI terlatih seperti Imagen, Gemini 2.5 Flash Image, dan Veo, yang tersedia di Vertex AI, dirancang untuk membantu developer mengimplementasikan pembuatan text-to-image dengan mudah dalam aplikasi mereka.
AI text-to-image dapat digunakan dalam pengembangan aplikasi untuk membuat mockup, prototipe, ilustrasi, data pengujian, konten edukasi, dan visualisasi untuk proses debug. Vertex AI dan Cloud Vision API dari Google Cloud memungkinkan developer mengakses serangkaian kemampuan pemrosesan gambar, termasuk deteksi teks, deteksi objek, dan klasifikasi gambar. Document AI dapat digunakan untuk mengekstrak teks dari dokumen yang dipindai untuk membuat gambar yang disertai deskripsi teks.
Imagen dan Gemini 2.5 Flash Image adalah model text-to-image utama Google.
Imagen: Imagen adalah model gambar murni yang terspesialisasi. Model ini dibuat sebagai mesin diffusion, yang berarti fokus utamanya adalah menghasilkan gambar berkualitas tinggi, halus, dan fotorealistis dari perintah teks. Kekuatan model ini terletak pada "pencocokan pola teks dengan piksel" untuk menghasilkan output yang indah dan menarik secara visual.
Gemini 2.5 Flash Image: Ini adalah Model Bahasa Besar (LLM) multimodal bawaan. Tidak seperti model gambar khusus, model ini memperlakukan gambar sebagai bentuk "bahasa" lainnya. Artinya, model ini dilatih dari awal untuk memahami dan memproses teks dan gambar dalam satu langkah terpadu. Arsitektur inilah yang membuka kemampuan uniknya di luar sekadar pembuatan konten.
Anda dapat mengakses model AI text-to-image ini melalui Vertex AI di Google Cloud atau Google AI Studio. Untuk menggunakan model tersebut, cukup sediakan perintah teks, pilih parameter (beberapa model memungkinkan Anda memilih parameter yang mengontrol gaya, kreativitas, dan akurasi gambar yang dihasilkan), dan hasilkan gambar.
Cara Kerjanya
AI text-to-image menggunakan natural language processing (NLP) untuk mengonversi deskripsi teks ke format yang dapat dibaca mesin. Setelah dikonversi ke format yang dapat dibaca mesin, model machine learning dilatih menggunakan set data teks dan gambar dalam skala besar, belajar mengidentifikasi pola, dan menggunakannya untuk menghasilkan atau mengedit gambar. AI text-to-image dari Google Cloud menggunakan model deep learning yang disebut Imagen, yaitu model canggih yang dapat menghasilkan gambar fotorealistik dari deskripsi teks.
Penggunaan Umum
Pelajari cara menggunakan fitur pembuatan text-to-image dari Imagen di Vertex AI dan mengekspor versi gambar generatif yang ditingkatkan kualitasnya. Panduan memulai ini menunjukkan cara menggunakan pembuatan gambar Imagen di konsol Google Cloud.
Pelajari cara menggunakan fitur pembuatan text-to-image dari Imagen di Vertex AI dan mengekspor versi gambar generatif yang ditingkatkan kualitasnya. Panduan memulai ini menunjukkan cara menggunakan pembuatan gambar Imagen di konsol Google Cloud.
Dengan Gemini 2.5 Flash Image, Anda dapat menggabungkan berbagai gambar menjadi satu visual baru yang mulus. Gunakan beberapa gambar referensi untuk membuat satu gambar terpadu. Anda juga dapat mengedit gambar dengan petunjuk bahasa natural yang sederhana. Mulai dari menghapus seseorang dari foto grup hingga memperbaiki detail kecil seperti noda, Anda dapat melakukan perubahan melalui percakapan sederhana.
Selain itu, Imagen di Vertex AI memungkinkan Anda mengedit gambar yang dihasilkan Imagen atau gambar yang sudah ada. Anda dapat menentukan bagian gambar yang akan dimodifikasi beserta deskripsi teks dari gambar yang diperbarui (pengeditan berbasis mask).
Dengan Gemini 2.5 Flash Image, Anda dapat menggabungkan berbagai gambar menjadi satu visual baru yang mulus. Gunakan beberapa gambar referensi untuk membuat satu gambar terpadu. Anda juga dapat mengedit gambar dengan petunjuk bahasa natural yang sederhana. Mulai dari menghapus seseorang dari foto grup hingga memperbaiki detail kecil seperti noda, Anda dapat melakukan perubahan melalui percakapan sederhana.
Selain itu, Imagen di Vertex AI memungkinkan Anda mengedit gambar yang dihasilkan Imagen atau gambar yang sudah ada. Anda dapat menentukan bagian gambar yang akan dimodifikasi beserta deskripsi teks dari gambar yang diperbarui (pengeditan berbasis mask).
Buat deskripsi yang relevan untuk gambar, termasuk metadata mendetail, teks otomatis, serta deskripsi singkat produk dan aset visual.
Buat deskripsi yang relevan untuk gambar, termasuk metadata mendetail, teks otomatis, serta deskripsi singkat produk dan aset visual.
Watermark digital otomatis ditambahkan ke gambar yang dihasilkan oleh model AI tertentu di Vertex AI, seperti Imagen dan Gemini 2.5 Flash Image. Hal ini dilakukan menggunakan teknologi yang dibuat oleh Google Deepmind bernama SynthID, yang menyematkan watermark tidak terlihat langsung ke piksel gambar.
Untuk mendeteksi watermark digital dalam gambar di Vertex AI, Anda dapat menggunakan alat deteksi bawaan. Dengan Vertex AI Media Studio, Anda dapat mengupload gambar yang ingin diverifikasi. Jika watermark SynthID terdeteksi, gambar akan menampilkan badge "SynthID detected".
Watermark digital otomatis ditambahkan ke gambar yang dihasilkan oleh model AI tertentu di Vertex AI, seperti Imagen dan Gemini 2.5 Flash Image. Hal ini dilakukan menggunakan teknologi yang dibuat oleh Google Deepmind bernama SynthID, yang menyematkan watermark tidak terlihat langsung ke piksel gambar.
Untuk mendeteksi watermark digital dalam gambar di Vertex AI, Anda dapat menggunakan alat deteksi bawaan. Dengan Vertex AI Media Studio, Anda dapat mengupload gambar yang ingin diverifikasi. Jika watermark SynthID terdeteksi, gambar akan menampilkan badge "SynthID detected".