AI teks ke gambar

Membuat dan mengedit gambar dari teks tanpa menulis kode apa pun

Buat dan edit gambar dari deskripsi teks dalam hitungan detik menggunakan model pembuatan gambar Gemini 2.5 Flash Image dan Imagen dengan API yang tersedia dalam bahasa pemrograman Python, Java, dan Go. 

Pelanggan baru mendapatkan kredit gratis senilai hingga $300 untuk membuat gambar dan lainnya di Vertex AI.

Ringkasan

Apa itu AI teks ke gambar?

AI text-to-image adalah jenis kecerdasan buatan yang dapat menghasilkan dan mengedit gambar dari deskripsi teks. Teknologi ini memiliki potensi untuk mengubah cara kita berinteraksi dengan konten visual dan cara pembuatannya. Alat dan resource AI text-to-image Google Cloud, termasuk model AI terlatih seperti Imagen, Gemini 2.5 Flash Image, dan Veo, yang tersedia di Vertex AI, dirancang untuk membantu developer mengimplementasikan pembuatan text-to-image dengan mudah dalam aplikasi mereka.

Bagaimana teks-ke-gambar digunakan dalam pengembangan aplikasi?

AI text-to-image dapat digunakan dalam pengembangan aplikasi untuk membuat mockup, prototipe, ilustrasi, data pengujian, konten edukasi, dan visualisasi untuk proses debug. Vertex AI dan Cloud Vision API dari Google Cloud memungkinkan developer mengakses serangkaian kemampuan pemrosesan gambar, termasuk deteksi teks, deteksi objek, dan klasifikasi gambar. Document AI dapat digunakan untuk mengekstrak teks dari dokumen yang dipindai untuk membuat gambar yang disertai deskripsi teks.

Model apa yang digunakan untuk pembuatan teks-ke-gambar?

Imagen dan Gemini 2.5 Flash Image adalah model text-to-image utama Google.

Bagaimana model-model ini berbeda antara satu sama lain?

Imagen: Imagen adalah model gambar murni yang terspesialisasi. Model ini dibuat sebagai mesin diffusion, yang berarti fokus utamanya adalah menghasilkan gambar berkualitas tinggi, halus, dan fotorealistis dari perintah teks. Kekuatan model ini terletak pada "pencocokan pola teks dengan piksel" untuk menghasilkan output yang indah dan menarik secara visual.

Gemini 2.5 Flash Image: Ini adalah Model Bahasa Besar (LLM) multimodal bawaan. Tidak seperti model gambar khusus, model ini memperlakukan gambar sebagai bentuk "bahasa" lainnya. Artinya, model ini dilatih dari awal untuk memahami dan memproses teks dan gambar dalam satu langkah terpadu. Arsitektur inilah yang membuka kemampuan uniknya di luar sekadar pembuatan konten.

Bagaimana cara menggunakan model Google ini?

Anda dapat mengakses model AI text-to-image ini melalui Vertex AI di Google Cloud atau Google AI Studio. Untuk menggunakan model tersebut, cukup sediakan perintah teks, pilih parameter (beberapa model memungkinkan Anda memilih parameter yang mengontrol gaya, kreativitas, dan akurasi gambar yang dihasilkan), dan hasilkan gambar. 

Cara Kerjanya

AI text-to-image menggunakan natural language processing (NLP) untuk mengonversi deskripsi teks ke format yang dapat dibaca mesin. Setelah dikonversi ke format yang dapat dibaca mesin, model machine learning dilatih menggunakan set data teks dan gambar dalam skala besar, belajar mengidentifikasi pola, dan menggunakannya untuk menghasilkan atau mengedit gambar. AI text-to-image dari Google Cloud menggunakan model deep learning yang disebut Imagen, yaitu model canggih yang dapat menghasilkan gambar fotorealistik dari deskripsi teks.

UI produk AI Generatif
Membuat dan mengedit gambar dengan Vertex AI Studio

Penggunaan Umum

Membuat gambar menggunakan AI

Membuat gambar menggunakan perintah teks

Pelajari cara menggunakan fitur pembuatan text-to-image dari Imagen di Vertex AI dan mengekspor versi gambar generatif yang ditingkatkan kualitasnya. Panduan memulai ini menunjukkan cara menggunakan pembuatan gambar Imagen di konsol Google Cloud.

gambar yang dibuat dengan imagen

Membuat gambar menggunakan perintah teks

Pelajari cara menggunakan fitur pembuatan text-to-image dari Imagen di Vertex AI dan mengekspor versi gambar generatif yang ditingkatkan kualitasnya. Panduan memulai ini menunjukkan cara menggunakan pembuatan gambar Imagen di konsol Google Cloud.

gambar yang dibuat dengan imagen

Mengedit gambar dengan AI

Penggabungan multi-gambar dan pengeditan via percakapan

Dengan Gemini 2.5 Flash Image, Anda dapat menggabungkan berbagai gambar menjadi satu visual baru yang mulus. Gunakan beberapa gambar referensi untuk membuat satu gambar terpadu. Anda juga dapat mengedit gambar dengan petunjuk bahasa natural yang sederhana. Mulai dari menghapus seseorang dari foto grup hingga memperbaiki detail kecil seperti noda, Anda dapat melakukan perubahan melalui percakapan sederhana.

Selain itu, Imagen di Vertex AI memungkinkan Anda mengedit gambar yang dihasilkan Imagen atau gambar yang sudah ada. Anda dapat menentukan bagian gambar yang akan dimodifikasi beserta deskripsi teks dari gambar yang diperbarui (pengeditan berbasis mask).

Pengeditan gambar di Vertex AI

Penggabungan multi-gambar dan pengeditan via percakapan

Dengan Gemini 2.5 Flash Image, Anda dapat menggabungkan berbagai gambar menjadi satu visual baru yang mulus. Gunakan beberapa gambar referensi untuk membuat satu gambar terpadu. Anda juga dapat mengedit gambar dengan petunjuk bahasa natural yang sederhana. Mulai dari menghapus seseorang dari foto grup hingga memperbaiki detail kecil seperti noda, Anda dapat melakukan perubahan melalui percakapan sederhana.

Selain itu, Imagen di Vertex AI memungkinkan Anda mengedit gambar yang dihasilkan Imagen atau gambar yang sudah ada. Anda dapat menentukan bagian gambar yang akan dimodifikasi beserta deskripsi teks dari gambar yang diperbarui (pengeditan berbasis mask).

Pengeditan gambar di Vertex AI

Teks visual dengan AI

Mendapatkan deskripsi gambar menggunakan teks visual

Buat deskripsi yang relevan untuk gambar, termasuk metadata mendetail, teks otomatis, serta deskripsi singkat produk dan aset visual.

UI produk teks gambar

Mendapatkan deskripsi gambar menggunakan teks visual

Buat deskripsi yang relevan untuk gambar, termasuk metadata mendetail, teks otomatis, serta deskripsi singkat produk dan aset visual.

UI produk teks gambar

Watermark digital

Membuat dan memverifikasi watermark gambar

Watermark digital otomatis ditambahkan ke gambar yang dihasilkan oleh model AI tertentu di Vertex AI, seperti Imagen dan Gemini 2.5 Flash Image. Hal ini dilakukan menggunakan teknologi yang dibuat oleh Google Deepmind bernama SynthID, yang menyematkan watermark tidak terlihat langsung ke piksel gambar.

Untuk mendeteksi watermark digital dalam gambar di Vertex AI, Anda dapat menggunakan alat deteksi bawaan. Dengan Vertex AI Media Studio, Anda dapat mengupload gambar yang ingin diverifikasi. Jika watermark SynthID terdeteksi, gambar akan menampilkan badge "SynthID detected".

verifikasi gambar watermark

    Membuat dan memverifikasi watermark gambar

    Watermark digital otomatis ditambahkan ke gambar yang dihasilkan oleh model AI tertentu di Vertex AI, seperti Imagen dan Gemini 2.5 Flash Image. Hal ini dilakukan menggunakan teknologi yang dibuat oleh Google Deepmind bernama SynthID, yang menyematkan watermark tidak terlihat langsung ke piksel gambar.

    Untuk mendeteksi watermark digital dalam gambar di Vertex AI, Anda dapat menggunakan alat deteksi bawaan. Dengan Vertex AI Media Studio, Anda dapat mengupload gambar yang ingin diverifikasi. Jika watermark SynthID terdeteksi, gambar akan menampilkan badge "SynthID detected".

    verifikasi gambar watermark

      Memulai bukti konsep Anda

      Pelanggan baru mendapatkan kredit gratis senilai hingga $300 untuk membuat gambar dan lainnya di Vertex AI

      Punya proyek besar?

      Pelajari jenis gambar apa yang dapat Anda buat

      Pelajari cara membuat gambar menggunakan perintah teks

      Pelajari cara membuat dan memverifikasi watermark gambar