Membuat gambar dari deskripsi teks dalam hitungan detik menggunakan pembuatan gambar yang didukung AI Google Cloud dengan API yang tersedia dalam bahasa pemrograman Python, Java, dan Go.
Pelanggan baru mendapatkan kredit gratis senilai hingga $300 untuk membuat gambar dan lainnya menggunakan Imagen di Vertex AI.
Ringkasan
AI text-to-image adalah jenis kecerdasan buatan yang dapat menghasilkan gambar dari deskripsi teks. Teknologi ini memiliki potensi untuk mengubah cara kita berinteraksi dengan konten visual dan cara pembuatannya. Alat dan resource AI text-to-image Google Cloud mecakup model AI terlatih, seperti Imagen, Parti, dan Muse, yang tersedia di Vertex AI. Model ini dirancang untuk membantu developer mengimplementasikan pembuatan text-to-image dengan mudah dalam aplikasi mereka. Selain itu, dengan AutoML, Anda dapat menyesuaikan model AI untuk aplikasi khusus domain.
AI text-to-image dapat digunakan dalam pengembangan aplikasi untuk membuat mockup, prototipe, ilustrasi, data pengujian, konten edukasi, dan visualisasi untuk proses debug. Vertex AI dan Cloud Vision API dari Google Cloud memberi developer akses ke serangkaian kemampuan pemrosesan gambar, termasuk deteksi teks, deteksi objek, dan klasifikasi gambar. Document AI dapat digunakan untuk mengekstrak teks dari dokumen yang dipindai untuk membuat gambar yang disertai deskripsi teks.
Imagen, Parti, dan Muse adalah model text-to-image utama. Imagen adalah model diffusion dengan tingkat fotorealisme yang tinggi. Model Pathways Autoregressive Text-to-Image (Parti) dapat menghasilkan sintesis gambar yang memiliki konten lengkap berkat kemampuannya menangani komposisi kompleks dan pemahamannya tentang dunia nyata. Muse adalah model Transformer yang memiliki performa pembuatan gambar yang berkualitas. Selain itu, Gemini memperluas berbagai kemungkinan dari model yang ada karena kemampuannya untuk memahami berbagai jenis input dan menghasilkan berbagai jenis output, termasuk teks, gambar, audio, video, dan kode.
Imagen adalah model difusi yang unggul dalam hal fotorealisme dan memiliki pemahaman bahasa yang mendalam. Parti adalah model autoregresif yang bagus untuk memperoleh konsistensi gaya dan tema serta menghasilkan gambar dengan gaya tertentu. Muse adalah model Transformer yang dapat menghasilkan gambar dengan beberapa objek dan komposisi yang kompleks. Masing-masing menawarkan keunggulan yang unik. Imagen unggul dalam hal fotorealisme dan Parti sangat bagus karena konten lengkapnya, sedangkan Muse unggul soal kecepatan dan alat pengeditan. Ketiganya mudah digunakan dan tidak memerlukan pengetahuan pemrograman.
Imagen 3 adalah model pembuatan gambar terbaru dari Google. Model ini memberikan kualitas gambar yang luar biasa dengan beberapa peningkatan dibandingkan Imagen 2 — termasuk generasi lebih cepat 40% untuk pembuatan prototipe dan iterasi yang cepat; pemahaman prompt yang lebih baik dan mengikuti petunjuk; generasi foto realistis, termasuk kelompok orang; serta kontrol yang lebih besar atas rendering teks dalam gambar.
Diluncurkan dalam versi pratinjau untuk pelanggan Vertex AI dengan akses awal, Imagen 3 juga menyertakan dukungan multibahasa, fitur keamanan bawaan seperti watermark digital SynthID dari Google DeepMind, serta dukungan untuk berbagai rasio aspek.
Anda dapat mengakses model AI text-to-image ini melalui Vertex AI di Google Cloud atau melalui penyedia API pihak ketiga. Untuk menggunakan model tersebut, cukup sediakan perintah teks, pilih parameter (beberapa model memungkinkan Anda memilih parameter yang mengontrol gaya, kreativitas, dan akurasi gambar yang dihasilkan), dan hasilkan gambar.
Cara Kerjanya
AI text-to-image menggunakan natural language processing (NLP) untuk mengonversi deskripsi teks ke format yang dapat dibaca mesin. Setelah dikonversi ke format yang dapat dibaca mesin, model machine learning dilatih menggunakan set data teks dan gambar dalam skala besar, belajar mengidentifikasi pola, dan menggunakannya untuk menghasilkan gambar baru. AI text-to-image dari Google Cloud menggunakan model deep learning yang disebut Imagen, yaitu model canggih yang dapat menghasilkan gambar fotorealistik dari deskripsi teks.
Penggunaan Umum
Pelajari cara menggunakan fitur pembuatan text-to-image dari Imagen di Vertex AI dan mengekspor versi gambar generatif yang ditingkatkan kualitasnya. Panduan memulai ini menunjukkan cara menggunakan pembuatan gambar Imagen di konsol Google Cloud.
Pelajari cara menggunakan fitur pembuatan text-to-image dari Imagen di Vertex AI dan mengekspor versi gambar generatif yang ditingkatkan kualitasnya. Panduan memulai ini menunjukkan cara menggunakan pembuatan gambar Imagen di konsol Google Cloud.
Gunakan Imagen untuk mengedit gambar yang dibuat atau yang sudah ada. Anda dapat menggunakan perintah teks untuk memperbarui seluruh gambar (pengeditan tanpa mask), atau menentukan bagian gambar yang akan dimodifikasi beserta deskripsi teks dari gambar yang diperbarui (pengeditan berbasis mask).
Gunakan Imagen untuk mengedit gambar yang dibuat atau yang sudah ada. Anda dapat menggunakan perintah teks untuk memperbarui seluruh gambar (pengeditan tanpa mask), atau menentukan bagian gambar yang akan dimodifikasi beserta deskripsi teks dari gambar yang diperbarui (pengeditan berbasis mask).