Jaringan saraf generatif berlawanan (GAN) adalah jenis arsitektur deep learning yang menggunakan dua jaringan neural yang bersaing untuk menghasilkan data baru. Kedua jaringan ini, generator dan diskriminator, saling melatih satu sama lain, sehingga membantu menghasilkan output yang lebih akurat. GAN dapat berguna di berbagai bidang, termasuk computer vision, robotika, pembuatan gambar, sintesis video, dan natural language processing.
Cara terbaik untuk memahami cara kerja GAN adalah melalui analogi: kompetisi antara pemalsu seni (generator) dan kritikus seni (diskriminator).
"Permainan" berlawanan ini terus berlanjut, dengan kedua jaringan menjadi semakin cerdas. Pada akhirnya, pemalsu menjadi sangat terampil sehingga kritikus tidak lagi dapat membedakannya dengan andal. Pada tahap ini, GAN telah dilatih dan dapat menghasilkan data baru yang sangat realistis.
Jaringan neural konvolusional (CNN) dan jaringan saraf generatif berlawanan (GAN) adalah arsitektur deep learning, tetapi keduanya memiliki keunggulan dan aplikasi yang berbeda. CNN sering digunakan untuk tugas klasifikasi gambar dan deteksi objek, sedangkan GAN umumnya dirancang untuk menghasilkan instance data baru.
Fitur | CNN | GAN |
Penggunaan data | Set data yang sebagian besar berlabel | Set data berlabel atau tidak berlabel |
Output | Klasifikasi, ekstraksi fitur | Instance data baru yang beragam |
Jenis model | Model | Peringkas |
Tugas utama | Klasifikasi gambar, pengenalan objek | Pembuatan gambar, pengayaan data, pembuatan data sintetis |
Fitur
CNN
GAN
Penggunaan data
Set data yang sebagian besar berlabel
Set data berlabel atau tidak berlabel
Output
Klasifikasi, ekstraksi fitur
Instance data baru yang beragam
Jenis model
Model
Peringkas
Tugas utama
Klasifikasi gambar, pengenalan objek
Pembuatan gambar, pengayaan data, pembuatan data sintetis
Meskipun semua GAN memiliki struktur generator-diskriminator yang sama, berbagai variasi telah dikembangkan untuk memecahkan masalah tertentu. Berikut beberapa jenis yang paling penting:
Meskipun konsep dasar penggunaan dua jaringan berlawanan tetap konsisten di seluruh variasi jaringan saraf generatif berlawanan, para peneliti telah mengeksplorasi berbagai modifikasi arsitektur dan pelatihan untuk mengatasi keterbatasan dan meningkatkan performa untuk aplikasi tertentu.
GAN telah membuka berbagai kemungkinan baru di banyak industri. Penerapannya umumnya termasuk dalam area utama berikut:
Ini adalah penerapan GAN yang paling terkenal. Fitur ini mencakup pembuatan gambar realistis tentang orang, tempat, dan objek; pembuatan seni digital dan musik; serta pengaktifan alat pengeditan gambar yang canggih seperti transfer gaya (membuat foto terlihat seperti lukisan), resolusi super (mempertajam gambar buram), dan sintesis text-to-image.
Data berkualitas tinggi adalah bahan bakar machine learning, tetapi data tersebut bisa langka, mahal, atau bersifat pribadi. GAN membantu menyelesaikan masalah ini dengan membuat data sintetis. Dalam layanan kesehatan, GAN dapat membuat pemindaian medis yang realistis tetapi anonim untuk melatih model diagnostik tanpa melanggar privasi pasien. Di bidang keuangan, LLM dapat menghasilkan data transaksi sintetis untuk melatih sistem deteksi penipuan yang lebih baik. Hal ini membantu mengatasi kelangkaan data dan menyeimbangkan set data.
GAN dapat mempelajari pola dalam sistem yang kompleks untuk membuat simulasi yang realistis. Hal ini digunakan untuk menghasilkan beragam skenario untuk melatih mobil otonom, memprediksi frame berikutnya dalam video, atau bahkan menemukan struktur molekuler potensial dalam penemuan obat.
Dengan melatih GAN pada data "normal", GAN menjadi sangat baik dalam menemukan apa pun yang tidak sesuai dengan pola. Teknik ini digunakan untuk mendeteksi aktivitas keuangan yang menipu, mengidentifikasi penyusupan jaringan dalam pengamanan cyber, dan menemukan cacat dalam manufaktur.
Pengembangan dan deployment GAN memerlukan daya komputasi yang signifikan dan platform MLOps yang tangguh. Google Cloud menawarkan alat untuk mendukung seluruh alur kerja:
Mulailah membangun solusi di Google Cloud dengan kredit gratis senilai $300 dan lebih dari 20 produk yang selalu gratis.