Les réseaux antagonistes génératifs (GAN) correspondent à un type d'architecture de deep learning qui utilise deux réseaux de neurones en concurrence pour générer de nouvelles données. Ces deux réseaux, le générateur et le discriminateur, s'entraînent l'un contre l'autre, ce qui permet de produire un résultat plus précis. Les GAN peuvent être utiles dans différents domaines, y compris la vision par ordinateur, la robotique, la génération d'images, la synthèse vidéo et le traitement du langage naturel.
La meilleure façon de comprendre le fonctionnement des GAN est de les comparer à une compétition entre un faussaire (le générateur) et un critique d'art (le discriminateur).
Ce "jeu" d'opposition se poursuit, les deux réseaux devenant progressivement plus intelligents. Finalement, le faussaire devient si habile que le critique ne peut plus distinguer les contrefaçons des œuvres originales. À ce stade, le GAN est entraîné et peut générer de nouvelles données extrêmement réalistes.
Les réseaux de neurones convolutifs (CNN) et les réseaux antagonistes génératifs (GAN) sont tous deux des architectures de deep learning, mais ils ont des atouts et des applications distincts. Les CNN sont souvent utilisés pour les tâches de classification d'images et de détection d'objets, tandis que les GAN sont généralement conçus pour générer de nouvelles instances de données.
Fonctionnalité | Des CNN | GAN |
Consommation des données | Ensembles de données majoritairement étiquetés | Ensembles de données étiquetés ou non étiquetés |
Sortie | Classification, extraction de caractéristiques | Instances de données nouvelles et variées |
Type de modèle | Souvent, l'entraînement des | Générative |
Tâches principales | Classification d'images, reconnaissance d'objets | Génération d'images, augmentation des données, création de données synthétiques |
Fonctionnalité
Des CNN
GAN
Consommation des données
Ensembles de données majoritairement étiquetés
Ensembles de données étiquetés ou non étiquetés
Sortie
Classification, extraction de caractéristiques
Instances de données nouvelles et variées
Type de modèle
Souvent, l'entraînement des
Générative
Tâches principales
Classification d'images, reconnaissance d'objets
Génération d'images, augmentation des données, création de données synthétiques
Bien que tous les GAN partagent la même structure générateur-discriminateur, différentes variantes ont été développées pour résoudre des problèmes spécifiques. Voici quelques-uns des types les plus importants :
Si le concept fondamental d'utilisation de deux réseaux antagonistes reste identique dans les différentes variantes des réseaux antagonistes génératifs, les chercheurs ont exploré de nombreuses modifications dans l'architecture et l'entraînement pour surmonter certaines limites et améliorer les performances selon les applications.
Les GAN ont ouvert de nouvelles possibilités dans de nombreux secteurs. Leurs applications se répartissent généralement dans les domaines clés suivants :
Il s'agit de l'application la plus connue des GAN. Elle permet de générer des images réalistes de personnes, de lieux et d'objets, de créer de l'art numérique et de la musique, et d'utiliser des outils de retouche photo puissants comme le transfert de style (pour donner à une photo l'apparence d'une peinture), la super-résolution (pour rendre les images floues plus nettes) et la synthèse de texte en images.
Les données de haute qualité alimentent le machine learning, mais elles peuvent être rares, coûteuses ou privées. Les GAN permettent de résoudre ce problème en générant des données synthétiques. Dans le secteur de la santé, les GAN peuvent créer des radioscopies réalistes, mais anonymes, pour entraîner des modèles de diagnostic sans porter atteinte à la confidentialité des patients. Dans le secteur de la finance, ils peuvent générer des données de transaction synthétiques pour améliorer l'entraînement des systèmes de détection des fraudes. Cela permet de passer outre la pénurie de données et d'équilibrer les ensembles de données.
Les GAN peuvent apprendre les schémas dans des systèmes complexes pour créer des simulations réalistes. Ils permettent de générer différents scénarios pour l'entraînement des voitures autonomes, de prédire les images suivantes dans une vidéo ou même de découvrir des structures moléculaires potentielles dans le cadre de la découverte de médicaments.
Un GAN entraîné sur des données standards devient très performant pour repérer tout ce qui ne correspond pas au modèle. Il permet de détecter les activités financières frauduleuses, d'identifier les intrusions réseau dans le domaine de la cybersécurité et de repérer des défauts de fabrication.
Le développement et le déploiement de GAN nécessitent une puissance de calcul importante et une plate-forme MLOps robuste. Google Cloud propose des outils pour prendre en charge l'intégralité du workflow :
Profitez de 300 $ de crédits gratuits et de plus de 20 produits Always Free pour commencer à créer des applications sur Google Cloud.