As redes adversárias generativas (GANs) são um tipo de arquitetura de aprendizado profundo que usa duas redes neurais concorrentes para gerar novos dados. Essas duas redes, o gerador e o discriminador, são treinadas uma contra a outra, o que ajuda a produzir uma saída mais precisa. As GANs podem ser úteis em várias áreas, incluindo visão computacional, robótica, geração de imagens, síntese de vídeo e processamento de linguagem natural.
A melhor maneira de entender como as GANs funcionam é por meio de uma analogia: uma competição entre um falsificador de arte (o gerador) e um crítico de arte (o discriminador).
Esse "jogo" de adversários continua, e as duas redes ficam cada vez mais inteligentes. Com o tempo, o falsificador fica tão habilidoso que o crítico não consegue mais distinguir a diferença. Nesse ponto, a GAN é treinada e pode gerar novos dados altamente realistas.
As redes neurais convolucionais (CNNs) e as redes adversárias generativas (GANs) são arquiteturas de aprendizado profundo, mas têm pontos fortes e aplicações distintos. As CNNs são frequentemente usadas para tarefas de classificação de imagens e detecção de objetos, enquanto as GANs costumam ser projetadas para gerar novas instâncias de dados.
Recurso | CNNs; | GANs |
Uso de dados | Conjuntos de dados rotulados em sua maioria | Conjuntos de dados rotulados ou não rotulados |
Saída | Classificação, extração de atributos | Novas instâncias de dados diversas |
Tipo de modelo | Modelos discriminativos | Generativa |
Tarefas principais | Classificação de imagens, reconhecimento de objetos | Geração de imagens, aumento de dados, criação de dados sintéticos |
Recurso
CNNs;
GANs
Uso de dados
Conjuntos de dados rotulados em sua maioria
Conjuntos de dados rotulados ou não rotulados
Saída
Classificação, extração de atributos
Novas instâncias de dados diversas
Tipo de modelo
Modelos discriminativos
Generativa
Tarefas principais
Classificação de imagens, reconhecimento de objetos
Geração de imagens, aumento de dados, criação de dados sintéticos
Embora todas as GANs compartilhem a estrutura gerador-discriminador, diferentes variações foram desenvolvidas para resolver problemas específicos. Estes são alguns dos tipos mais importantes:
Embora o conceito fundamental de usar duas redes adversárias permaneça consistente em todas as variações de GAN, os pesquisadores exploraram uma variedade de modificações arquitetônicas e de treinamento para lidar com limitações e melhorar o desempenho de aplicativos específicos.
As GANs abriram novas possibilidades em vários setores. As aplicações geralmente se enquadram nestas áreas principais:
Essa é a aplicação mais famosa das GANs. Ela inclui a geração de imagens realistas de pessoas, lugares e objetos, a criação de arte e música digitais e a ativação de ferramentas avançadas de edição de imagens, como transferência de estilo (fazer uma foto parecer uma pintura), super-resolução (melhorar a nitidez de imagens borradas) e síntese de texto para imagem.
Dados de alta qualidade são o combustível do machine learning, mas podem ser raros, caros ou privados. As GANs ajudam a resolver esse problema gerando dados sintéticos. Na área da saúde, as GANs podem criar exames médicos realistas, mas anônimos, para treinar modelos de diagnóstico sem violar a privacidade dos pacientes. No setor financeiro, elas podem gerar dados sintéticos de transações para treinar sistemas melhores de detecção de fraudes. Isso ajuda a superar a escassez de dados e a equilibrar os conjuntos de dados.
As GANs podem aprender os padrões em sistemas complexos para criar simulações realistas. Isso é usado para gerar diversos cenários para treinar carros autônomos, prever os próximos frames em um vídeo ou até mesmo descobrir possíveis estruturas moleculares na descoberta de medicamentos.
Ao treinar uma GAN com dados "normais", ela fica muito boa em detectar qualquer coisa que não se encaixe no padrão. Ela é usada para detectar atividades financeiras fraudulentas, identificar intrusões de rede em segurança cibernética e encontrar defeitos na fabricação.
O desenvolvimento e a implantação de GANs exigem uma capacidade computacional significativa e uma plataforma de MLOps robusta. O Google Cloud oferece as ferramentas para oferecer suporte a todo o fluxo de trabalho:
Comece a criar no Google Cloud com US$ 300 em créditos e mais de 20 produtos do programa Sempre gratuito.