Gere imagens com base em descrições de texto em segundos usando a geração de imagens com tecnologia de IA do Google Cloud e APIs disponíveis nas linguagens de programação Python, Java e Go.
Novos clientes ganham até US $300 em créditos para gerar imagens e muito mais usando o Imagen na Vertex AI.
Visão geral
A IA de texto para imagem é um tipo de inteligência artificial capaz de gerar imagens a partir de descrições de texto. Essa tecnologia tem o potencial de mudar a forma como criamos e interagimos com os conteúdos visuais. As ferramentas e os recursos de conversão de texto em IA do Google Cloud, incluindo modelos de IA pré-treinados, como Imagen, Parti e Muse, disponíveis na Vertex AI, foram projetados para ajudar os desenvolvedores a implementar facilmente a geração de texto para imagem nos seus aplicativos. E, com o AutoML, é possível personalizar modelos de IA para aplicativos específicos de domínio.
A IA de texto para imagem pode ser usada no desenvolvimento de aplicativos para gerar maquetes, protótipos, ilustrações, dados de teste, conteúdo educacional e visualizações para depuração. A Vertex AI e a API Cloud Vision do Google Cloud oferecem aos desenvolvedores acesso a um pacote de recursos de processamento de imagens, incluindo detecção de texto, detecção de objetos e classificação de imagens.A Document AI pode ser usada para extrair texto de documentos digitalizados e gerar imagens descritivas de texto.
Imagen, Parti e Muse são modelos importantes de conversão de texto em imagem. O Imagen é um modelo de difusão com um alto grau de fotorrealismo. O modelo Autoregressivo de texto para imagem (Parti, na sigla em inglês) oferece suporte a síntese rica em conteúdo envolvendo composições complexas e conhecimento mundial. O Muse é um modelo de transformador para forte desempenho de geração de imagens. E o Gemini amplia o que é possível com um modelo capaz de entender praticamente todas as entradas e gerar quase todas as saídas, incluindo texto, imagens, áudio, vídeo e código.
O Imagen, um modelo de difusão, é ótimo para fotorrealismo com um nível profundo de compreensão da linguagem. Parti, um modelo autoregressivo, é ótimo para estilo e tema consistentes e para gerar imagens em um estilo específico. O Muse, um modelo de transformador, pode gerar imagens com vários objetos e composição complexa. Cada um tem pontos fortes únicos: o Imagen se destaca em fotorrealismo, Parti em conteúdo avançado e Muse em ferramentas de velocidade e edição. Todas são fáceis de usar e não exigem conhecimento de programação.
O Imagen 3 é o modelo mais recente de geração de imagens do Google. Ele oferece uma qualidade de imagem excepcional, além de diversas melhorias em relação ao Imagen 2, incluindo geração 40% mais rápida para prototipagem e iteração rápidas, melhor compreensão e acompanhamento de instruções, gerações fotorrealistas (como grupos de pessoas) e maior controle sobre a renderização de texto em uma imagem.
Disponibilizado em pré-lançamento para clientes da Vertex AI com acesso antecipado, o Imagen 3 também inclui suporte a vários idiomas, recursos de segurança integrados, como marca-d'água digital SynthID do Google DeepMind, e suporte a várias proporções.
É possível acessar esses modelos de IA de texto para imagem usando a Vertex AI no Google Cloud ou usando um provedor de API de terceiros.Para usar os modelos, basta fornecer um comando de texto, selecionar parâmetros (alguns modelos permitem selecionar parâmetros que controlam o estilo, a criatividade e a precisão da imagem gerada) e, por fim, gerar a imagem.
Como funciona
A IA de texto em imagem usa o processamento de linguagem natural (PLN) para converter a descrição do texto em um formato legível por máquina. Depois de convertido para um formato legível por máquina, o modelo de machine learning é treinado com um enorme conjunto de dados de texto e imagens, aprende a identificar padrões e os usa para gerar novas imagens. A IA de texto em imagem do Google Cloud usa um modelo de aprendizado profundo chamado Imagen, um modelo de última geração que pode gerar imagens fotorrealistas a partir de descrições em texto.
Usos comuns
Saiba como usar o recurso de geração de texto para imagem do Imagen na Vertex AI e exportar uma versão aprimorada de uma imagem gerada. Neste guia de início rápido, mostramos como usar a geração de imagens do Imagen no console do Google Cloud.
Saiba como usar o recurso de geração de texto para imagem do Imagen na Vertex AI e exportar uma versão aprimorada de uma imagem gerada. Neste guia de início rápido, mostramos como usar a geração de imagens do Imagen no console do Google Cloud.
Use o Imagen para editar imagens geradas ou existentes. É possível usar um prompt de texto para atualizar a imagem inteira (edição sem máscara) ou especificar parte da imagem a ser modificada, além da descrição em texto das atualizações (edição da máscara de base).
Use o Imagen para editar imagens geradas ou existentes. É possível usar um prompt de texto para atualizar a imagem inteira (edição sem máscara) ou especificar parte da imagem a ser modificada, além da descrição em texto das atualizações (edição da máscara de base).