IA de texto para imagem

Crie imagens com base em textos sem escrever uma linha sequer de código

Gere imagens com base em descrições de texto em segundos usando a geração de imagens com tecnologia de IA do Google Cloud e APIs disponíveis nas linguagens de programação Python, Java e Go. 

Novos clientes ganham até US $300 em créditos para gerar imagens e muito mais usando o Imagen na Vertex AI. 

Visão geral

O que é a IA de texto para imagem?

A IA de texto para imagem é um tipo de inteligência artificial capaz de gerar imagens a partir de descrições de texto. Essa tecnologia tem o potencial de mudar a forma como criamos e interagimos com os conteúdos visuais. As ferramentas e os recursos de conversão de texto em IA do Google Cloud, incluindo modelos de IA pré-treinados, como Imagen, Parti e Muse, disponíveis na Vertex AI, foram projetados para ajudar os desenvolvedores a implementar facilmente a geração de texto para imagem nos seus aplicativos. E, com o AutoML, é possível personalizar modelos de IA para aplicativos específicos de domínio.

Como a conversão de texto em imagem é usada no desenvolvimento de aplicativos?

A IA de texto para imagem pode ser usada no desenvolvimento de aplicativos para gerar maquetes, protótipos, ilustrações, dados de teste, conteúdo educacional e visualizações para depuração. A Vertex AI e a API Cloud Vision do Google Cloud oferecem aos desenvolvedores acesso a um pacote de recursos de processamento de imagens, incluindo detecção de texto, detecção de objetos e classificação de imagens.A Document AI pode ser usada para extrair texto de documentos digitalizados e gerar imagens descritivas de texto.

Quais modelos são usados para a geração de texto para imagem?

Imagen, Parti e Muse são modelos importantes de conversão de texto em imagem. O Imagen é um modelo de difusão com um alto grau de fotorrealismo. O modelo Autoregressivo de texto para imagem (Parti, na sigla em inglês) oferece suporte a síntese rica em conteúdo envolvendo composições complexas e conhecimento mundial. O Muse é um modelo de transformador para forte desempenho de geração de imagens. E o Gemini amplia o que é possível com um modelo capaz de entender praticamente todas as entradas e gerar quase todas as saídas, incluindo texto, imagens, áudio, vídeo e código.

Qual a diferença entre esses modelos?

O Imagen, um modelo de difusão, é ótimo para fotorrealismo com um nível profundo de compreensão da linguagem. Parti, um modelo autoregressivo, é ótimo para estilo e tema consistentes e para gerar imagens em um estilo específico. O Muse, um modelo de transformador, pode gerar imagens com vários objetos e composição complexa. Cada um tem pontos fortes únicos: o Imagen se destaca em fotorrealismo, Parti em conteúdo avançado e Muse em ferramentas de velocidade e edição. Todas são fáceis de usar e não exigem conhecimento de programação.

O que é o Imagen 3?

O Imagen 3 é o modelo mais recente de geração de imagens do Google. Ele oferece uma qualidade de imagem excepcional, além de diversas melhorias em relação ao Imagen 2, incluindo geração 40% mais rápida para prototipagem e iteração rápidas, melhor compreensão e acompanhamento de instruções, gerações fotorrealistas (como grupos de pessoas) e maior controle sobre a renderização de texto em uma imagem.

Disponibilizado em pré-lançamento para clientes da Vertex AI com acesso antecipado, o Imagen 3 também inclui suporte a vários idiomas, recursos de segurança integrados, como marca-d'água digital SynthID do Google DeepMind, e suporte a várias proporções.

Como posso usar esses modelos do Google?

É possível acessar esses modelos de IA de texto para imagem usando a Vertex AI no Google Cloud ou usando um provedor de API de terceiros.Para usar os modelos, basta fornecer um comando de texto, selecionar parâmetros (alguns modelos permitem selecionar parâmetros que controlam o estilo, a criatividade e a precisão da imagem gerada) e, por fim, gerar a imagem. 

Como funciona

A IA de texto em imagem usa o processamento de linguagem natural (PLN) para converter a descrição do texto em um formato legível por máquina. Depois de convertido para um formato legível por máquina, o modelo de machine learning é treinado com um enorme conjunto de dados de texto e imagens, aprende a identificar padrões e os usa para gerar novas imagens. A IA de texto em imagem do Google Cloud usa um modelo de aprendizado profundo chamado Imagen, um modelo de última geração que pode gerar imagens fotorrealistas a partir de descrições em texto.

Interface de produto de IA generativa
Gerar e editar imagens com o Vertex AI Studio

Usos comuns

Gere imagens usando a IA

Gerar imagens usando solicitações de texto

Saiba como usar o recurso de geração de texto para imagem do Imagen na Vertex AI e exportar uma versão aprimorada de uma imagem gerada. Neste guia de início rápido, mostramos como usar a geração de imagens do Imagen no console do Google Cloud.

Comece agora
Imagem gerada de um cachorro lendo um jornal no produto Vertex AI

Gerar imagens usando solicitações de texto

Saiba como usar o recurso de geração de texto para imagem do Imagen na Vertex AI e exportar uma versão aprimorada de uma imagem gerada. Neste guia de início rápido, mostramos como usar a geração de imagens do Imagen no console do Google Cloud.

Comece agora
Imagem gerada de um cachorro lendo um jornal no produto Vertex AI

Editar imagens com IA

Editar imagens usando solicitações de texto

Use o Imagen para editar imagens geradas ou existentes. É possível usar um prompt de texto para atualizar a imagem inteira (edição sem máscara) ou especificar parte da imagem a ser modificada, além da descrição em texto das atualizações (edição da máscara de base).

Começar a editar imagens com comandos de texto
Edição de imagens na Vertex AI

Editar imagens usando solicitações de texto

Use o Imagen para editar imagens geradas ou existentes. É possível usar um prompt de texto para atualizar a imagem inteira (edição sem máscara) ou especificar parte da imagem a ser modificada, além da descrição em texto das atualizações (edição da máscara de base).

Começar a editar imagens com comandos de texto
Edição de imagens na Vertex AI

Legendas visuais com IA

Veja descrições de imagens usando legendas visuais

Gere descrições relevantes para imagens, incluindo metadados detalhados, legendagem automática e descrições rápidas de produtos e recursos visuais.

Comece a gerar legendas para suas imagens
Interface do produto de legenda de imagem

Veja descrições de imagens usando legendas visuais

Gere descrições relevantes para imagens, incluindo metadados detalhados, legendagem automática e descrições rápidas de produtos e recursos visuais.

Comece a gerar legendas para suas imagens
Interface do produto de legenda de imagem

Comece sua prova de conceito

Clientes novos ganham até US $300 em créditos para gerar imagens e muito mais na Vertex AI

Saiba que tipos de imagens você pode criar

Saiba como gerar imagens usando comandos de texto

Saiba como gerar e verificar marcas-d'água de imagem

Google Cloud
  • ‪English‬
  • ‪Deutsch‬
  • ‪Español‬
  • ‪Español (Latinoamérica)‬
  • ‪Français‬
  • ‪Indonesia‬
  • ‪Italiano‬
  • ‪Português (Brasil)‬
  • ‪简体中文‬
  • ‪繁體中文‬
  • ‪日本語‬
  • ‪한국어‬
Console
Google Cloud