Guia de atributos de comandos e imagens

Para usar o Imagen no Vertex AI, tem de fornecer uma descrição de texto do que quer gerar ou editar. Estas descrições chamam-se comandos e são a principal forma de comunicar com a IA generativa no Vertex AI.

Este guia mostra como a modificação de partes de um comando de texto para imagem pode produzir resultados diferentes e dá-lhe exemplos de imagens que pode criar. Este guia também fornece orientações sobre como pode editar imagens através de comandos de texto e iteração.

Para ver as normas de utilização e as restrições de conteúdo associadas ao Imagen no Vertex AI, consulte as diretrizes de utilização.

Filtragem de conteúdo: texto introduzido, imagens carregadas e imagens geradas

As imagens geradas são filtradas quanto a conteúdo indesejável ou prejudicial. Da mesma forma, qualquer entrada do Imagen no Vertex AI é verificada quanto a conteúdo ofensivo. Isto inclui o comando de texto introduzido e as fotos carregadas no caso da edição de imagens. Para mais informações, consulte o artigo IA responsável e diretrizes de utilização do Imagen.

Também pode denunciar suspeitas de abuso do Imagen no Vertex AI ou qualquer resultado gerado que contenha material impróprio ou informações incorretas através do formulário Denunciar suspeitas de abuso noGoogle Cloud.

Noções básicas de escrita de comandos (assunto, contexto e estilo)

Embora não exista uma única forma de escrever bons comandos, a adição de algumas palavras-chave e modificadores ajuda a aproximar-se do seu objetivo final. Os comandos não têm de ser longos nem complexos, mas a maioria dos bons comandos é descritiva e clara.

Um bom ponto de partida pode ser pensar no assunto, no contexto e no estilo.

Comando com o assunto, o contexto e o estilo realçados
Texto da imagem: um esboço (estilo) de um prédio de apartamentos moderno (assunto) rodeado de arranha-céus (contexto e fundo).
  1. Sujeito: a primeira coisa a ter em conta em qualquer comando é o sujeito: o objeto, a pessoa, o animal ou o cenário de que quer uma imagem.

  2. Contexto e fundo: o fundo ou o contexto em que o objeto vai ser colocado é igualmente importante. Experimente colocar o objeto em vários fundos. Por exemplo, um estúdio com um fundo branco, ao ar livre ou em ambientes interiores.

  3. Estilo: por último, adicione o estilo de imagem que quer. Os estilos podem ser gerais (pintura, fotografia, esboços) ou muito específicos (pintura a pastel, desenho a carvão, 3D isométrico).

Depois de escrever uma primeira versão do comando, refine-o adicionando mais detalhes até obter a imagem pretendida. A iteração é importante. Comece por estabelecer a sua ideia principal e, em seguida, refine e expanda essa ideia principal até que a imagem gerada se aproxime da sua visão.

imagem de exemplo fotorrealista 1
Comando: um parque na primavera junto a um lago
imagem de exemplo fotorrealista 2
Comando: um parque na primavera junto a um lago, o sol põe-se do outro lado do lago, hora dourada
imagem de exemplo fotorrealista 3
Comando: um parque na primavera junto a um lago, o sol põe-se sobre o lago, hora dourada, flores silvestres vermelhas

Escrita de comandos do Imagen 3

Veja o cartão do modelo Imagen for Generation

O Imagen 3 pode transformar as suas ideias em imagens detalhadas, quer os comandos sejam curtos ou longos e detalhados. Refine a sua visão através de comandos iterativos, adicionando detalhes até alcançar o resultado perfeito.

Os comandos curtos permitem-lhe gerar uma imagem rapidamente.

Exemplo de comando curto do Imagen 3
Comando: foto em close-up de uma mulher na casa dos 20 anos, fotografia de rua, fotograma de filme, tons quentes laranja esbatidos

Os comandos mais longos permitem-lhe adicionar detalhes específicos e criar a sua imagem.

Exemplo de comando longo do Imagen 3
Comando: foto cativante de uma mulher na casa dos 20 anos a usar um estilo de fotografia de rua. A imagem deve parecer uma foto de um filme com tons quentes de laranja esbatidos.

Conselhos adicionais para escrever comandos do Imagen 3:

  • Use linguagem descritiva: use adjetivos e advérbios detalhados para criar uma imagem clara para o Imagen 3.
  • Forneça contexto: se necessário, inclua informações gerais para ajudar a IA a compreender.
  • Referencie artistas ou estilos específicos: se tiver uma estética específica em mente, referenciar artistas ou movimentos artísticos específicos pode ser útil.
  • Use ferramentas de engenharia de comandos: considere explorar ferramentas ou recursos de engenharia de comandos para ajudar a refinar os seus comandos e alcançar resultados ótimos.
  • Melhorar os detalhes faciais nas suas imagens pessoais e de grupo:
    • Especifique detalhes faciais como foco da foto (por exemplo, use a palavra "retrato" no comando).
    • Considere usar um modelo maior, como o Imagen 3, em vez do Imagen 3 Fast para melhorar os detalhes.

Gere texto em imagens

A capacidade do Imagen 3 de adicionar texto às suas imagens abre possibilidades criativas de geração de imagens. Use as seguintes orientações para tirar o máximo partido desta funcionalidade:

  • Itere com confiança: pode ter de regenerar imagens até conseguir o aspeto desejado. A integração de texto do Imagen ainda está em evolução e, por vezes, várias tentativas geram os melhores resultados.
  • Mantenha o texto curto: limite o texto a 25 carateres ou menos para uma geração ideal.
  • Várias expressões: experimente usar duas ou três expressões distintas para fornecer informações adicionais. Evite exceder as três expressões para composições mais claras.

    Exemplo de texto gerado pelo Imagen 3
    Comando: um cartaz com o texto "Summerland" em negrito como título. Abaixo deste texto, encontra-se o slogan "O verão nunca foi tão bom"
  • Posicionamento de texto: embora o Imagen possa tentar posicionar o texto conforme indicado, deve esperar variações ocasionais. Esta funcionalidade está em melhoria contínua.

  • Estilo do tipo de letra Inspire: especifique um estilo de tipo de letra geral para influenciar subtilmente as escolhas do Imagen. Não dependa da replicação precisa do tipo de letra, mas espere interpretações criativas.

  • Tamanho do tipo de letra: especifique um tamanho do tipo de letra ou uma indicação geral do tamanho (por exemplo, pequeno, médio, grande) para influenciar a geração do tamanho do tipo de letra.

Parametrização de comandos

Para controlar melhor os resultados de saída, pode ser útil parametrizar as entradas no Imagen quando trabalhar com a API Imagen ou o SDK Vertex AI para Python. Por exemplo, suponhamos que quer que os seus clientes possam gerar logótipos para a respetiva empresa e quer certificar-se de que os logótipos são sempre gerados num fundo de cor sólida. Também quer limitar as opções que o cliente pode selecionar num menu.

Neste exemplo, pode criar um comando parametrizado semelhante ao seguinte:

A {logo_style} logo for a {company_area} company on a solid color background. Include the text {company_name}.

Na interface do utilizador personalizada, o cliente pode introduzir os parâmetros através de um menu, e o valor escolhido preenche o comando que o Imagen recebe.

Por exemplo:

  1. Comando: A minimalist logo for a health care company on a solid color background. Include the text Journey.

    Exemplo de parametrização de comandos do Imagen 3 1

  2. Comando: A modern logo for a software company on a solid color background. Include the text Silo.

    Exemplo de parametrização de comandos do Imagen 3 (2)

  3. Comando: A traditional logo for a baking company on a solid color background. Include the text Seed.

    Exemplo de parametrização de comandos do Imagen 3

Estilo: fotografia

  • O comando inclui: "Uma foto de…"

Para usar este estilo, comece por usar palavras-chave que indiquem claramente ao Imagen no Vertex AI que está à procura de uma fotografia. Comece os comandos com "Uma foto de. . .". Por exemplo:

imagem de exemplo fotorrealista 1
Comando: uma foto de grãos de café numa cozinha sobre uma superfície de madeira
imagem de exemplo fotorrealista 2
Comando: uma foto de uma barra de chocolate numa bancada de cozinha
imagem de exemplo fotorrealista 3
Comando: uma foto de um edifício moderno com água no fundo

Origem da imagem: cada imagem foi gerada através do respetivo comando de texto com o modelo Imagen 3.

Estilo: ilustração e arte

  • O comando inclui: "Um painting de…", "Um sketch de…"

Os estilos artísticos variam desde estilos monocromáticos, como esboços a lápis, até arte digital hiper-realista. Por exemplo, as seguintes imagens usam o mesmo comando com estilos diferentes:

"Uma [art style or creation technique] de um sedan elétrico desportivo angular com arranha-céus no fundo"

art sample images
Comando: um desenho técnico a lápis de um...
art sample images
Comando: um desenho a carvão de um...
art sample images
Comando: um desenho a lápis de cor de um...
art sample images
Comando: uma pintura a pastel de um...
art sample images
Comando: uma arte digital de um...
art sample images
Comando: um art déco (póster) de um...

Origem da imagem: cada imagem foi gerada através do respetivo comando de texto com o modelo Imagen 2.

Técnicas avançadas de escrita de comandos

Use os exemplos seguintes para criar comandos mais específicos com base nos atributos: descritores de fotografia, formas e materiais, movimentos artísticos históricos e modificadores de qualidade de imagem.

Modificadores de fotografia

Nos exemplos seguintes, pode ver vários modificadores e parâmetros específicos da fotografia.

  1. Proximidade da câmara: close-up tirado de longe

    Imagem de amostra da câmara em grande plano
    Comando: uma foto em primeiro plano de grãos de café
    Imagem de amostra da câmara com zoom diminuído
    Comando: uma foto com zoom afastado de um pequeno saco de
    grãos de café numa cozinha desarrumada

  2. Posição da câmara: aérea, de baixo

    imagem de exemplo de foto aérea
    Comando: foto aérea de uma cidade urbana com arranha-céus
    Imagem de exemplo de uma vista por baixo
    Comando: uma foto de um dossel florestal com céu azul visto de baixo
  3. Iluminação: natural, dramática, quente, fria

    imagem de exemplo de iluminação natural
    Comando: foto de estúdio de uma poltrona moderna, iluminação natural
    imagem de exemplo de iluminação dramática
    Comando: foto de estúdio de uma poltrona moderna, iluminação dramática
  4. Definições da câmara – efeito esbatido de movimento, foco suave, bokeh, retrato

    Imagem de exemplo com efeito esbatido de movimento
    Comando: foto de uma cidade com arranha-céus vista do interior de um carro com efeito esbatido de movimento
    Imagem de exemplo com filtro difusor
    Comando: fotografia com filtro difusor de uma ponte numa cidade urbana à noite
  5. Tipos de lentes: 35 mm, 50 mm, olho de peixe, grande angular e macro

    Imagem de exemplo da lente macro
    Comando: foto de uma folha, lente macro
    Imagem de exemplo da lente olho de peixe
    Comando: fotografia de rua, cidade de Nova Iorque, lente olho de peixe
  6. Tipos de filmes: preto e branco, polaroid

    Imagem de exemplo de foto polaroid
    Comando: um retrato polaroid de um cão com óculos de sol
    Imagem de exemplo de foto a preto e branco
    Comando: foto a preto e branco de um cão com óculos de sol

Origem da imagem: cada imagem foi gerada através do respetivo comando de texto com o modelo Imagen 3.

Formas e materiais

  • O comando inclui: "...feito de...", "...em forma de..."

Um dos pontos fortes desta tecnologia é que pode criar imagens que, de outra forma, seriam difíceis ou impossíveis. Por exemplo, pode recriar o logótipo da sua empresa em diferentes materiais e texturas.

Imagem de exemplo de formas e materiais 1
Comando: um saco de desporto feito de queijo
Imagem de exemplo de formas e materiais 2
Comando: tubos de néon em forma de pássaro
Imagem de exemplo de formas e materiais 3
Comando: uma poltrona feita de papel, foto de estúdio, estilo origami

Origem da imagem: cada imagem foi gerada através do respetivo comando de texto com o modelo Imagen 3.

Referências artísticas históricas

  • O comando inclui: "…no estilo de…"

Determinados estilos tornaram-se icónicos ao longo dos anos. Seguem-se algumas ideias de estilos de pintura ou arte históricos que pode experimentar.

"gera uma imagem no estilo de [art period or movement]: um parque eólico"

imagem de exemplo de impressionismo
Comando: gera uma imagem no estilo de uma pintura impressionista: um parque eólico
imagem de exemplo do Renascimento
Comando: gera uma imagem no estilo de uma pintura renascentista: um parque eólico
imagem de exemplo de pop art
Comando: gera uma imagem no estilo de pop art: um parque eólico

Origem da imagem: cada imagem foi gerada através do respetivo comando de texto com o modelo Imagen 3.

Modificadores de qualidade da imagem

Determinadas palavras-chave podem indicar ao modelo que está à procura de um recurso de alta qualidade. Alguns exemplos de modificadores de qualidade:

  • Modificadores gerais: alta qualidade, bonito, estilizado
  • Fotos: 4K, HDR, Foto de estúdio
  • Arte, ilustração: por um profissional, detalhada

Seguem-se alguns exemplos de comandos sem modificadores de qualidade e o mesmo comando com modificadores de qualidade.

Imagem de exemplo de milho sem modificadores
Comando (sem modificadores de qualidade): uma foto de um caule de milho
Imagem de exemplo de milho com modificadores
Comando (com modificadores de qualidade): 4k HDR beautiful
photo of a corn stalk taken by a
professional photographer

Origem da imagem: cada imagem foi gerada através do respetivo comando de texto com o modelo Imagen 3.

Formatos

A geração de imagens do Imagen 3 permite-lhe definir cinco formatos de imagem distintos.

  1. Quadrado (1:1, predefinição): uma foto quadrada padrão. As utilizações comuns deste formato incluem publicações nas redes sociais.
  2. Ecrã inteiro (4:3): este formato é usado frequentemente em suportes multimédia ou filmes. Também são as dimensões da maioria das TVs antigas (não panorâmicas) e das câmaras de formato médio. Captura mais da cena na horizontal (em comparação com 1:1), o que a torna uma proporção preferencial para fotografia.

    exemplo de formato
    Comando: close-up dos dedos de um músico a tocar piano, filme a preto e branco, vintage (formato 4:3)
    exemplo de formato
    Comando: uma foto profissional de estúdio de batatas fritas para um restaurante de luxo, no estilo de uma revista de comida (formato 4:3)
  3. Ecrã inteiro vertical (3:4): este é o formato de ecrã inteiro rodado 90 graus. Isto permite capturar mais do ambiente na vertical em comparação com o formato 1:1.

    exemplo de formato
    Comando: uma mulher a fazer caminhadas, close-up dos seus botins refletidos numa poça, montanhas grandes no fundo, no estilo de um anúncio, ângulos dramáticos (formato 3:4)
    exemplo de formato
    Prompt: vista aérea de um rio a fluir num vale místico (formato 3:4)
  4. Panorâmico (16:9): este formato substituiu o 4:3 e é agora o formato mais comum para TVs, monitores e ecrãs de telemóveis (horizontal). Use este formato quando quiser capturar mais do fundo (por exemplo, paisagens panorâmicas).

    exemplo de formato
    Comando: um homem com roupa toda branca sentado na praia, em close-up, com iluminação da hora dourada (formato 16:9)
  5. Vertical (9:16): este formato é panorâmico, mas rodado. Este formato é relativamente novo e foi popularizado por apps de vídeo de formato curto (por exemplo, o YouTube Shorts). Use esta opção para objetos altos com orientações verticais fortes, como edifícios, árvores, cascatas ou outros objetos semelhantes.

    exemplo de formato
    Prompt: uma renderização digital de um arranha-céus enorme, moderno, grandioso, épico com um belo pôr do sol no fundo (formato 9:16)

Comandos negativos

Os exemplos anteriores focam-se na escrita de comandos para o que quer que o Imagen crie, mas também pode fornecer um comando negativo juntamente com o comando original para ajudar o produto a gerar ou editar imagens. Estes comandos negativos podem ser uma ferramenta poderosa que ajuda a especificar os elementos a omitir da imagem. Basta descrever o que não quer.

Recomendado: descreva claramente o que não quer ver. Por exemplo, "parede, moldura".

Não recomendado: evite linguagem instrucional ou palavras como "não". Por exemplo, evite expressões como "sem paredes" ou "não mostrar paredes".

Imagem de exemplo de pintura sem comando negativo
Comando (sem comando negativo): arte conceptual de videojogos em 4K, selva urbana, cidade cyberpunk, renderização detalhada
Imagem de exemplo de pintura com comando negativo
Comando: arte conceptual de videojogos em 4K, selva urbana, cidade cyberpunk, renderização detalhada
Comando negativo: vegetação, plantas, floresta, árvores
Imagem de exemplo de pintura sem comando negativo
Comando (sem comando negativo): ilustração de uma serpe mítica a voar sobre montanhas
Imagem de exemplo de pintura com comando negativo
Comando: ilustração de um wyvern mítico a voar sobre montanhas
Comando negativo: neve, geada

Imagens fotorrealistas

As diferentes versões do modelo de geração de imagens podem oferecer uma combinação de resultados artísticos e fotorrealistas. Use a seguinte redação nos comandos para gerar resultados mais fotorrealistas, com base no assunto que quer gerar.

Exemplo de utilização Tipo de lente Distâncias focais Detalhes adicionais
Pessoas (retratos) Prime, zoom 24-35mm filme a preto e branco, filme noir, profundidade de campo, duotono (mencionar duas cores)
Comida, insetos, plantas (objetos, natureza morta) Macro 60-105mm Detalhes elevados, focagem precisa e iluminação controlada
Desporto, vida selvagem (movimento) Zoom com teleobjetiva 100-400mm Velocidade do obturador rápida, acompanhamento de ação ou movimento
Astronómico, paisagem (grande angular) Grande angular 10-24mm Tempos de exposição prolongados, foco nítido, exposição prolongada, água ou nuvens suaves

Retratos

Exemplo de utilização Tipo de lente Distâncias focais Detalhes adicionais
Pessoas (retratos) Prime, zoom 24-35mm filme a preto e branco, filme noir, profundidade de campo, duotono (mencionar duas cores)

Usando várias palavras-chave da tabela, o Imagen pode gerar os seguintes retratos.

Exemplo de fotografia de retrato Exemplo de fotografia de retrato Exemplo de fotografia de retrato Exemplo de fotografia de retrato

Comando: Uma mulher, retrato de 35 mm, tons duplos de azul e cinzento
Modelo: Imagen 3 (imagen-3.0-generate-002)

Exemplo de fotografia de retrato Exemplo de fotografia de retrato Exemplo de fotografia de retrato Exemplo de fotografia de retrato

Comando: Uma mulher, retrato de 35 mm, filme noir
Modelo: Imagen 3 (imagen-3.0-generate-002)

Objetos

Exemplo de utilização Tipo de lente Distâncias focais Detalhes adicionais
Comida, insetos, plantas (objetos, natureza morta) Macro 60-105mm Detalhes elevados, focagem precisa e iluminação controlada

Usando várias palavras-chave da tabela, o Imagen pode gerar as seguintes imagens de objetos.

exemplo de fotografia de objetos exemplo de fotografia de objetos exemplo de fotografia de objetos exemplo de fotografia de objetos

Comando: folha de uma planta-rezadeira, lente macro, 60 mm
Modelo: Imagen 3 (imagen-3.0-generate-002)

exemplo de fotografia de objetos exemplo de fotografia de objetos exemplo de fotografia de objetos exemplo de fotografia de objetos

Comando: um prato de massa, lente macro de 100 mm
Modelo: Imagen 3 (imagen-3.0-generate-002)

Movimento

Exemplo de utilização Tipo de lente Distâncias focais Detalhes adicionais
Desporto, vida selvagem (movimento) Zoom com teleobjetiva 100-400mm Velocidade do obturador rápida, acompanhamento de ação ou movimento

Usando várias palavras-chave da tabela, o Imagen pode gerar as seguintes imagens em movimento.

motion photography example motion photography example motion photography example motion photography example

Comando: um touchdown vitorioso, velocidade do obturador rápida, seguimento de movimentos
Modelo: Imagen 3 (imagen-3.0-generate-002)

motion photography example motion photography example motion photography example motion photography example

Comando: um veado a correr na floresta, velocidade do obturador rápida, seguimento de movimento
Modelo: Imagen 3 (imagen-3.0-generate-002)

Grande angular

Exemplo de utilização Tipo de lente Distâncias focais Detalhes adicionais
Astronómico, paisagem (grande angular) Grande angular 10-24mm Tempos de exposição prolongados, foco nítido, exposição prolongada, água ou nuvens suaves

Usando várias palavras-chave da tabela, o Imagen pode gerar as seguintes imagens de grande angular.

Exemplo de fotografia com grande-angular Exemplo de fotografia com grande-angular Exemplo de fotografia com grande-angular Exemplo de fotografia com grande-angular

Comando: uma cordilheira extensa, paisagem grande angular de 10 mm
Modelo: Imagen 3 (imagen-3.0-generate-002)

Exemplo de fotografia com grande-angular Exemplo de fotografia com grande-angular Exemplo de fotografia com grande-angular Exemplo de fotografia com grande-angular

Comando: uma foto da lua, astrofotografia, grande angular de 10 mm
Modelo: Imagen 3 (imagen-3.0-generate-002)

O que se segue?

Leia artigos sobre o Imagen e outros produtos de IA generativa na Vertex AI: