Imagen na Vertex AI | Gerador de imagens de IA

O Imagen na Vertex AI oferece recursos de IA generativos de imagem de última geração do Google para desenvolvedores de aplicativos. Com o Imagen na Vertex AI, os desenvolvedores de aplicativos podem criar, em segundos, produtos de IA de última geração que transformam a imaginação do usuário em recursos visuais de alta qualidade usando geração de IA.

Testar a geração de imagens (Vertex AI Studio)

Solicitar acesso: personalização e edição da Imagen 3

Solicitar acesso: geração de pessoas e rostos

Com o Imagen, você pode fazer o seguinte:

  • Gere novas imagens usando apenas uma solicitação de texto (geração de texto para imagem de IA).
  • Edite ou expanda uma imagem enviada ou gerada usando uma área de máscara definida por você.
  • Gerar novos planos de fundo para imagens de produtos.
  • Use suas imagens de um conceito (assunto ou estilo) para personalizar a geração de imagens preservando a aparência de uma pessoa, produto, animal de estimação ou estilo.
  • Edite uma imagem inteira ou parte dela usando uma solicitação de texto sem usar uma máscara.
  • Imagens de luxo existentes, geradas ou editadas.
  • Ajustar um modelo com um assunto específico (por exemplo, uma bolsa ou sapato específico) para a geração de imagens.

Comandos para imagens anteriores

Essas imagens são geradas usando o modelo geral de geração de imagens do Imagen 3 (imagen-3.0-generate-002) e os seguintes comandos:

  1. Cena de massinha. Uma imagem média de uma mulher idosa. Ela está usando roupas fluidas. Ela está em um jardim exuberante regando as plantas com um regador laranja
  2. Foto tirada com o estilo de uma câmera DSLR com filtro polarizador. Uma foto de dois balões de ar quente sobre as formações rochosas únicas na Capadócia, Turquia. As cores e os padrões desses balões contrastam muito bem com os tons terrosos da paisagem abaixo. Essa foto captura a sensação de aventura que vem com o prazer de ter essa experiência.
  3. Um robô mecânico de madeira desgastado e coberto de trepadeiras com flores está em paz em um campo de flores silvestres altas, com um pequeno pássaro azul descansando na mão estendida. Desenho animado digital, com cores quentes e linhas suaves. Um grande penhasco com uma cachoeira atrás.
  4. Uma imagem da mão de uma pessoa segurando uma pequena estatueta de argila de um pássaro e esculpindo-a com uma ferramenta de modelagem na outra mão. Você pode ver o cachecol do escultor. As mãos estão cobertas de pó de argila. Uma imagem DSLR macro destacando a textura e a arte.
  5. Um buquê de flores grande e colorido em um vaso de vidro azul antigo sobre a mesa. Na frente, há uma linda flor de peônia cercada por várias outras flores, como rosas, lírios, margaridas, orquídeas, frutas, bagas, folhas verdes. O plano de fundo é cinza escuro. Pintura a óleo no estilo da Idade de Ouro holandesa.
  6. Uma única vinheta de história em quadrinhos de um menino e seu pai em uma colina gramada, olhando para o pôr do sol. Um balão de diálogo aponta para a boca do menino e diz: O sol vai nascer de novo. Estilo de cores suave e no estilo dos anos 1990

Uso do produto

Para ver os padrões de uso e as restrições de conteúdo associados ao Imagen na Vertex AI, consulte as diretrizes de uso.

Geração de pessoas e rostos

O Imagen 3 gera as imagens mais realistas e de maior qualidade a partir de comandos de texto em linguagem natural, incluindo imagens de pessoas de todas as idades. Esses recursos de geração de pessoas, incluindo a geração de imagens de adultos e crianças, podem exigir que seu caso de uso seja analisado e aprovado.

A imagem 3 pode mostrar um erro que indica que seu projetoGoogle Cloud precisa ser aprovado para geração de adultos ou crianças, dependendo do parâmetro de geração de pessoas ou rostos escolhido e do contexto da solicitação de texto.

Se você precisar de aprovação, preencha o formulário de solicitação e um representante do Google vai entrar em contato com você.

Recurso restrito de pré-lançamento e disponibilidade geral

O Imagen na Vertex AI oferece recursos de acesso geral e de pré-lançamento com disponibilidade limitada, disponíveis no programa Trusted Tester.

Para solicitar acesso para usar esses recursos restritos do Imagen, preencha o formulário de solicitação de acesso do Imagen na Vertex AI. Se aprovado, você receberá instruções sobre como começar.

Para sair do programa Trusted Tester depois de se inscrever, consulte Sair do programa Trusted Tester.

Imagen sobre os recursos e a fase de lançamento da Vertex AI

O Imagen na Vertex AI oferece vários recursos de geração de imagens generativas. Esses recursos estão disponíveis em diferentes estágios de lançamento.

Os recursos abaixo estão disponíveis para todos os usuários:

Recurso Descrição Links Etapa do lançamento
Geração de imagens
(Imagen 3 e Imagen 3 Fast)
Gere novas imagens usando solicitações de texto. Disponibilidade geral
Verificação e marca-d'água digital
(geração de imagens)
Adicione uma marca-d'água digital (não visível), chamada ID do sintetizador, a uma imagem gerada e verifique a presença de uma marca-d'água nela. Disponibilidade geral
Configurações de segurança configuráveis pelo usuário
(geração de imagem)
Receba informações sobre entrada e saída bloqueadas, controle o nível de filtragem de segurança e ative a geração de pessoas e rostos (somente usuários aprovados). Disponibilidade geral

Os recursos a seguir estão disponíveis para todos os usuários (GA, na sigla em inglês), mas precisam de aprovação para serem usados. A documentação desses recursos só está disponível para usuários aprovados:

Solicitar acesso: personalização e edição da Imagen 3

Recurso Descrição Links verified_user Etapa do lançamento
Edição do Imagen 3 Use o modelo Imagen 3 para edição de imagens baseada em máscara. A edição de imagens com máscara do Imagen 3 oferece os seguintes recursos:
  • Inserir ou remover retoque: insira ou remova conteúdo de uma imagem de base com base em uma área de máscara definida por você.
  • Desvio: expanda o conteúdo de uma imagem de base para uma proporção específica.
  • Edição de imagens de produtos: edite imagens de produtos usando a detecção e a máscara automática do plano de fundo.
Disponibilidade geral (usuários aprovados)
Personalização do Imagen 3 (aprendizado few-shot) Use o aprendizado de poucas imagens para personalizar a geração de imagens. Você pode fornecer imagens de referência para orientar a geração de imagens nas seguintes categorias:
  • Personalização do assunto: forneça imagens de referência de tipos específicos de assunto para orientar a geração de imagens: produto, pessoa e animal de estimação.
  • Personalização de estilo: forneça imagens de referência de um estilo para replicar nas imagens geradas.
  • Personalização controlada: forneça uma imagem de controle básica (rabisco ou borda nítida) para orientar a geração de imagens.
  • Personalização por instrução: forneça imagens de referência para transferir o estilo delas para as imagens geradas.
Disponibilidade geral (usuários aprovados)
Edição de imagens Edite imagens usando o modelo Imagen v.002 sem especificar uma área de máscara a ser modificada. Disponibilidade geral (usuários aprovados)
Geração de imagens
(Imagen 2 e Imagen)
Gere novas imagens usando solicitações de texto com os modelos Imagen 2 (v.006 e v.005) e Imagen (v.002). Disponibilidade geral (usuários aprovados)
Ajuste fino do modelo de assunto (ajuste padrão) Ajustar um modelo usando imagens de exemplo de um assunto e gerar imagens usando o modelo ajustado. Disponibilidade geral (usuários aprovados)
Ajuste fino do modelo de estilo Ajustar um modelo usando imagens de exemplo de um estilo e gerar imagens usando o modelo ajustado. Disponibilidade geral (usuários aprovados)

Os recursos abaixo estão em acesso antecipado e precisam de aprovação para uso. A documentação para esses recursos só pode ser acessada por usuários aprovados:

Recurso Descrição Links experiment Etapa do lançamento
Editar usando a personalização do Imagen 2 Forneça uma imagem do rosto de uma pessoa e gere uma imagem estilizada (não fotorrealista) da pessoa em um dos quatro estilos definidos: aquarela, desenho à mão, ilustração e personagem 3D. Visualizar
Editar usando a personalização controlada do Imagen 2 Gerar imagens guiadas usando uma imagem de origem ou um sinal de imagem de origem (borda nítida ou rabiscada) e o modelo Imagen 2. Visualizar
Ajuste fino do modelo de assunto (ajuste instantâneo) Ajustar um modelo usando imagens de exemplo de um assunto e gerar imagens usando o modelo ajustado. Esse tipo de ajuste fino leva menos tempo para ser concluído do que o ajuste padrão. Visualizar
Imagens de Text-to-Live Gerar imagens em tempo real com base em texto. As imagens ao vivo têm até quatro segundos de duração. Visualizar
Descrições de vídeos Receber descrições em texto do conteúdo de um vídeo. Visualizar

Entre em contato com o representante da conta para ter acesso a esse recurso.

Os recursos abaixo estão disponíveis para os usuários, mas há modelos mais recentes de IA generativa na Vertex AI que oferecem os mesmos recursos:

Recurso Descrição Links Etapa do lançamento
Legendas visuais Receber uma descrição em texto do conteúdo de uma imagem. Disponibilidade geral
Resposta visual a perguntas (VQA) Faça uma pergunta e receba informações sobre uma imagem. Disponibilidade geral

Lista de artigos com amostras

Confira os artigos a seguir para entender os casos de uso do Imagen na Vertex AI.

Para conferir uma lista completa de tutoriais de notebooks do Jupyter usando o Imagen, consulte o livro de receitas da IA generativa na Vertex AI.

Recursos Descrição Links
Geração de imagens (Imagen 3) Um guia para desenvolvedores sobre como começar a usar o Imagen 3 na Vertex AI.

Confira mais informações sobre os novos recursos do modelo Imagen 3.

Saiba mais sobre o recurso de geração de imagens do Imagen.

Link do artigo
Geração de imagens (Imagen 3) Do It Yourself Imagen 3: demonstração prática com a Vertex AI.

Execute um Colab que usa os novos recursos do modelo Imagen 3 e Imagen 3 Fast.

Saiba mais sobre o recurso de geração de imagens do Imagen.

Link do artigo
Geração de imagens (Imagen 2)

Edição de imagem (Imagen)
Geração de imagens com o Imagen e o LangChain4j (Java)

Neste artigo, vamos ver como gerar e editar imagens com o Imagen no LangChain4j.

Saiba mais sobre os recursos de geração e edição de imagens do Imagen.

Link do artigo

A seguir

Use os links a seguir para acessar a documentação do recurso.

Crédito da imagem: todas as imagens geradas usando o Imagen na Vertex AI.