A partir de 29 de abril de 2025, os modelos Gemini 1.5 Pro e Gemini 1.5 Flash não estão disponíveis em projetos que não tenham usado estes modelos anteriormente, incluindo novos projetos. Para ver detalhes, consulte o artigo Versões e ciclo de vida dos modelos.

Esta página foi traduzida pela API Cloud Translation.

Edite imagens com o Gemini

Aviso: a geração de imagens do Gemini 2.0 Flash vai ser descontinuada a 26 de setembro de 2025 . gemini-2.0-flash-preview-image-generation vai ser removido a 26 de setembro de 2025 . Migre todos os fluxos de trabalho para o gemini-2.5-flash-image-preview.

Pré-visualizar

Este produto ou funcionalidade é uma oferta de pré-visualização de IA generativa, sujeita aos "Termos das Ofertas de Pré-DG" dos Termos Específicos do Serviço da Google Cloud, bem como aos Termos Adicionais para Produtos de Pré-visualização de IA Generativa. Para esta oferta de pré-visualização de IA generativa, os clientes podem optar por utilizá-la para fins de produção ou comerciais, ou divulgar o resultado gerado a terceiros, e podem tratar dados pessoais conforme descrito na Alteração ao Tratamento de Dados do Cloud, sujeito às obrigações e restrições descritas no contrato ao abrigo do qual acede ao Google Cloud. Os produtos pré-GA estão disponíveis "tal como estão" e podem ter apoio técnico limitado. Para mais informações, consulte as descrições das fases de lançamento.

A pré-visualização de imagens do Gemini 2.5 Flash suporta vários tipos de edição de imagens.

Edição de imagens

A pré-visualização pública do Gemini 2.5 Flash Image para geração de imagens (gemini-2.5-flash-image-preview) suporta a capacidade de editar imagens, além de as gerar. Com esta versão de pré-visualização pública, o Gemini 2.5 Flash Image suporta a edição melhorada de imagens e a edição de várias interações, e contém filtros de segurança atualizados que oferecem uma experiência do utilizador mais flexível e menos restritiva.

Suporta as seguintes modalidades e capacidades:

Edição de imagens (texto e imagem para imagem)
- Comando de exemplo: "Edita esta imagem para que pareça um desenho animado"
- Exemplo de comando: [imagem de um gato] + [imagem de uma almofada] + "Cria um ponto de cruz do meu gato nesta almofada."
Edição de imagens em várias etapas (chat)
- Exemplos de comandos: [carrega uma imagem de um carro azul.] "Turn this car into a convertible." (Transforma este carro num descapotável.) "Agora, muda a cor para amarelo." "Adiciona um spoiler."

Edite uma imagem

Consola

Para editar imagens:

Abra o Vertex AI Studio > Criar comando.
Clique em Mudar modelo e selecione gemini-2.5-flash-image-preview no menu.
No painel Resultados, selecione Imagem e texto no menu pendente.
Clique em Inserir multimédia () e selecione uma origem no menu e, de seguida, siga as instruções da caixa de diálogo.
Escreva as edições que quer fazer à imagem na área de texto Escreva um comando.
Clique no botão Comando ().

O Gemini gera uma versão editada da imagem fornecida com base na sua descrição. Este processo deve demorar alguns segundos, mas pode ser comparativamente mais lento, dependendo da capacidade.

Python

Instalação

pip install --upgrade google-genai

Para saber mais, consulte a documentação de referência do SDK.

Defina variáveis de ambiente para usar o SDK de IA generativa com o Vertex AI:

# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=global
export GOOGLE_GENAI_USE_VERTEXAI=True

from google import genai
from google.genai.types import GenerateContentConfig, Modality
from PIL import Image
from io import BytesIO

client = genai.Client()

# Using an image of Eiffel tower, with fireworks in the background.
image = Image.open("test_resources/example-image-eiffel-tower.png")

response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents=[image, "Edit this image to make it look like a cartoon."],
    config=GenerateContentConfig(response_modalities=[Modality.TEXT, Modality.IMAGE]),
)
for part in response.candidates[0].content.parts:
    if part.text:
        print(part.text)
    elif part.inline_data:
        image = Image.open(BytesIO((part.inline_data.data)))
        image.save("output_folder/bw-example-image.png")
# Example response:
#  Here's the cartoon-style edit of the image:
#  Cartoon-style edit:
#  - Simplified the Eiffel Tower with bolder lines and slightly exaggerated proportions.
#  - Brightened and saturated the colors of the sky, fireworks, and foliage for a more vibrant, cartoonish look.
#  ....

REST

Execute o seguinte comando no terminal para criar ou substituir este ficheiro no diretório atual:

curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  https://${API_ENDPOINT}:generateContent \
  -d '{
    "contents": {
      "role": "USER",
      "parts": [
        {"file_data": {
          "mime_type": "image/jpg",
          "file_uri": "<var>FILE_NAME</var>"
          }
        },
        {"text": "Convert this photo to black and white, in a cartoonish style."},
      ]

    },
    "generation_config": {
      "response_modalities": ["TEXT", "IMAGE"],
    },
    "safetySettings": {
      "method": "PROBABILITY",
      "category": "HARM_CATEGORY_DANGEROUS_CONTENT",
      "threshold": "BLOCK_MEDIUM_AND_ABOVE"
    },
  }' 2>/dev/null >response.json

Nota: tem de incluir responseModalities: ["TEXT", "IMAGE"] na sua configuração. A saída apenas de imagens não é suportada com estes modelos.

O Gemini gera uma imagem com base na sua descrição. Este processo deve demorar alguns segundos, mas pode ser comparativamente mais lento consoante a capacidade.

Edição de imagens com várias interações

A pré-visualização de imagens do Gemini 2.5 Flash também suporta uma edição de várias interações melhorada, o que lhe permite responder ao modelo com alterações depois de receber uma resposta com uma imagem editada. Isto permite-lhe continuar a fazer edições à imagem de forma conversacional.

Tenha em atenção que recomendamos limitar o tamanho do ficheiro de pedido completo a um máximo de 50 MB.

Para experimentar a edição de imagens com várias interações, experimente o nosso bloco de notas de pré-visualização de imagens do Gemini 2.5 Flash.

Edite imagens com o Gemini Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Edição de imagens

Edite uma imagem

Consola

Python

Instalação

REST

Edição de imagens com várias interações

Edite imagens com o Gemini