Pode usar o Imagen na Vertex AI para dar instruções ao modelo sobre como personalizar e transformar os objetos numa imagem num estilo que especificar num comando de texto.
Veja o cartão do modelo Imagen for Editing and Customization
Escrita de comandos de personalização
O comando que usa com a personalização do Imagen 3 pode afetar a qualidade das imagens geradas. Use os seguintes modelos de comandos como ponto de partida para escrever comandos de personalização. Pode ter de enviar vários pedidos para obter o resultado segmentado.
Exemplo de utilização | Imagens de referência | Modelo de comando | Exemplo |
---|---|---|---|
Personalização com instruções: transferência de estilo | Imagem (1) | Transforme o subject in image [1] para ter um estilo de ${STYLE_DESCRIPTION}. A imagem representa ${IMAGE_DESCRIPTION}. | Transforma a subject in image [1] num estilo de uma pintura a aguarela da imagem com técnicas de aguarela soltas, tom suave, cores pastel, pinceladas, fundo delicado e simples, espontaneidade, desenho de estilo analógico, pintura complexa altamente detalhada. A imagem mostra um retrato de uma mulher orgulhosa. |
Personalize com a personalização por instruções para a transferência de estilo
Use os seguintes exemplos de código para especificar o estilo das imagens de saída com base no estilo descrito no comando de texto.
REST
Antes de usar qualquer um dos dados do pedido, faça as seguintes substituições:
- PROJECT_ID: o seu Google Cloud ID do projeto.
- LOCATION: a região do seu projeto. Por exemplo,
us-central1
,europe-west2
ouasia-northeast3
. Para ver uma lista das regiões disponíveis, consulte Localizações da IA generativa na Vertex AI. - TEXT_PROMPT: o comando de texto orienta as imagens que o modelo
gera. Para usar a personalização do Imagen 3, inclua o
referenceId
das imagens de referência que fornece no formato [$referenceId]. Por exemplo:- Transforma o objeto na imagem [1] para ter um estilo de imagem de vitral digital.
- Adiciona um chapéu de cowboy vermelho ao gato na imagem [1].
- Remove o cão corgi na imagem [1].
- Altera a bola vermelha na imagem [1] para uma caixa azul.
"referenceId"
: o ID da imagem de referência ou o ID de uma série de imagens de referência que correspondem ao mesmo assunto ou estilo.- BASE64_REFERENCE_IMAGE: uma imagem de referência para orientar a geração de imagens. A imagem tem de ser especificada como uma string de bytes codificada em base64.
- IMAGE_COUNT: o número de imagens geradas. Valores inteiros aceites: 1 a 4. Valor predefinido: 4.
Método HTTP e URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict
Corpo JSON do pedido:
{ "instances": [ { "prompt": "TEXT_PROMPT", "referenceImages": [ { "referenceType": "REFERENCE_TYPE_RAW", "referenceId": 1, "referenceImage": { "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE" } } ] } ], "parameters": { "sampleCount": IMAGE_COUNT } }
Para enviar o seu pedido, escolha uma destas opções:
curl
Guarde o corpo do pedido num ficheiro com o nome request.json
,
e execute o seguinte comando:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict"
PowerShell
Guarde o corpo do pedido num ficheiro com o nome request.json
,
e execute o seguinte comando:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict" | Select-Object -Expand Content
"sampleCount": 2
. A resposta devolve dois objetos de previsão com os bytes da imagem gerada codificados em base64.
{ "predictions": [ { "bytesBase64Encoded": "BASE64_IMG_BYTES", "mimeType": "image/png" }, { "mimeType": "image/png", "bytesBase64Encoded": "BASE64_IMG_BYTES" } ] }
Utilização do produto
Para ver as normas de utilização e as restrições de conteúdo associadas ao Imagen no Vertex AI, consulte as diretrizes de utilização.
Versões do modelo
Existem vários modelos de geração de imagens que pode usar. Para mais informações, consulte os modelos Imagen.
O que se segue?
Leia artigos sobre o Imagen e outros produtos de IA generativa na Vertex AI:
- Um guia do programador para começar a usar o Imagen 3 na Vertex AI
- Novos modelos e ferramentas de multimédia generativa, criados com e para criadores
- Novidades no Gemini: Gems personalizados e geração de imagens melhorada com o Imagen 3
- Google DeepMind: Imagen 3 – O nosso modelo de conversão de texto em imagem de mais alta qualidade