O produto Imagen recontext na API Vertex AI permite-lhe editar imagens de produtos em diferentes cenas ou fundos. Fornece uma imagem de um produto e um comando, e o produto Imagen volta a gerar imagens do seu produto em novas cenas ou com fundos diferentes.
Para pedir acesso ao produto Imagen recontext, preencha o formulário Vertex AI - Generative Media for Marketing Access Request.
Versões de modelos suportadas
O produto Imagen recontext suporta os seguintes modelos:
imagen-product-recontext-preview-06-30
Para mais informações sobre as funcionalidades suportadas pelo modelo, consulte os modelos Imagen.
Pedido HTTP
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:predict \
-d '{
"instances": [
{
"prompt": string,
"productImages": [
// The following fields can be repeated up to 3 times for different
// views of the same product.
{
"image": {
// Union field can be only one of the following:
"bytesBase64Encoded": string,
"gcsUri": string,
// End of list of possible types for union field.
},
}
]
}
],
"parameters": {
"addWatermark": boolean,
"enhancePrompt": boolean
"personGeneration": string,
"safetySetting": string,
"sampleCount": integer,
"seed": integer,
"storageUri": string,
"outputOptions": {
"mimeType": string,
"compressionQuality": integer
}
}
}'
Instâncias
Instâncias | |
---|---|
prompt |
Opcional. Um comando de texto para orientar a geração de cenas. |
productImages |
Uma lista de até três
|
productImages
objeto
O objeto productImages
descreve os recursos de imagens a colocar em diferentes cenas ou fundos.
productImages |
|
---|---|
Campo de união
Imagem do produto de |
|
bytesBase64Encoded |
Uma string codificada em base64 de bytes de um ficheiro de imagem ou vídeo. |
gcsUri |
Um URI de string para uma localização do contentor do Cloud Storage. |
Parâmetros
Parâmetros | |
---|---|
addWatermark |
Opcional. Adicionar uma marca de água invisível às imagens geradas.
O valor predefinido é |
enhancePrompt |
Opcional. Um parâmetro opcional para usar uma funcionalidade de reescrita de comandos baseada em MDIs para fornecer imagens de maior qualidade que reflitam melhor a intenção do comando original. A desativação desta funcionalidade pode afetar a qualidade da imagem e a conformidade com o comando.
O valor predefinido é |
personGeneration |
Opcional. Permitir a geração de pessoas pelo modelo. Os seguintes valores são suportados:
O valor predefinido é |
safetySetting |
Opcional. Adiciona um nível de filtro à filtragem de segurança. Os seguintes valores são suportados:
O valor predefinido é |
|
O número de imagens a gerar.
Um valor inteiro no intervalo de |
seed |
Opcional. A semente aleatória para a geração de imagens. Esta opção não está disponível quando
Se |
storageUri |
Opcional. Um URI de string para uma localização do contentor do Cloud Storage que é usado para armazenar as imagens geradas. Se não for fornecido um contentor do Cloud Storage, são devolvidos bytes de imagem codificados em base64 na resposta. |
outputOptions |
Opcional. Descreve o formato da imagem de saída num |
Objeto de opções de saída
O objeto outputOptions
descreve a saída da imagem.
Parâmetros | |
---|---|
outputOptions.mimeType |
Opcional: O formato de saída da imagem. Os seguintes valores são suportados:
O valor predefinido é |
outputOptions.compressionQuality |
Opcional:
O nível de compressão se o tipo de saída for
|
Exemplo de pedido
REST
Antes de usar qualquer um dos dados do pedido, faça as seguintes substituições:
-
REGION
: a região onde o seu projeto está localizado. Para mais informações sobre as regiões suportadas, consulte o artigo IA generativa nas localizações do Vertex AI. -
PROJECT_ID
: o seu ID do projeto Google Cloud . -
TEXT_PROMPT
: opcional. Um comando de texto para orientar as imagens que o modelo gera. -
BASE64_SUBJECT_IMAGE
: Uma imagem com codificação base64 da imagem do motivo. -
PERSON_SETTING
: Opcional: um valor de string que controla o tipo de geração de pessoas ou rostos que o modelo permite. Pode usar os seguintes valores parapersonGeneration
:-
"allow_adult"
: permite a geração de conteúdo apenas para adultos, exceto a geração de celebridades. A geração de celebridades não é permitida para nenhuma definição. Esta é a predefinição. -
"allow_all"
: permite a geração de pessoas de todas as idades, exceto a geração de celebridades. A geração de celebridades não é permitida para nenhuma definição. -
"dont_allow"
: não permite a geração de pessoas nem rostos no resultado gerado.
-
-
SAFETY_SETTING
: Opcional: um valor de string que controla o limite do filtro de segurança para imagens geradas. Pode usar os seguintes valores para selecionar a sua definição de segurança:-
"block_low_and_above"
: O limite de segurança mais rigoroso."block_low_and_above"
filtra o maior número de imagens geradas. -
"block_medium_and_above"
: O limite de segurança médio, que equilibra a filtragem de conteúdo potencialmente prejudicial e seguro."block_medium_and_above"
é a predefinição de segurança. -
"block_only_high"
: o limite de segurança mais baixo, que reduz o número de pedidos bloqueados devido ao filtro de segurança. A utilização do limiar de segurança"block_only_high"
pode aumentar o número de imagens censuráveis geradas pelo modelo.
-
-
WATERMARK_SETTING
: Opcional: um valor booleano. Quando este valor está definido comotrue
, o modelo adiciona uma marca de água digital que pode usar para validar a imagem gerada. O valor predefinido étrue
. -
IMAGE_COUNT
: o número de imagens a gerar. O intervalo de valores aceite é1
-4
. -
PROMPT_SETTING
: Opcional: um valor booleano. Quando este valor é definido comotrue
, o modelo usa prompts melhorados. O valor predefinido étrue
.
Método HTTP e URL:
POST https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/imagen-product-recontext-preview-06-30:predict
Corpo JSON do pedido:
{ "instances": [ { "prompt": "TEXT_PROMPT", "productImages": [ { "image": { "bytesBase64Encoded": "BASE64_SUBJECT_IMAGE" }, } ] } ], "parameters": { "personGeneration": PERSON_SETTING, "safetySetting": SAFETY_SETTING, "addWatermark": WATERMARK_SETTING, "sampleCount": IMAGE_COUNT, "enhancePrompt": PROMPT_SETTING } }
Para enviar o seu pedido, escolha uma destas opções:
curl
Guarde o corpo do pedido num ficheiro com o nome request.json
,
e execute o seguinte comando:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/imagen-product-recontext-preview-06-30:predict"
PowerShell
Guarde o corpo do pedido num ficheiro com o nome request.json
,
e execute o seguinte comando:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/imagen-product-recontext-preview-06-30:predict" | Select-Object -Expand Content
{ "predictions": [ { "mimeType": "image/png", "bytesBase64Encoded": "BASE64_IMG_BYTES" }, { "bytesBase64Encoded": "BASE64_IMG_BYTES", "mimeType": "image/png" } ] }