É possível usar o Imagen na Vertex AI para gerar novas imagens a partir de um prompt de texto fornecido no console do Google Cloud ou enviar uma solicitação para a API Vertex AI .
Para mais informações sobre como escrever solicitações de texto para geração e edição de imagens, consulte o guia de solicitação.
Visualizar o card do modelo Imagen para geração
Testar a geração de imagens (Vertex AI Studio)
Locais
Um local é uma região que pode ser especificada em uma solicitação para controlar onde os dados são armazenados em repouso. Para uma lista de regiões disponíveis, consulte IA generativa em locais da Vertex AI.
Filtragem de segurança
Os dados de entrada e o conteúdo de saída são verificados quanto a material ofensivo quando você envia uma solicitação de geração de imagem para o Imagen. Isso significa que uma entrada de comando de texto ofensiva pode ser bloqueada. Da mesma forma, imagens de saída ofensivas também podem ser bloqueadas, afetando o número de imagens geradas que você recebe em uma resposta.
Para mais informações sobre a filtragem de segurança e o processamento de conteúdo bloqueado, consulte IA responsável e diretrizes de uso do Imagen.
Desempenho e limitações
Os limites a seguir se aplicam quando você usa um modelo Imagen para geração de imagens:
Limites | Valor (Imagen 3) |
---|---|
Número máximo de solicitações de API por minuto em cada projeto | Imagen 3: 20 Imagen 3 Fast: 200 |
Número máximo de imagens retornadas por solicitação (geração de texto para imagem) | 4 |
Tamanho máximo da imagem enviado ou enviado em uma solicitação (MB) | 10 MB |
Resolução de imagem retornada (pixels) compatível |
|
Número máximo de tokens de entrada (texto de solicitação de geração de texto para imagem) | 480 tokens |
Versões do modelo
Existem várias versões do modelo de geração de imagens que podem ser usadas. Para informações sobre o controle de versões dos modelos do Imagen, consulte Modelos do Imagen e ciclo de vida.
Os seguintes modelos e os recursos associados a eles estão disponíveis para a geração de imagem:
Modelo | Nome e versão do recurso do modelo | Estágio de criação | Recursos | Proporções | Linguagens compatíveis | Faturamento |
---|---|---|---|---|---|---|
Imagen 3 |
Imagen 3:imagen-3.0-generate-002 (modelo mais recente)imagen-3.0-generate-001 Imagen 3 Fast: imagen-3.0-fast-generate-001 Essa é uma variante de modelo de baixa latência que pode ser usada para prototipagem ou casos de uso de baixa latência. Personalização do Imagen 3 e Edição: imagen-3.0-capability-001 (usuários aprovados)
|
Disponibilidade geral |
Recursos compatíveis:
|
|
Disponibilidade geral
Visualização:
|
Sim, o preço se aplica à geração. O preço dos modelos Imagen 3 está em uma nova SKU, então o preço é diferente dos outros modelos. Para exibir todos os recursos e etapas de lançamento, consulte as
Informações gerais do Imagen. |
Antes de começar
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI API.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI API.
-
Configure a autenticação do ambiente.
Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
Java
Para usar os exemplos Java desta página em um ambiente de desenvolvimento local, instale e inicialize o gcloud CLI e e configure o Application Default Credentials com suas credenciais de usuário.
- Install the Google Cloud CLI.
-
To initialize the gcloud CLI, run the following command:
gcloud init
-
If you're using a local shell, then create local authentication credentials for your user account:
gcloud auth application-default login
You don't need to do this if you're using Cloud Shell.
Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local na documentação de autenticação do Google Cloud.
Node.js
Para usar os exemplos Node.js desta página em um ambiente de desenvolvimento local, instale e inicialize o gcloud CLI e e configure o Application Default Credentials com suas credenciais de usuário.
- Install the Google Cloud CLI.
-
To initialize the gcloud CLI, run the following command:
gcloud init
-
If you're using a local shell, then create local authentication credentials for your user account:
gcloud auth application-default login
You don't need to do this if you're using Cloud Shell.
Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local na documentação de autenticação do Google Cloud.
Python
Para usar os exemplos Python desta página em um ambiente de desenvolvimento local, instale e inicialize o gcloud CLI e e configure o Application Default Credentials com suas credenciais de usuário.
- Install the Google Cloud CLI.
-
To initialize the gcloud CLI, run the following command:
gcloud init
-
If you're using a local shell, then create local authentication credentials for your user account:
gcloud auth application-default login
You don't need to do this if you're using Cloud Shell.
Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local na documentação de autenticação do Google Cloud.
REST
Para usar as amostras da API REST nesta página em um ambiente de desenvolvimento local, use as credenciais fornecidas para gcloud CLI.
Install the Google Cloud CLI, then initialize it by running the following command:
gcloud init
Para mais informações, consulte Autenticar para usar REST na documentação de autenticação do Google Cloud.
Gerar imagens com texto
Você pode gerar novas imagens usando apenas texto descritivo como entrada. Os exemplos a seguir mostram instruções básicas para gerar imagens, mas também é possível usar parâmetros adicionais, dependendo do caso de uso.
Console
-
No console do Google Cloud, abra a guia Vertex AI Studio > Media no painel da Vertex AI.
Acessar a guia "Vertex AI Studio" -
No campo Escreva seu comando, insira uma descrição para as imagens que você quer gerar. Para detalhes sobre como escrever comandos eficazes, consulte o guia de comandos.
- Por exemplo: ilustração em aquarela de pequeno barco na água durante a manhã
Opcional. Na caixa Opções do modelo, no painel Parâmetros, selecione a versão do modelo a ser usada. Para mais informações, consulte Versões do modelo.
Opcional. Altere os parâmetros padrão e avançados.
-
Para gerar imagens, clique em
Gerar.Geração de imagens para imagens geradas com o Imagen na Vertex AI com base no comando: ilustração em tons pastéis de um pequeno barco vermelho na água pela manhã.
REST
Para mais informações sobre solicitações de modelo
imagegeneration
, consulte a referência da API do modeloimagegeneration
.Antes de usar os dados da solicitação abaixo, faça as substituições a seguir:
- PROJECT_ID: o Google Cloud ID do projeto.
- MODEL_VERSION: a versão do modelo
imagegeneration
a ser usada. Valores disponíveis:-
Imagen 3:
imagen-3.0-generate-002
(modelo mais recente)imagen-3.0-generate-001
imagen-3.0-fast-generate-001
: versão do modelo de baixa latência.
-
Versão padrão do modelo:
imagegeneration
: usa a versão de modelo padrão v.006. Como prática recomendada, sempre especifique uma versão de modelo, principalmente em ambientes de produção.
Para mais informações sobre versões e recursos do modelo, consulte Versões do modelo.
-
Imagen 3:
- LOCATION: a região do seu projeto. Por exemplo,
us-central1
,europe-west2
ouasia-northeast3
. Para uma lista de regiões disponíveis, consulte IA generativa em locais da Vertex AI. - TEXT_PROMPT: o comando de texto que orienta quais imagens o modelo gera. Este campo é obrigatório para geração e edição.
- IMAGE_COUNT: o número de imagens geradas.
Valores inteiros aceitos: 1 a 8 (
imagegeneration@002
), 1 a 4 (todas as outras versões de modelo). Valor padrão: 4. - ADD_WATERMARK: booleano. Opcional. Define se uma marca-d'água será ativada para imagens geradas.
Qualquer imagem gerada quando o campo está definido como
true
contém um SynthID digital que você pode usar para verificar uma imagem de marca d'água. Se você omitir esse campo, o valor padrão detrue
será usado. Defina o valor comofalse
para desativar esse recurso. Só é possível usar o camposeed
para receber uma saída determinística quando ele está definido comofalse
. - ASPECT_RATIO: string. Opcional. Um parâmetro do modo de geração que controla a proporção. Valores de proporção aceitos e o uso pretendido:
1:1
(padrão, quadrado)3:4
(anúncios, mídias sociais)4:3
(TV, fotografia)16:9
(paisagem)9:16
(retrato)
- ENABLE_PROMPT_REWRITING: booleano. Opcional. Um parâmetro para usar um recurso de reescrita de comando
baseado em LLM para fornecer imagens de maior qualidade que reflitam melhor a intenção
do comando original. A desativação desse recurso pode afetar a qualidade da imagem e
a adesão imediata. Valor padrão:
true
- INCLUDE_RAI_REASON: booleano. Opcional. Define se o
código de motivo filtrado da
IA responsável precisa ser ativado nas respostas com entrada ou saída bloqueada. Valor padrão:
false
. - INCLUDE_SAFETY_ATTRIBUTES: booleano. Opcional. Define se as pontuações de IA responsável arredondadas serão ativadas para uma lista de atributos de segurança nas respostas de entrada e saída não filtradas. Categorias de atributos de segurança:
"Death, Harm & Tragedy"
,"Firearms & Weapons"
,"Hate"
,"Health"
,"Illicit Drugs"
,"Politics"
,"Porn"
,"Religion & Belief"
,"Toxic"
,"Violence"
,"Vulgarity"
,"War & Conflict"
. Valor padrão:false
. - MIME_TYPE: string. Opcional. O tipo MIME do conteúdo da imagem. Valores
disponíveis:
image/jpeg
image/gif
image/png
image/webp
image/bmp
image/tiff
image/vnd.microsoft.icon
- COMPRESSION_QUALITY: número inteiro. Opcional. Aplica-se apenas a arquivos de saída
JPEG. O nível de detalhes que o modelo preserva para imagens geradas no formato de arquivo JPEG. Valores:
0
a100
, em que um número maior significa mais compactação. Padrão:75
. - PERSON_SETTING: string. Opcional. A configuração de segurança que controla o tipo de
pessoa ou geração de rostos permitida pelo modelo. Valores disponíveis:
allow_adult
(padrão): permite a geração somente de adultos, exceto para celebridades. A geração de celebridades não é permitida em nenhuma configuração.dont_allow
: desativa a inclusão de pessoas ou rostos nas imagens geradas.
- SAFETY_SETTING: string. Opcional. Uma configuração que controla os limites de filtro de segurança
para imagens geradas. Valores disponíveis:
block_low_and_above
: o limite de segurança mais alto, resultando na maior quantidade de imagens geradas que são filtradas. Valor anterior:block_most
.block_medium_and_above
(padrão): um limite de segurança médio que equilibra a filtragem de conteúdo potencialmente nocivo e seguro. Valor anterior:block_some
.block_only_high
: um limite de segurança que reduz o número de solicitações bloqueadas devido a filtros de segurança. Essa configuração pode aumentar o conteúdo censurável gerado pelo Imagen. Valor anterior:block_few
.
- SEED_NUMBER: número inteiro. Opcional. Qualquer número inteiro não negativo fornecido para tornar as imagens
de saída determinísticas. Fornecer o mesmo número de origem sempre resulta nas mesmas imagens de saída. Se
o modelo que você está usando for compatível com a marca d'água digital, defina
"addWatermark": false
para usar esse campo. Valores inteiros aceitos:1
a2147483647
. - OUTPUT_STORAGE_URI: string. Opcional. O bucket do Cloud Storage para armazenar as imagens de saída. Se não forem fornecidos, os bytes de imagem codificados em base64 serão retornados na resposta. Valor de exemplo:
gs://image-bucket/output/
.
Parâmetros opcionais adicionais
Use as variáveis opcionais a seguir, dependendo do seu caso de uso. Adicione alguns ou todos os parâmetros abaixo no objeto
"parameters": {}
. Esta lista mostra parâmetros opcionais comuns e não é exaustiva. Para mais informações sobre parâmetros opcionais, consulte a Referência da API Imagen: gerar imagens."parameters": { "sampleCount": IMAGE_COUNT, "addWatermark": ADD_WATERMARK, "aspectRatio": "ASPECT_RATIO", "enhancePrompt": ENABLE_PROMPT_REWRITING, "includeRaiReason": INCLUDE_RAI_REASON, "includeSafetyAttributes": INCLUDE_SAFETY_ATTRIBUTES, "outputOptions": { "mimeType": "MIME_TYPE", "compressionQuality": COMPRESSION_QUALITY }, "personGeneration": "PERSON_SETTING", "safetySetting": "SAFETY_SETTING", "seed": SEED_NUMBER, "storageUri": "OUTPUT_STORAGE_URI" }
Método HTTP e URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict
Corpo JSON da solicitação:
{ "instances": [ { "prompt": "TEXT_PROMPT" } ], "parameters": { "sampleCount": IMAGE_COUNT } }
Para enviar a solicitação, escolha uma destas opções:
curl
Salve o corpo da solicitação em um arquivo com o nome
request.json
e execute o comando a seguir:curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict"PowerShell
Salve o corpo da solicitação em um arquivo com o nome
request.json
e execute o comando a seguir:$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict" | Select-Object -Expand Content"sampleCount": 2
. A resposta retorna dois objetos de previsão, com os bytes de imagem gerados codificados em base64.{ "predictions": [ { "bytesBase64Encoded": "BASE64_IMG_BYTES", "mimeType": "image/png" }, { "mimeType": "image/png", "bytesBase64Encoded": "BASE64_IMG_BYTES" } ] }
Se você usar um modelo compatível com o aprimoramento de comando, a resposta incluirá um campo
prompt
adicional com o comando aprimorado usado para geração:{ "predictions": [ { "mimeType": "MIME_TYPE", "prompt": "ENHANCED_PROMPT_1", "bytesBase64Encoded": "BASE64_IMG_BYTES_1" }, { "mimeType": "MIME_TYPE", "prompt": "ENHANCED_PROMPT_2", "bytesBase64Encoded": "BASE64_IMG_BYTES_2" } ] }
Python
Antes de testar esse exemplo, siga as instruções de configuração para Python no Guia de início rápido da Vertex AI sobre como usar bibliotecas de cliente. Para mais informações, consulte a documentação de referência da API Vertex AI para Python.
Para autenticar na Vertex AI, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Neste exemplo, você chama o método
generate_images
noImageGenerationModel
e salva as imagens geradas localmente. Em seguida, é possível usar o métodoshow()
em um notebook para mostrar as imagens geradas. Para mais informações sobre versões e atributos de modelos, consulte Versões do modelo.Java
Antes de testar esse exemplo, siga as instruções de configuração para Java no Guia de início rápido da Vertex AI sobre como usar bibliotecas de cliente. Para mais informações, consulte a documentação de referência da API Vertex AI para Java.
Para autenticar na Vertex AI, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Neste exemplo, você especifica o modelo
imagen-3.0-generate-001
como parte de umEndpointName
. OEndpointName
é transmitido ao métodopredict
, que é chamado em umPredictionServiceClient
. O serviço gera imagens que são salvas localmente. Para mais informações sobre versões e atributos de modelos, consulte Versões do modelo.Node.js
Antes de testar esse exemplo, siga as instruções de configuração para Node.js no Guia de início rápido da Vertex AI sobre como usar bibliotecas de cliente. Para mais informações, consulte a documentação de referência da API Vertex AI para Node.js.
Para autenticar na Vertex AI, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Neste exemplo, você chama o métodopredict
em umPredictionServiceClient
. O serviço gera imagens que são salvas localmente. Para mais informações sobre versões e recursos do modelo, consulte versões do modelo.Usar parâmetros para gerar imagens
Ao gerar imagens, há vários parâmetros padrão e avançados que podem ser definidos, dependendo do seu caso de uso.
Adicionar ou verificar uma marca-d'água de imagem
Por padrão, uma marca-d'água digital é adicionada a qualquer imagem gerada por uma versão de modelo compatível com esse processo. Esses recursos adicionam uma marca-d'água digital não visível, chamada SynthID, às imagens. Você pode verificar se uma imagem contém uma marca d'água digital ou não.
Gerar imagens com marca-d'água
Use os exemplos a seguir para gerar imagens com uma marca d'água digital.
Console
-
No console do Google Cloud, abra a guia Vertex AI Studio > Media no painel da Vertex AI.
Acessar a guia "Vertex AI Studio" -
No campo Escreva seu comando, insira uma descrição para as imagens que você quer gerar. Para detalhes sobre como escrever comandos eficazes, consulte o guia de comandos.
- Por exemplo: ilustração em aquarela de pequeno barco na água durante a manhã
Opcional. Na caixa Opções do modelo, no painel Parâmetros, selecione a versão do modelo a ser usada. Para mais informações, consulte Versões do modelo.
Opcional. Altere os parâmetros padrão e avançados.
-
Para gerar imagens, clique em
Gerar. -
Versão de modelo 006 e mais recentes: uma marca-d'água digital é adicionada automaticamente às imagens geradas. Não é possível desativar a marca-d'água digital para a geração de imagens usando o console do Google Cloud.
É possível selecionar uma imagem para acessar a janela Detalhes da imagem. As imagens com marca-d'água têm um selo de verificar explicitamente uma marca-d'água de imagem.
marca d'água digital. Também é possívelVisualização de detalhes de uma imagem com marca-d'água gerada com o Imagen 2 usando o comando: pequeno barco vermelho na água de manhã em aquarela com cores suaves.
REST
Para mais informações sobre solicitações de modelo
imagegeneration
, consulte a referência da API do modeloimagegeneration
.Antes de usar os dados da solicitação abaixo, faça as substituições a seguir:
- PROJECT_ID: o Google Cloud ID do projeto.
- MODEL_VERSION: a versão do modelo
imagegeneration
a ser usada. Valores disponíveis:imagen-3.0-generate-002
(modelo mais recente)imagen-3.0-generate-001
imagen-3.0-fast-generate-001
: versão do modelo de baixa latência.imagegeneration@006
Para mais informações sobre versões e recursos do modelo, consulte Versões do modelo.
- LOCATION: a região do seu projeto. Por exemplo,
us-central1
,europe-west2
ouasia-northeast3
. Para uma lista de regiões disponíveis, consulte IA generativa em locais da Vertex AI. - TEXT_PROMPT: o comando de texto que orienta quais imagens o modelo gera. Este campo é obrigatório para geração e edição.
- IMAGE_COUNT: o número de imagens geradas.
Valores inteiros aceitos: 1 a 8 (
imagegeneration@002
), 1 a 4 (todas as outras versões de modelo). Valor padrão: 4. - ADD_WATERMARK: booleano. Opcional. Define se uma marca-d'água será ativada para imagens geradas.
Qualquer imagem gerada quando o campo está definido como
true
contém um SynthID digital que você pode usar para verificar uma imagem de marca d'água. Se você omitir esse campo, o valor padrão detrue
será usado. Defina o valor comofalse
para desativar esse recurso. Só é possível usar o camposeed
para receber uma saída determinística quando ele está definido comofalse
.
Método HTTP e URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict
Corpo JSON da solicitação:
{ "instances": [ { "prompt": "TEXT_PROMPT" } ], "parameters": { "sampleCount": IMAGE_COUNT, "addWatermark": ADD_WATERMARK } }
Para enviar a solicitação, escolha uma destas opções:
curl
Salve o corpo da solicitação em um arquivo com o nome
request.json
e execute o comando a seguir:curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict"PowerShell
Salve o corpo da solicitação em um arquivo com o nome
request.json
e execute o comando a seguir:$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict" | Select-Object -Expand Content"sampleCount": 2
. A resposta retorna dois objetos de previsão, com os bytes de imagem gerados codificados em base64. A marca d'água digital é adicionada automaticamente às imagens, assim a resposta é igual a uma resposta sem marca-d'água.{ "predictions": [ { "mimeType": "image/png", "bytesBase64Encoded": "BASE64_IMG_BYTES" }, { "bytesBase64Encoded": "BASE64_IMG_BYTES", "mimeType": "image/png" } ] }
SDK da Vertex AI para Python
Node.js
Verificar uma imagem com marca d'água
Use os exemplos a seguir para verificar se uma imagem tem uma marca-d'água.
Console
No console do Google Cloud, abra a guia Vertex AI Studio > Media no painel da Vertex AI.
No painel de baixo, clique em
Verificar.Clique em Fazer upload da imagem.
Selecione uma imagem gerada localmente.
REST
Antes de usar os dados da solicitação abaixo, faça as substituições a seguir:
- PROJECT_ID: o Google Cloud ID do projeto.
- LOCATION: a região do seu projeto. Por exemplo,
us-central1
,europe-west2
ouasia-northeast3
. Para uma lista de regiões disponíveis, consulte IA generativa em locais da Vertex AI. - B64_IMAGE: a imagem a ser verificada se contém uma marca d'água digital. A imagem precisa ser especificada como uma string de bytes codificada em base64. Limite de tamanho: 10 MB.
Método HTTP e URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imageverification@001:predict
Corpo JSON da solicitação:
{ "instances": [ { "image": { "bytesBase64Encoded": "B64_IMAGE" } } ], "parameters": { "watermarkVerification": true } }
Para enviar a solicitação, escolha uma destas opções:
curl
Salve o corpo da solicitação em um arquivo com o nome
request.json
e execute o comando a seguir:curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imageverification@001:predict"PowerShell
Salve o corpo da solicitação em um arquivo com o nome
request.json
e execute o comando a seguir:$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imageverification@001:predict" | Select-Object -Expand ContentACCEPT
ouREJECT
.{ "predictions": [ { "decision": "ACCEPT" } ] }
SDK da Vertex AI para Python
Node.js
Definir as configurações de segurança da IA responsável (RAI)
Há vários parâmetros de filtragem da IA responsável (RAI) que podem ser usados com um modelo de geração de imagens. Por exemplo, é possível permitir que o modelo informe códigos de RAI para conteúdo bloqueado, desative pessoas ou geração de rostos usando filtros de RAI, defina o nível de filtragem de conteúdo ou retorne pontuações de RAI arredondadas de lista de segurança atributos de entrada e saída.
Para informações mais detalhadas sobre a IA responsável (RAI), os parâmetros associados e a amostra de saída, consulte Entender e configurar a IA responsável para o Imagen.
Os exemplos a seguir mostram como definir parâmetros RAI disponíveis para geração de imagens.
Console
No console do Google Cloud, abra a guia Vertex AI Studio > Media no painel da Vertex AI.
Adicione seu comando de texto e escolha os parâmetros de entrada.
Se essa opção não aparecer, clique em Opções avançadas.
Clique em Configurações de segurança.
Escolha suas configurações de segurança:
- Geração de pessoa/rosto: escolha uma configuração:
Allow (All ages)
Allow (Adults only)
Don't allow
- Limite do filtro de segurança: escolha uma configuração:
Block low and above
Block medium and above
Block only high
- Geração de pessoa/rosto: escolha uma configuração:
Clique em Salvar.
Clique em
Gerar.
REST
Antes de usar os dados da solicitação abaixo, faça as substituições a seguir:
- PROJECT_ID: o Google Cloud ID do projeto.
- LOCATION: a região do seu projeto. Por exemplo,
us-central1
,europe-west2
ouasia-northeast3
. Para uma lista de regiões disponíveis, consulte IA generativa em locais da Vertex AI. - TEXT_PROMPT: o comando de texto que orienta quais imagens o modelo gera. Este campo é obrigatório para geração e edição.
- IMAGE_COUNT: o número de imagens geradas.
Valores inteiros aceitos: 1 a 8 (
imagegeneration@002
), 1 a 4 (todas as outras versões de modelo). Valor padrão: 4. - SAFETY_SETTING: string. Opcional. Uma configuração que controla os limites de filtro de segurança
para imagens geradas. Valores disponíveis:
block_low_and_above
: o limite de segurança mais alto, resultando na maior quantidade de imagens geradas que são filtradas. Valor anterior:block_most
.block_medium_and_above
(padrão): um limite de segurança médio que equilibra a filtragem de conteúdo potencialmente nocivo e seguro. Valor anterior:block_some
.block_only_high
: um limite de segurança que reduz o número de solicitações bloqueadas devido a filtros de segurança. Essa configuração pode aumentar o conteúdo censurável gerado pelo Imagen. Valor anterior:block_few
.
- PERSON_SETTING: string. Opcional. A configuração de segurança que controla o tipo de
pessoa ou geração de rostos permitida pelo modelo. Valores disponíveis:
allow_adult
(padrão): permite a geração somente de adultos, exceto para celebridades. A geração de celebridades não é permitida em nenhuma configuração.dont_allow
: desativa a inclusão de pessoas ou rostos nas imagens geradas.
- INCLUDE_RAI_REASON: booleano. Opcional. Define se o
código de motivo filtrado da
IA responsável precisa ser ativado nas respostas com entrada ou saída bloqueada. Valor padrão:
false
. - INCLUDE_SAFETY_ATTRIBUTES: booleano. Opcional. Define se as pontuações de IA responsável arredondadas serão ativadas para uma lista de atributos de segurança nas respostas de entrada e saída não filtradas. Categorias de atributos de segurança:
"Death, Harm & Tragedy"
,"Firearms & Weapons"
,"Hate"
,"Health"
,"Illicit Drugs"
,"Politics"
,"Porn"
,"Religion & Belief"
,"Toxic"
,"Violence"
,"Vulgarity"
,"War & Conflict"
. Valor padrão:false
.
Método HTTP e URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@006:predict
Corpo JSON da solicitação:
{ "instances": [ { "prompt": "TEXT_PROMPT" } ], "parameters": { "sampleCount": IMAGE_COUNT, "safetySetting": "SAFETY_SETTING", "personGeneration": "PERSON_SETTING", "includeRaiReason": INCLUDE_RAI_REASON, "includeSafetyAttributes": INCLUDE_SAFETY_ATTRIBUTES } }
Para enviar a solicitação, escolha uma destas opções:
curl
Salve o corpo da solicitação em um arquivo com o nome
request.json
e execute o comando a seguir:curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@006:predict"PowerShell
Salve o corpo da solicitação em um arquivo com o nome
request.json
e execute o comando a seguir:$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@006:predict" | Select-Object -Expand ContentMelhoria do comando usando o reescritor de comandos
A versão 002 do modelo Imagen 3 inclui um recurso de reescrita de comando que usa uma ferramenta de reescrita de comando baseada em LLM. Em geral, essa ferramenta adiciona mais detalhes ao comando fornecido para fornecer imagens de maior qualidade que reflitam melhor o comando. Se você desativar esse recurso, a qualidade e a aderência às instruções das imagens recebidas poderão ser afetadas. Esse recurso é ativado por padrão.
A instrução reescrita só será enviada pela resposta da API se a instrução original tiver menos de 30 palavras.
Console
No console do Google Cloud, abra a guia Vertex AI Studio > Media no painel da Vertex AI.
Adicione seu comando de texto e escolha os parâmetros de entrada.
No painel Parâmetros, use a opção toggle_onAtivar a melhoria de instruções para ativar ou desativar esse recurso.
Clique em
Gerar.
REST
Para mais informações sobre solicitações de modelo
imagegeneration
, consulte a referência da API do modeloimagegeneration
.Antes de usar os dados da solicitação abaixo, faça as substituições a seguir:
- PROJECT_ID: o Google Cloud ID do projeto.
- MODEL_VERSION: a versão do modelo de geração de imagem a ser usada. Valores
disponíveis que oferecem suporte à melhoria de avisos:
imagen-3.0-generate-002
Para mais informações sobre versões e recursos do modelo, consulte Versões do modelo.
- LOCATION: a região do seu projeto. Por exemplo,
us-central1
,europe-west2
ouasia-northeast3
. Para uma lista de regiões disponíveis, consulte IA generativa em locais da Vertex AI. - TEXT_PROMPT: o comando de texto que orienta quais imagens o modelo gera. Antes que as imagens sejam geradas, esse comando básico é aprimorado com mais detalhes e linguagem descritiva usando a ferramenta de reescrita de comando baseada em LLM.
- IMAGE_COUNT: o número de imagens geradas. Valores inteiros aceitos: 1 a 4. Valor padrão: 4.
enhancePrompt
: booleano para ativar o aprimoramento de comandos baseado em LLM. Por padrão, esse valor é definido comotrue
.
Método HTTP e URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict
Corpo JSON da solicitação:
{ "instances": [ { "prompt": "TEXT_PROMPT" } ], "parameters": { "sampleCount": IMAGE_COUNT, "enhancePrompt": true } }
Para enviar a solicitação, escolha uma destas opções:
curl
Salve o corpo da solicitação em um arquivo com o nome
request.json
e execute o comando a seguir:curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict"PowerShell
Salve o corpo da solicitação em um arquivo com o nome
request.json
e execute o comando a seguir:$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict" | Select-Object -Expand Contentprompt
adicional que mostra o comando aprimorado e a imagem gerada associada:{ "predictions": [ { "mimeType": "MIME_TYPE", "prompt": "ENHANCED_PROMPT_1", "bytesBase64Encoded": "BASE64_IMG_BYTES_1" }, { "mimeType": "MIME_TYPE", "prompt": "ENHANCED_PROMPT_2", "bytesBase64Encoded": "BASE64_IMG_BYTES_2" } ] }
Por exemplo, o exemplo de resposta a seguir é para uma solicitação com
"sampleCount": 2
e"prompt": "A raccoon wearing formal clothes, wearing a top hat. Oil painting in the style of Vincent Van Gogh."
. A resposta retorna dois objetos de previsão, cada um com o comando aprimorado e os bytes de imagem gerados codificados em base64.{ "predictions": [ { "mimeType": "image/png", "prompt": "An oil painting in the style of Vincent van Gogh, depicting a raccoon adorned in a finely tailored tuxedo, complete with a crisp white shirt and a bow tie. The raccoon also sports a classic top hat, perched jauntily on its head. The painting uses thick, swirling brushstrokes characteristic of van Gogh, with vibrant hues of blue, yellow, and green in the background, contrasting with the dark tones of the raccoon's attire. The light source is subtly placed, casting a dramatic shadow of the raccoon's attire onto the surface it sits upon, further enhancing the depth and dimensionality of the composition. The overall impression is one of a whimsical and sophisticated character, a raccoon elevated to a higher class through its formal attire, rendered in van Gogh's iconic style.", "bytesBase64Encoded": "BASE64_IMG_BYTES" }, { "mimeType": "image/png", "prompt": "An oil painting in the style of Vincent van Gogh featuring a raccoon in a dapper suit, complete with a black jacket, crisp white shirt, and a black bow tie. The raccoon is wearing a black top hat, adding a touch of elegance to its ensemble. The painting is rendered with characteristic van Gogh brushwork, utilizing thick, impasto strokes of color. The background is a swirl of blues, greens, and yellows, creating a vibrant yet slightly chaotic atmosphere that contrasts with the raccoon's formal attire. The lighting is dramatic, casting sharp shadows and highlighting the textures of the fabric and the raccoon's fur, enhancing the sense of realism within the fantastical scene. The composition focuses on the raccoon's proud posture, highlighting the whimsical contrast of a wild animal dressed in formal attire, captured in the unique artistic language of van Gogh. ", "bytesBase64Encoded": "BASE64_IMG_BYTES" } ] }
Idioma do comando de texto
Esse parâmetro opcional permite definir o idioma do texto de entrada para a geração ou edição de imagens.
Imagem gerada a partir do comando: Você também vai receber todo o conteúdo do canal e a VERTEX AI*
*Uma pilha de livros vista de cima. O livro na parte superior contém uma ilustração em aquarela de um pássaro. A VERTEX AI está escrita em negrito no livro.Imagem gerada com base no comando: 어두운 노란색과 청록색으로 이루어진 밝은 색의 옷을입고 귀걸이를 끼고있는 여자 포스트 모던 패션 사진 †
† Mulher usando brincos e roupas com cores brilhantes, em amarelo-escuro e ciano-escuro; fotografia de moda pós-modernaAntes de começar
Siga estas outras etapas antes de usar esse recurso:
Use o comando a seguir para criar uma identidade de serviço para a Vertex AI usar no seu projeto:
gcloud beta services identity create --service=aiplatform.googleapis.com --project=PROJECT_ID
Solicitar acesso ao recurso. Para solicitar acesso, envie um e-mail para o grupo Google Cloud Acesso de trusted testers: GenApp Builder. Mencione as instruções multilíngues na mensagem e inclua o número do projeto. O processo de aprovação geralmente leva várias horas.
Definir o idioma da solicitação de texto
Há suporte para os seguintes valores de idioma do prompt de texto de entrada:
- Chinês (simplificado) (
zh
/zh-CN
) - Chinese (Traditional) (
zh-TW
) - Inglês (
en
, valor padrão) - Hindi (
hi
) - Japonês (
ja
) - Coreano (
ko
) - Português (
pt
) Espanhol (
es
)
Console
Se o comando estiver em um dos idiomas compatíveis, o Imagen detectará e traduzirá automaticamente o texto e retornará as imagens geradas ou editadas.
Se o comando estiver em um idioma sem suporte, o Imagen vai usar o texto literal para a solicitação. Isso pode resultar em uma saída inesperada.
REST
Para mais informações sobre solicitações de modelo
imagegeneration
, consulte a referência da API do modeloimagegeneration
.Antes de usar os dados da solicitação abaixo, faça as substituições a seguir:
- PROJECT_ID: o Google Cloud ID do projeto.
- TEXT_PROMPT: o comando de texto que orienta quais imagens o modelo gera. Este campo é obrigatório para geração e edição.
- PROMPT_LANGUAGE: string. Opcional. O código do idioma que corresponde ao idioma do comando de texto.
Neste exemplo, seria
hi
. Valores disponíveis:auto
- Detecção automática Se o Imagen detectar um idioma compatível, o comando (e, se quiser, um comando negativo) será traduzido para o inglês. Se o idioma detectado não for compatível, o Imagen vai usar o texto de entrada literalmente, o que pode resultar em uma saída inesperada. Nenhum código de erro é retornado.en
: inglês (valor padrão se omitido)es
- Espanholhi
- Hindija
- Japonêsko
- Coreanopt
- Portuguêszh-TW
- Chinese (Traditional)zh
ouzh-CN
: chinês (simplificado)
Método HTTP e URL:
POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagegeneration@005:predict
Corpo JSON da solicitação:
{ "instances": [ { "prompt": "सूर्यास्त के समय एक समुद्र तट। उड़ते पक्षी, हवा में लहराते नारियल के पेड़। लोग समुद्र तट पर सैर का आनंद ले रहे हैं।" } ], "parameters": { "language": "PROMPT_LANGUAGE" } }
Para enviar a solicitação, escolha uma destas opções:
curl
Salve o corpo da solicitação em um arquivo com o nome
request.json
e execute o comando a seguir:curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagegeneration@005:predict"PowerShell
Salve o corpo da solicitação em um arquivo com o nome
request.json
e execute o comando a seguir:$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagegeneration@005:predict" | Select-Object -Expand Content"sampleCount": 2
. A resposta retorna dois objetos de previsão, com os bytes de imagem gerados codificados em base64.{ "predictions": [ { "bytesBase64Encoded": "BASE64_IMG_BYTES", "mimeType": "image/png" }, { "mimeType": "image/png", "bytesBase64Encoded": "BASE64_IMG_BYTES" } ] }
Proporção
Dependendo de como você planeja usar as imagens geradas, algumas proporções podem funcionar melhor que outras. Escolha a proporção que melhor se adapta ao seu caso de uso.
Proporções compatíveis e uso pretendido:
Proporção Uso pretendido Resolução da imagem (pixels) Imagem de amostra 1:1
padrão, quadrado, uso geral 1024x1024 (Imagen v.002)
1536x1536 (Imagen 2 v.005, v.006)
1024x1024 (Imagen 3)Prompt: foto aérea de um jantar com massas, foto de estúdio no estilo de capa de uma revista de culinária. 3:4
TV, mídia e filme 1344x1792 (Imagen 2 v.006)
896x1280 (Imagen 3)Prompt: sessão de fotos comercial, anúncio de fragrâncias, frasco aromático de lavanda e baunilha em um fundo de cor clara.. 4:3
TV, mídia e filme 1792x1344 (Imagen 2 v.006)
1280x896 (Imagen 3)Prompt: sessão de fotos comercial, tênis verde e cinza de cano alto, 4K, ângulos dramáticos. 9:16
retrato, objetos altos, dispositivos móveis 1134x2016 (Imagen 2 v.005, v.006)
768x1408 (Imagen 3)Instrução: arranha-céus em Nova York, renderização futurista, conceito, arte digital. 16:9
paisagem 2016x1134 (Imagen 2 v.006)
1408x768 (Imagen 3)Prompt: fotografia da natureza, uma praia no Havaí com o mar ao fundo, o alargamento das lentes, o pôr do sol. Console
Siga as instruções em Gerar imagem com texto para abrir o Vertex AI Studio e inserir seu comando de texto.
No painel Parâmetros, selecione uma proporção no menu Proporção.
Clique em
Gerar.
REST
A proporção é um campo opcional no objeto
parameters
do corpo de uma solicitação JSON.Siga as instruções para gerar imagem com texto para substituir outras variáveis do corpo da solicitação.
Substitua:
- ASPECT_RATIO: string. Opcional. Um parâmetro do modo de geração que controla a proporção. Valores de proporção aceitos e o uso pretendido:
1:1
(padrão, quadrado)3:4
(anúncios, mídias sociais)4:3
(TV, fotografia)16:9
(paisagem)9:16
(retrato)
{ "instances": [ ... ], "parameters": { "sampleCount": IMAGE_COUNT, "aspectRatio": "ASPECT_RATIO" } }
- ASPECT_RATIO: string. Opcional. Um parâmetro do modo de geração que controla a proporção. Valores de proporção aceitos e o uso pretendido:
Siga as instruções para gerar imagem com texto para enviar sua solicitação REST.
Número de resultados
Use o parâmetro de número de resultados para limitar a quantidade de imagens retornadas para cada solicitação (gerar ou editar) enviada.
Console
Siga as instruções em Gerar imagem com texto para abrir o Vertex AI Studio e inserir seu comando de texto.
No painel Parâmetros, selecione um valor inteiro válido no campo Número de resultados.
Clique em
Gerar.
REST
Para mais informações sobre solicitações de modelo
imagegeneration
, consulte a referência da API do modeloimagegeneration
.Número de resultados é um campo no objeto
parameters
de um corpo de solicitação JSON.Siga as instruções para gerar imagem com texto para substituir outras variáveis do corpo da solicitação.
Substitua:
- IMAGE_COUNT: o número de imagens geradas.
Valores inteiros aceitos: 1 a 8 (
imagegeneration@002
), 1 a 4 (todas as outras versões de modelo). Valor padrão: 4.
{ "instances": [ ... ], "parameters": { "sampleCount": IMAGE_COUNT } }
- IMAGE_COUNT: o número de imagens geradas.
Valores inteiros aceitos: 1 a 8 (
Siga as instruções para gerar imagem com texto para enviar sua solicitação REST.
Prompt negativo
Um comando negativo é uma descrição do que você quer omitir nas imagens geradas. Por exemplo, considere a solicitação "uma rua chuvosa da cidade à noite sem pessoas". O modelo pode interpretar "pessoas" como uma diretiva do que incluir em vez de omitir. Para gerar resultados melhores, você pode usar o prompt "uma rua de cidade chuvosa à noite" com um prompt negativo "pessoas".
O Imagen gera essas imagens com e sem um prompt negativo:
Somente prompt de texto
- Prompt de texto: "uma pizza"
Solicitação de texto e prompt negativo
- Prompt de texto: "uma pizza"
- Prompt negativo: "pepperoni"
Console
Siga as instruções em Gerar imagem com texto para abrir o Vertex AI Studio e inserir seu comando de texto.
No painel Parâmetros, insira um prompt negativo no campo Prompt negativo.
Clique em
Gerar.
REST
Para mais informações sobre solicitações de modelo
imagegeneration
, consulte a referência da API do modeloimagegeneration
.O prompt negativo é um campo opcional no objeto
parameters
de um corpo de solicitação JSON.Siga as instruções para gerar imagem com texto para substituir outras variáveis do corpo da solicitação.
Substitua:
- NEGATIVE_PROMPT: um prompt negativo para ajudar a gerar as imagens. Por exemplo: "animais" (remove animais), "desfocado" (deixa a imagem mais clara), "texto" (remove texto) ou "cortado" (remove imagens cortadas).
{ "instances": [ ... ], "parameters": { "sampleCount": IMAGE_COUNT, "negativePrompt": "NEGATIVE_PROMPT" } }
Siga as instruções para gerar imagem com texto para enviar sua solicitação REST.
Número da semente
Um número de semente é aquele que você adiciona a uma solicitação para tornar as imagens geradas determinísticas. Adicionar um número de sugestão com sua solicitação é uma maneira de garantir que você sempre receba as mesmas imagens geradas. Por exemplo, é possível fornecer uma solicitação, definir o número de resultados como 1 e usar um número de sugestão para ter a mesma imagem sempre que usar os mesmos valores de entrada. Se você enviar a mesma solicitação com o número de resultados definido como 8, receberá as mesmas oito imagens. No entanto, as imagens não são retornadas necessariamente na mesma ordem.
Console
Siga as instruções em Gerar imagem com texto para abrir o Vertex AI Studio e inserir seu comando de texto.
No painel Parâmetros, clique na seção expansível
Opções avançadas.No campo Semente, digite um número.
Clique em
Gerar.
REST
Para mais informações sobre solicitações de modelo
imagegeneration
, consulte a referência da API do modeloimagegeneration
.O número original é um campo opcional no objeto
parameters
do corpo de uma solicitação JSON.Siga as instruções para gerar imagem com texto para substituir outras variáveis do corpo da solicitação.
Substitua:
- SEED_NUMBER: número inteiro. Opcional. Qualquer número inteiro não negativo fornecido para tornar as imagens
de saída determinísticas. Fornecer o mesmo número de origem sempre resulta nas mesmas imagens de saída. Se
o modelo que você está usando for compatível com a marca d'água digital, defina
"addWatermark": false
para usar esse campo. Valores inteiros aceitos:1
a2147483647
.
{ "instances": [ ... ], "parameters": { "sampleCount": IMAGE_COUNT, "seed": SEED_NUMBER, // required for model version 006 and greater only when using a seed number "addWatermark": false } }
- SEED_NUMBER: número inteiro. Opcional. Qualquer número inteiro não negativo fornecido para tornar as imagens
de saída determinísticas. Fornecer o mesmo número de origem sempre resulta nas mesmas imagens de saída. Se
o modelo que você está usando for compatível com a marca d'água digital, defina
Siga as instruções para gerar imagem com texto para enviar sua solicitação REST.
Estilo predefinido
O estilo da imagem que você quer gerar. Use esse recurso para criar imagens em estilos conhecidos, como arte digital, aquarela ou cyberpunk.
Console
Siga as instruções em Gerar imagem com texto para abrir o Vertex AI Studio e inserir seu comando de texto.
Na seção Estilo do painel Parâmetros, escolha um estilo no menu.
Clique em
Gerar.
REST
Para mais informações sobre solicitações de modelo
imagegeneration
, consulte a referência da API do modeloimagegeneration
.O estilo predefinido é um campo opcional no objeto
parameters
de um corpo de solicitação JSON.Siga as instruções para gerar imagem com texto para substituir outras variáveis do corpo da solicitação.
Substitua:
- IMAGE_STYLE: um dos estilos predefinidos disponíveis:
photograph
digital_art
landscape
sketch
watercolor
cyberpunk
pop_art
{ "instances": [ ... ], "parameters": { "sampleCount": IMAGE_COUNT, "sampleImageStyle": "IMAGE_STYLE" } }
- IMAGE_STYLE: um dos estilos predefinidos disponíveis:
Siga as instruções para gerar imagem com texto para enviar sua solicitação REST.
Aumentar a resolução de uma imagem
Use o escalonamento vertical para aumentar o tamanho de imagens existentes, geradas ou editadas sem perder a qualidade.
Console
Siga as instruções para gerar imagem com texto.
Selecione a imagem que você quer aumentar.
Clique em
Exportar.Selecione Fazer upgrade das imagens.
Escolha um valor em Fator de escala.
Clique em
Exportar para salvar a imagem ampliada.
REST
Para mais informações sobre solicitações de modelo
imagegeneration
, consulte a referência da API do modeloimagegeneration
.O modo de escalonamento vertical é um campo opcional no objeto
parameters
de um corpo de solicitação JSON. Ao refinar uma imagem usando a API, especifique"mode": "upscale"
eupscaleConfig
.Antes de usar os dados da solicitação abaixo, faça as substituições a seguir:
- LOCATION: a região do seu projeto. Por exemplo,
us-central1
,europe-west2
ouasia-northeast3
. Para uma lista de regiões disponíveis, consulte IA generativa em locais da Vertex AI. - PROJECT_ID: o Google Cloud ID do projeto.
- B64_BASE_IMAGE: a imagem de base que será editada ou aprimorada. A imagem precisa ser especificada como uma string de bytes codificada em base64. Limite de tamanho: 10 MB.
- IMAGE_SOURCE: o local do Cloud Storage da imagem que você quer editar ou aprimorar. Por exemplo,
gs://output-bucket/source-photos/photo.png
. - UPSCALE_FACTOR: opcional. O fator para o qual a imagem será aumentada. Se não for especificado, o fator de luxo será determinado pelo lado maior da imagem de entrada e
sampleImageSize
. Valores disponíveis:x2
oux4
.
Método HTTP e URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@002:predict
Corpo JSON da solicitação:
{ "instances": [ { "prompt": "", "image": { // use one of the following to specify the image to upscale "bytesBase64Encoded": "B64_BASE_IMAGE" "gcsUri": "IMAGE_SOURCE" // end of base image input options }, } ], "parameters": { "sampleCount": 1, "mode": "upscale", "upscaleConfig": { "upscaleFactor": "UPSCALE_FACTOR" } } }
Para enviar a solicitação, escolha uma destas opções:
curl
Salve o corpo da solicitação em um arquivo com o nome
request.json
e execute o comando a seguir:curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@002:predict"PowerShell
Salve o corpo da solicitação em um arquivo com o nome
request.json
e execute o comando a seguir:$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@002:predict" | Select-Object -Expand ContentVocê receberá uma resposta JSON semelhante a esta:
{ "predictions": [ { "mimeType": "image/png", "bytesBase64Encoded": "iVBOR..[base64-encoded-upscaled-image]...YII=" } ] }
A seguir
Confira artigos sobre o Imagen e outras IAs generativas nos produtos da Vertex AI:
- Guia para desenvolvedores sobre como começar a usar o Imagen 3 na Vertex AI
- Novos modelos e ferramentas de mídia generativa criados com criadores para criadores
- Novidades no Gemini: Gems personalizados e geração de imagens aprimorada com o Imagen 3
- Google DeepMind: Imagen 3 — Nosso modelo de qualidade mais alta para conversão de texto em imagem
Exceto em caso de indicação contrária, o conteúdo desta página é licenciado de acordo com a Licença de atribuição 4.0 do Creative Commons, e as amostras de código são licenciadas de acordo com a Licença Apache 2.0. Para mais detalhes, consulte as políticas do site do Google Developers. Java é uma marca registrada da Oracle e/ou afiliadas.
Última atualização 2025-02-15 UTC.