Questa pagina è stata tradotta dall'API Cloud Translation.

Rimuovere oggetti da un'immagine utilizzando la pittura interna

Questa pagina descrive la rimozione di oggetti da un'immagine. Imagen su Vertex AI ti consente di specificare un'area di maschera, chiamata inpainting, per rimuovere oggetti da un'immagine. Puoi portare la tua maschera oppure lasciare che Imagen su Vertex AI ne generi una per te.

Esempio di rimozione dei contenuti

L'esempio seguente utilizza la pittura di riempimento per rimuovere contenuti da un'immagine esistente utilizzando una maschera immagine:

Input

Immagine di base^* da modificare	Area mascherata specificata utilizzando gli strumenti nella console Google Cloud	Prompt di testo
		Prompt: rimuovi gli oggetti selezionati dall'immagine

^{* Crediti immagine: Inside Weather
su Unsplash.}

Output dopo aver specificato un'area di mascheramento nella console Google Cloud

Un'immagine modificata di esempio mostra il divano e il tappeto nell'esempio di input senza limoni

Visualizza la scheda del modello Imagen per la modifica e la personalizzazione

Prima di iniziare

Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

Enable the Vertex AI API.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the API

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

Enable the Vertex AI API.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the API

Configura l'autenticazione per il tuo ambiente.

Select the tab for how you plan to use the samples on this page:
Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
Java

Per utilizzare gli esempi di Java questa pagina in un ambiente di sviluppo locale, installa e inizializza gcloud CLI, quindi configura le credenziali predefinite dell'applicazione con le tue credenziali utente.
Per saperne di più, consulta Configurare ADC per un ambiente di sviluppo locale nella documentazione sull'autenticazione Google Cloud .
Node.js

Per utilizzare gli esempi di Node.js questa pagina in un ambiente di sviluppo locale, installa e inizializza gcloud CLI, quindi configura le credenziali predefinite dell'applicazione con le tue credenziali utente.
Per saperne di più, consulta Configurare ADC per un ambiente di sviluppo locale nella documentazione sull'autenticazione Google Cloud .
Python

Per utilizzare gli esempi di Python questa pagina in un ambiente di sviluppo locale, installa e inizializza gcloud CLI, quindi configura le credenziali predefinite dell'applicazione con le tue credenziali utente.
Per saperne di più, consulta Configurare ADC per un ambiente di sviluppo locale nella documentazione sull'autenticazione Google Cloud .
REST

Per utilizzare gli esempi di API REST in questa pagina in un ambiente di sviluppo locale, utilizza le credenziali che fornisci a gcloud CLI.
Per saperne di più, consulta Autenticarsi per l'utilizzo di REST nella documentazione sull'autenticazione di Google Cloud .
Rimuovere con un'area della maschera definita

Utilizza i seguenti esempi per specificare l'inpainting per rimuovere i contenuti. In questi esempi, specifichi un'immagine di base, un prompt di testo e un'area della maschera per modificare l'immagine di base.
Imagen 3

Utilizza i seguenti esempi per inviare una richiesta di inpainting utilizzando il modello Imagen 3.

Console

Nella console Google Cloud , vai alla pagina Vertex AI > Media Studio .

Vai a Media Studio

Fai clic su Carica. Nella finestra di dialogo dei file visualizzata, seleziona un file da caricare.

Fai clic su Inpaint.

Nel riquadro Parametri, fai clic su Inpaint (Rimuovi).

Esegui una di queste operazioni:

Caricare la propria maschera:

Crea una maschera sul computer.

Fai clic su Carica maschera. Nella finestra di dialogo visualizzata, seleziona una maschera da caricare.

Definisci la tua maschera:nella barra degli strumenti di modifica, utilizza gli strumenti maschera (casella, pennello o masked_transitionsinversione ) per specificare l'area o le aree a cui aggiungere contenuti.

(Facoltativo) Nel riquadro Parametri, regola le seguenti opzioni:

Modello: il modello Imagen da utilizzare

Numero di risultati: il numero di risultati da generare

Prompt negativo: elementi da evitare di generare

Nel campo del prompt, inserisci un prompt per modificare l'immagine.

Fai clic su Genera.

Python

Installa

pip install --upgrade google-genai

Per saperne di più, consulta la documentazione di riferimento dell'SDK.

Imposta le variabili di ambiente per utilizzare l'SDK Gen AI con Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=us-central1 export GOOGLE_GENAI_USE_VERTEXAI=True

from google import genai from google.genai.types import ( RawReferenceImage, MaskReferenceImage, MaskReferenceConfig, EditImageConfig, ) client = genai.Client() # TODO(developer): Update and un-comment below line # output_file = "output-image.png" raw_ref = RawReferenceImage( reference_image=Image.from_file(location="test_resources/fruit.png"), reference_id=0, ) mask_ref = MaskReferenceImage( reference_id=1, reference_image=Image.from_file(location="test_resources/fruit_mask.png"), config=MaskReferenceConfig( mask_mode="MASK_MODE_USER_PROVIDED", mask_dilation=0.01, ), ) image = client.models.edit_image( model="imagen-3.0-capability-001", prompt="", reference_images=[raw_ref, mask_ref], config=EditImageConfig( edit_mode="EDIT_MODE_INPAINT_REMOVAL", ), ) image.generated_images[0].image.save(output_file) print(f"Created output image using {len(image.generated_images[0].image.image_bytes)} bytes") # Example response: # Created output image using 1234567 bytes

REST

Per saperne di più, consulta il riferimento dell'API Modifica immagini.

Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:

PROJECT_ID: il tuo Google Cloud ID progetto.

LOCATION: la regione del progetto. Ad esempio, us-central1, europe-west2 o asia-northeast3. Per un elenco delle regioni disponibili, consulta Località dell'AI generativa su Vertex AI.

prompt: per risultati ottimali, ometti un prompt e negativePrompt quando utilizzi l'inpainting per la rimozione.

B64_BASE_IMAGE: L'immagine di base da modificare o di cui aumentare la risoluzione. L'immagine deve essere specificata come stringa di byte con codifica base64. Dimensioni massime: 10 MB.

B64_MASK_IMAGE: L'immagine in bianco e nero che vuoi utilizzare come livello maschera per modificare l'immagine originale. L'immagine deve essere specificata come stringa di byte con codifica base64. Dimensioni massime: 10 MB.

MASK_DILATION - float. La percentuale della larghezza dell'immagine in base alla quale dilatare questa maschera. Per compensare le maschere di input imperfette, è consigliabile un valore di 0.01.

EDIT_STEPS - numero intero. Il numero di passaggi di campionamento per il modello di base. Per la rimozione dell'inpainting, inizia con 12 passaggi. Aumenta i passaggi fino al limite superiore di 75 se la qualità non soddisfa i tuoi requisiti. L'aumento dei passaggi aumenta anche la latenza delle richieste.

EDIT_IMAGE_COUNT: il numero di immagini modificate. Valori interi accettati: 1-4. Il valore predefinito è 4.

Metodo HTTP e URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict

Corpo JSON della richiesta:

{ "instances": [ { "prompt": "", "referenceImages": [ { "referenceType": "REFERENCE_TYPE_RAW", "referenceId": 1, "referenceImage": { "bytesBase64Encoded": "B64_BASE_IMAGE" } }, { "referenceType": "REFERENCE_TYPE_MASK", "referenceId": 2, "referenceImage": { "bytesBase64Encoded": "B64_MASK_IMAGE" }, "maskImageConfig": { "maskMode": "MASK_MODE_USER_PROVIDED", "dilation": MASK_DILATION } } ] } ], "parameters": { "editConfig": { "baseSteps": EDIT_STEPS }, "editMode": "EDIT_MODE_INPAINT_REMOVAL", "sampleCount": EDIT_IMAGE_COUNT } }

Per inviare la richiesta, scegli una di queste opzioni:

curl

Nota: il seguente comando presuppone che tu abbia eseguito l'accesso all'interfaccia a riga di comando gcloud con il tuo account utente eseguendo gcloud init o gcloud auth login oppure utilizzando Cloud Shell, che consente di accedere automaticamente all'interfaccia a riga di comando gcloud. Puoi controllare l'account attualmente attivo eseguendo gcloud auth list.

Salva il corpo della richiesta in un file denominato request.json, ed esegui questo comando:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict"

PowerShell

Nota: il comando seguente presuppone che tu abbia eseguito l'accesso all'interfaccia a riga di comando gcloud con il tuo account utente eseguendo gcloud init o gcloud auth login . Puoi controllare l'account attualmente attivo eseguendo gcloud auth list.

Salva il corpo della richiesta in un file denominato request.json, ed esegui questo comando:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict" | Select-Object -Expand Content

La seguente risposta di esempio è per una richiesta con "sampleCount": 2. La risposta restituisce due oggetti di previsione, con i byte dell'immagine generata codificati in base64.

{ "predictions": [ { "bytesBase64Encoded": "BASE64_IMG_BYTES", "mimeType": "image/png" }, { "mimeType": "image/png", "bytesBase64Encoded": "BASE64_IMG_BYTES" } ] }
Imagen 2

Attenzione: a partire dal 24 giugno 2025, le versioni 1 e 2 di Imagen sono deprecate. I modelli Imagen imagegeneration@002, imagegeneration@005 e imagegeneration@006 verranno rimossi il 24 settembre 2025. Per saperne di più sulla migrazione a Imagen 3, consulta la pagina Eseguire la migrazione a Imagen 3.

Utilizza i seguenti esempi per inviare una richiesta di inpainting utilizzando il modello Imagen 2.

Console

Nella console Google Cloud , vai alla pagina Vertex AI > Media Studio .

Vai a Media Studio

Nel riquadro delle attività in basso, fai clic su Modifica immagine.

Fai clic su Carica per selezionare l'immagine del prodotto memorizzata localmente da modificare.

Nella barra degli strumenti di modifica, utilizza gli strumenti di mascheratura (rettangolo, pennello o masked_transitionsinversione) per specificare l'area o le aree da cui rimuovere i contenuti.

Facoltativo. Nel riquadro Parametri, regola Numero di risultati, Prompt negativo (facoltativo per la rimozione), Guida ai prompt di testo o altri parametri.

Lascia vuoto il campo del prompt.

Fai clic su Genera.

REST

Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:

PROJECT_ID: il tuo Google Cloud ID progetto.

LOCATION: la regione del progetto. Ad esempio, us-central1, europe-west2 o asia-northeast3. Per un elenco delle regioni disponibili, consulta Località dell'AI generativa su Vertex AI.

B64_BASE_IMAGE: L'immagine di base da modificare o di cui aumentare la risoluzione. L'immagine deve essere specificata come stringa di byte con codifica base64. Dimensioni massime: 10 MB.

B64_MASK_IMAGE: L'immagine in bianco e nero che vuoi utilizzare come livello maschera per modificare l'immagine originale. L'immagine deve essere specificata come stringa di byte con codifica base64. Dimensioni massime: 10 MB.

EDIT_IMAGE_COUNT: il numero di immagini modificate. Valore predefinito: 4.

Metodo HTTP e URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@006:predict

Corpo JSON della richiesta:

{ "instances": [ { "prompt": "", "image": { "bytesBase64Encoded": "B64_BASE_IMAGE" }, "mask": { "image": { "bytesBase64Encoded": "B64_MASK_IMAGE" } } } ], "parameters": { "sampleCount": EDIT_IMAGE_COUNT, "editConfig": { "editMode": "inpainting-remove" } } }

Per inviare la richiesta, scegli una di queste opzioni:

curl

Nota: il seguente comando presuppone che tu abbia eseguito l'accesso all'interfaccia a riga di comando gcloud con il tuo account utente eseguendo gcloud init o gcloud auth login oppure utilizzando Cloud Shell, che consente di accedere automaticamente all'interfaccia a riga di comando gcloud. Puoi controllare l'account attualmente attivo eseguendo gcloud auth list.

Salva il corpo della richiesta in un file denominato request.json, ed esegui questo comando:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@006:predict"

PowerShell

Nota: il comando seguente presuppone che tu abbia eseguito l'accesso all'interfaccia a riga di comando gcloud con il tuo account utente eseguendo gcloud init o gcloud auth login . Puoi controllare l'account attualmente attivo eseguendo gcloud auth list.

Salva il corpo della richiesta in un file denominato request.json, ed esegui questo comando:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@006:predict" | Select-Object -Expand Content

La seguente risposta di esempio è per una richiesta con "sampleCount": 2. La risposta restituisce due oggetti di previsione, con i byte dell'immagine generata codificati in base64.

{ "predictions": [ { "bytesBase64Encoded": "BASE64_IMG_BYTES", "mimeType": "image/png" }, { "mimeType": "image/png", "bytesBase64Encoded": "BASE64_IMG_BYTES" } ] }

Python

Per scoprire come installare o aggiornare l'SDK Vertex AI Python, consulta Installare l'SDK Vertex AI Python. Per saperne di più, consulta la documentazione di riferimento dell'API Python.

import vertexai from vertexai.preview.vision_models import Image, ImageGenerationModel # TODO(developer): Update and un-comment below lines # PROJECT_ID = "your-project-id" # input_file = "input-image.png" # mask_file = "mask-image.png" # output_file = "outpur-image.png" # prompt = "" # The text prompt describing the entire image. vertexai.init(project=PROJECT_ID, location="us-central1") model = ImageGenerationModel.from_pretrained("imagegeneration@006") base_img = Image.load_from_file(location=input_file) mask_img = Image.load_from_file(location=mask_file) images = model.edit_image( base_image=base_img, mask=mask_img, prompt=prompt, edit_mode="inpainting-remove", # Optional parameters # negative_prompt="", # Describes the object being removed (i.e., "person") ) images[0].save(location=output_file, include_generation_parameters=False) # Optional. View the edited image in a notebook. # images[0].show() print(f"Created output image using {len(images[0]._image_bytes)} bytes") # Example response: # Created output image using 12345678 bytes

Java

Prima di provare questo esempio, segui le istruzioni di configurazione di Java nella guida rapida di Vertex AI per l'utilizzo delle librerie client. Per saperne di più, consulta la documentazione di riferimento dell'API Vertex AI Java.

Per eseguire l'autenticazione in Vertex AI, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.

In questo esempio, specifichi il modello come parte di un EndpointName. EndpointName viene passato al metodo predict, che viene chiamato su un PredictionServiceClient. Il servizio restituisce una versione modificata dell'immagine, che viene poi salvata localmente.

Per ulteriori informazioni sulle versioni e sulle funzionalità dei modelli, vedi Modelli Imagen.

import com.google.api.gax.rpc.ApiException; import com.google.cloud.aiplatform.v1.EndpointName; import com.google.cloud.aiplatform.v1.PredictResponse; import com.google.cloud.aiplatform.v1.PredictionServiceClient; import com.google.cloud.aiplatform.v1.PredictionServiceSettings; import com.google.gson.Gson; import com.google.protobuf.InvalidProtocolBufferException; import com.google.protobuf.Value; import com.google.protobuf.util.JsonFormat; import java.io.IOException; import java.nio.file.Files; import java.nio.file.Path; import java.nio.file.Paths; import java.util.Base64; import java.util.Collections; import java.util.HashMap; import java.util.Map; public class EditImageInpaintingRemoveMaskSample { public static void main(String[] args) throws IOException { // TODO(developer): Replace these variables before running the sample. String projectId = "my-project-id"; String location = "us-central1"; String inputPath = "/path/to/my-input.png"; String maskPath = "/path/to/my-mask.png"; String prompt = ""; // The text prompt describing the entire image. editImageInpaintingRemoveMask(projectId, location, inputPath, maskPath, prompt); } // Edit an image using a mask file. Inpainting can remove an object from the masked area. public static PredictResponse editImageInpaintingRemoveMask( String projectId, String location, String inputPath, String maskPath, String prompt) throws ApiException, IOException { final String endpoint = String.format("%s-aiplatform.googleapis.com:443", location); PredictionServiceSettings predictionServiceSettings = PredictionServiceSettings.newBuilder().setEndpoint(endpoint).build(); // Initialize client that will be used to send requests. This client only needs to be created // once, and can be reused for multiple requests. try (PredictionServiceClient predictionServiceClient = PredictionServiceClient.create(predictionServiceSettings)) { final EndpointName endpointName = EndpointName.ofProjectLocationPublisherModelName( projectId, location, "google", "imagegeneration@006"); // Encode image and mask to Base64 String imageBase64 = Base64.getEncoder().encodeToString(Files.readAllBytes(Paths.get(inputPath))); String maskBase64 = Base64.getEncoder().encodeToString(Files.readAllBytes(Paths.get(maskPath))); // Create the image and image mask maps Map<String, String> imageMap = new HashMap<>(); imageMap.put("bytesBase64Encoded", imageBase64); Map<String, String> maskMap = new HashMap<>(); maskMap.put("bytesBase64Encoded", maskBase64); Map<String, Map> imageMaskMap = new HashMap<>(); imageMaskMap.put("image", maskMap); Map<String, Object> instancesMap = new HashMap<>(); instancesMap.put("prompt", prompt); // [ "prompt", "<my-prompt>" ] instancesMap.put( "image", imageMap); // [ "image", [ "bytesBase64Encoded", "iVBORw0KGgo...==" ] ] instancesMap.put( "mask", imageMaskMap); // [ "mask", [ "image", [ "bytesBase64Encoded", "iJKDF0KGpl...==" ] ] ] instancesMap.put("editMode", "inpainting-remove"); // [ "editMode", "inpainting-remove" ] Value instances = mapToValue(instancesMap); // Optional parameters Map<String, Object> paramsMap = new HashMap<>(); paramsMap.put("sampleCount", 1); Value parameters = mapToValue(paramsMap); PredictResponse predictResponse = predictionServiceClient.predict( endpointName, Collections.singletonList(instances), parameters); for (Value prediction : predictResponse.getPredictionsList()) { Map<String, Value> fieldsMap = prediction.getStructValue().getFieldsMap(); if (fieldsMap.containsKey("bytesBase64Encoded")) { String bytesBase64Encoded = fieldsMap.get("bytesBase64Encoded").getStringValue(); Path tmpPath = Files.createTempFile("imagen-", ".png"); Files.write(tmpPath, Base64.getDecoder().decode(bytesBase64Encoded)); System.out.format("Image file written to: %s\n", tmpPath.toUri()); } } return predictResponse; } } private static Value mapToValue(Map<String, Object> map) throws InvalidProtocolBufferException { Gson gson = new Gson(); String json = gson.toJson(map); Value.Builder builder = Value.newBuilder(); JsonFormat.parser().merge(json, builder); return builder.build(); } }

Node.js

Prima di provare questo esempio, segui le istruzioni di configurazione di Node.js nella guida rapida di Vertex AI per l'utilizzo delle librerie client. Per saperne di più, consulta la documentazione di riferimento dell'API Vertex AI Node.js.

Per eseguire l'autenticazione in Vertex AI, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
In questo esempio, chiami il metodo predict su un PredictionServiceClient. Il servizio genera immagini che vengono poi salvate localmente. Per ulteriori informazioni sulle versioni e sulle funzionalità dei modelli, vedi Modelli Imagen.

/** * TODO(developer): Update these variables before running the sample. */ const projectId = process.env.CAIP_PROJECT_ID; const location = 'us-central1'; const inputFile = 'resources/volleyball_game.png'; const maskFile = 'resources/volleyball_game_inpainting_remove_mask.png'; const prompt = 'volleyball game'; const aiplatform = require('@google-cloud/aiplatform'); // Imports the Google Cloud Prediction Service Client library const {PredictionServiceClient} = aiplatform.v1; // Import the helper module for converting arbitrary protobuf.Value objects const {helpers} = aiplatform; // Specifies the location of the api endpoint const clientOptions = { apiEndpoint: `${location}-aiplatform.googleapis.com`, }; // Instantiates a client const predictionServiceClient = new PredictionServiceClient(clientOptions); async function editImageInpaintingRemoveMask() { const fs = require('fs'); const util = require('util'); // Configure the parent resource const endpoint = `projects/${projectId}/locations/${location}/publishers/google/models/imagegeneration@006`; const imageFile = fs.readFileSync(inputFile); // Convert the image data to a Buffer and base64 encode it. const encodedImage = Buffer.from(imageFile).toString('base64'); const maskImageFile = fs.readFileSync(maskFile); // Convert the image mask data to a Buffer and base64 encode it. const encodedMask = Buffer.from(maskImageFile).toString('base64'); const promptObj = { prompt: prompt, // The text prompt describing the entire image editMode: 'inpainting-remove', image: { bytesBase64Encoded: encodedImage, }, mask: { image: { bytesBase64Encoded: encodedMask, }, }, }; const instanceValue = helpers.toValue(promptObj); const instances = [instanceValue]; const parameter = { // Optional parameters seed: 100, // Controls the strength of the prompt // 0-9 (low strength), 10-20 (medium strength), 21+ (high strength) guidanceScale: 21, sampleCount: 1, }; const parameters = helpers.toValue(parameter); const request = { endpoint, instances, parameters, }; // Predict request const [response] = await predictionServiceClient.predict(request); const predictions = response.predictions; if (predictions.length === 0) { console.log( 'No image was generated. Check the request parameters and prompt.' ); } else { let i = 1; for (const prediction of predictions) { const buff = Buffer.from( prediction.structValue.fields.bytesBase64Encoded.stringValue, 'base64' ); // Write image content to the output file const writeFile = util.promisify(fs.writeFile); const filename = `output${i}.png`; await writeFile(filename, buff); console.log(`Saved image ${filename}`); i++; } } } await editImageInpaintingRemoveMask();
Rimuovere con il rilevamento automatico della maschera

Utilizza i seguenti esempi per specificare l'inpainting per rimuovere i contenuti. In questi esempi specifichi un'immagine di base e un prompt di testo. Imagen rileva e crea automaticamente un'area della maschera per modificare l'immagine di base.
Imagen 3

Utilizza i seguenti esempi per inviare una richiesta di inpainting utilizzando il modello Imagen 3.

Console

Nella console Google Cloud , vai alla pagina Vertex AI > Media Studio .

Vai a Media Studio

Fai clic su Carica. Nella finestra di dialogo dei file visualizzata, seleziona un file da caricare.

Fai clic su Inpaint.

Nel riquadro Parametri, seleziona Inpaint (Remove).

Nella barra degli strumenti di modifica, fai clic su background_replaceEstrai.

Seleziona una delle opzioni di estrazione della maschera:

Elementi di sfondo: rileva gli elementi di sfondo e crea una maschera intorno a loro.

Elementi in primo piano: rileva gli oggetti in primo piano e crea una maschera intorno a loro.

background_replacePeople: rileva le persone e crea una maschera intorno a loro.

(Facoltativo) Nel riquadro Parametri, regola le seguenti opzioni:

Modello: il modello Imagen da utilizzare

Numero di risultati: il numero di risultati da generare

Prompt negativo: elementi da evitare di generare

Nel campo del prompt, inserisci un nuovo prompt per modificare l'immagine.

Fai clic su InviaGenera.

Python

Installa

pip install --upgrade google-genai

Per saperne di più, consulta la documentazione di riferimento dell'SDK.

Imposta le variabili di ambiente per utilizzare l'SDK Gen AI con Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=us-central1 export GOOGLE_GENAI_USE_VERTEXAI=True

from google import genai from google.genai.types import ( RawReferenceImage, MaskReferenceImage, MaskReferenceConfig, EditImageConfig, ) client = genai.Client() # TODO(developer): Update and un-comment below line # output_file = "output-image.png" raw_ref = RawReferenceImage( reference_image=Image.from_file(location="test_resources/fruit.png"), reference_id=0, ) mask_ref = MaskReferenceImage( reference_id=1, reference_image=None, config=MaskReferenceConfig( mask_mode="MASK_MODE_FOREGROUND", ), ) image = client.models.edit_image( model="imagen-3.0-capability-001", prompt="", reference_images=[raw_ref, mask_ref], config=EditImageConfig( edit_mode="EDIT_MODE_INPAINT_REMOVAL", ), ) image.generated_images[0].image.save(output_file) print(f"Created output image using {len(image.generated_images[0].image.image_bytes)} bytes") # Example response: # Created output image using 1234567 bytes

REST

Per saperne di più, consulta il riferimento dell'API Modifica immagini.

Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:

PROJECT_ID: il tuo Google Cloud ID progetto.

LOCATION: la regione del progetto. Ad esempio, us-central1, europe-west2 o asia-northeast3. Per un elenco delle regioni disponibili, consulta Località dell'AI generativa su Vertex AI.

prompt: per risultati ottimali, ometti un prompt e negativePrompt quando utilizzi l'inpainting per la rimozione.

B64_BASE_IMAGE: L'immagine di base da modificare o di cui aumentare la risoluzione. L'immagine deve essere specificata come stringa di byte con codifica base64. Dimensioni massime: 10 MB.

MASK_MODE: una stringa che imposta il tipo di creazione automatica della maschera utilizzata dal modello. Valori disponibili:

MASK_MODE_BACKGROUND: genera automaticamente una maschera utilizzando la segmentazione dello sfondo. Utilizza questa impostazione per modificare i contenuti in background.

MASK_MODE_FOREGROUND: genera automaticamente una maschera utilizzando la segmentazione in primo piano. Utilizza questa impostazione per modificare i contenuti in primo piano, ad esempio rimuovendo questi oggetti in primo piano (rimozione tramite inpainting).

MASK_MODE_SEMANTIC: genera automaticamente una maschera utilizzando la segmentazione semantica in base alle classi di segmentazione specificate nell'array maskImageConfig.maskClasses. Ad esempio:
"maskImageConfig": { "maskMode": "MASK_MODE_SEMANTIC", "maskClasses": [175, 176], // bicycle, car "dilation": 0.01 }

MASK_DILATION - float. La percentuale della larghezza dell'immagine in base alla quale dilatare questa maschera. Per compensare le maschere di input imperfette, è consigliabile un valore di 0.01.

EDIT_STEPS - numero intero. Il numero di passaggi di campionamento per il modello di base. Per la rimozione dell'inpainting, inizia con 12 passaggi. Aumenta i passaggi fino al limite superiore di 75 se la qualità non soddisfa i tuoi requisiti. L'aumento dei passaggi aumenta anche la latenza delle richieste.

EDIT_IMAGE_COUNT: il numero di immagini modificate. Valori interi accettati: 1-4. Il valore predefinito è 4.

Metodo HTTP e URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict

Corpo JSON della richiesta:

{ "instances": [ { "prompt": "", "referenceImages": [ { "referenceType": "REFERENCE_TYPE_RAW", "referenceId": 1, "referenceImage": { "bytesBase64Encoded": "B64_BASE_IMAGE" } }, { "referenceType": "REFERENCE_TYPE_MASK", "referenceId": 2, "maskImageConfig": { "maskMode": "MASK_MODE", "dilation": MASK_DILATION } } ] } ], "parameters": { "editConfig": { "baseSteps": EDIT_STEPS }, "editMode": "EDIT_MODE_INPAINT_REMOVAL", "sampleCount": EDIT_IMAGE_COUNT } }

Per inviare la richiesta, scegli una di queste opzioni:

curl

Nota: il seguente comando presuppone che tu abbia eseguito l'accesso all'interfaccia a riga di comando gcloud con il tuo account utente eseguendo gcloud init o gcloud auth login oppure utilizzando Cloud Shell, che consente di accedere automaticamente all'interfaccia a riga di comando gcloud. Puoi controllare l'account attualmente attivo eseguendo gcloud auth list.

Salva il corpo della richiesta in un file denominato request.json, ed esegui questo comando:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict"

PowerShell

Nota: il comando seguente presuppone che tu abbia eseguito l'accesso all'interfaccia a riga di comando gcloud con il tuo account utente eseguendo gcloud init o gcloud auth login . Puoi controllare l'account attualmente attivo eseguendo gcloud auth list.

Salva il corpo della richiesta in un file denominato request.json, ed esegui questo comando:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict" | Select-Object -Expand Content

La seguente risposta di esempio è per una richiesta con "sampleCount": 2. La risposta restituisce due oggetti di previsione, con i byte dell'immagine generata codificati in base64.

{ "predictions": [ { "bytesBase64Encoded": "BASE64_IMG_BYTES", "mimeType": "image/png" }, { "mimeType": "image/png", "bytesBase64Encoded": "BASE64_IMG_BYTES" } ] }
Imagen 2

Attenzione: a partire dal 24 giugno 2025, le versioni 1 e 2 di Imagen sono deprecate. I modelli Imagen imagegeneration@002, imagegeneration@005 e imagegeneration@006 verranno rimossi il 24 settembre 2025. Per saperne di più sulla migrazione a Imagen 3, consulta la pagina Eseguire la migrazione a Imagen 3.

Utilizza i seguenti esempi per inviare una richiesta di inpainting utilizzando il modello Imagen 2.

Console

Nella console Google Cloud , vai alla pagina Vertex AI > Media Studio .

Vai a Media Studio

Nel riquadro delle attività in basso, fai clic su Modifica immagine.

Fai clic su Carica per selezionare l'immagine del prodotto memorizzata localmente da modificare.

Nella barra degli strumenti di modifica, fai clic su background_replace Estrai.

Seleziona una delle opzioni di estrazione della maschera:

Elementi di sfondo: rileva gli elementi di sfondo e crea una maschera intorno a loro.

Elementi in primo piano - Rileva gli oggetti in primo piano e crea una maschera intorno a loro.

background_replace People: rileva le persone e crea una maschera intorno a loro.

Facoltativo. Nel riquadro Parametri, regola Numero di risultati, Prompt negativo, Guida al prompt di testo o altri parametri.

Lascia vuoto il campo del prompt.

Fai clic su Genera.

REST

Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:

PROJECT_ID: il tuo Google Cloud ID progetto.

LOCATION: la regione del progetto. Ad esempio, us-central1, europe-west2 o asia-northeast3. Per un elenco delle regioni disponibili, consulta Località dell'AI generativa su Vertex AI.

B64_BASE_IMAGE: L'immagine di base da modificare o di cui aumentare la risoluzione. L'immagine deve essere specificata come stringa di byte con codifica base64. Dimensioni massime: 10 MB.

EDIT_IMAGE_COUNT: il numero di immagini modificate. Valore predefinito: 4.

MASK_TYPE: chiede al modello di generare una maschera invece di doverne fornire una. Di conseguenza, quando fornisci questo parametro, devi omettere un oggetto mask. Valori disponibili:

background: genera automaticamente una maschera per tutte le regioni, ad eccezione dell'oggetto, della persona o del soggetto principale dell'immagine.

foreground: genera automaticamente una maschera per l'oggetto, la persona o il soggetto principale dell'immagine.

semantic: utilizza la segmentazione automatica per creare un'area di maschera per una o più classi di segmentazione. Imposta le classi di segmentazione utilizzando il parametro classes e i valori class_id corrispondenti. Puoi specificare fino a 5 classi. Quando utilizzi il tipo di maschera semantica, l'oggetto maskMode dovrebbe avere il seguente aspetto:
"maskMode": { "maskType": "semantic", "classes": [class_id1, class_id2] }

Metodo HTTP e URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@006:predict

Corpo JSON della richiesta:

{ "instances": [ { "prompt": "", "image": { "bytesBase64Encoded": "B64_BASE_IMAGE" } } ], "parameters": { "sampleCount": EDIT_IMAGE_COUNT, "editConfig": { "editMode": "inpainting-remove", "maskMode": { "maskType": "MASK_TYPE" } } } }

Per inviare la richiesta, scegli una di queste opzioni:

curl

Nota: il seguente comando presuppone che tu abbia eseguito l'accesso all'interfaccia a riga di comando gcloud con il tuo account utente eseguendo gcloud init o gcloud auth login oppure utilizzando Cloud Shell, che consente di accedere automaticamente all'interfaccia a riga di comando gcloud. Puoi controllare l'account attualmente attivo eseguendo gcloud auth list.

Salva il corpo della richiesta in un file denominato request.json, ed esegui questo comando:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@006:predict"

PowerShell

Nota: il comando seguente presuppone che tu abbia eseguito l'accesso all'interfaccia a riga di comando gcloud con il tuo account utente eseguendo gcloud init o gcloud auth login . Puoi controllare l'account attualmente attivo eseguendo gcloud auth list.

Salva il corpo della richiesta in un file denominato request.json, ed esegui questo comando:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@006:predict" | Select-Object -Expand Content

La seguente risposta di esempio è per una richiesta con "sampleCount": 2. La risposta restituisce due oggetti di previsione, con i byte dell'immagine generata codificati in base64.

{ "predictions": [ { "bytesBase64Encoded": "BASE64_IMG_BYTES", "mimeType": "image/png" }, { "mimeType": "image/png", "bytesBase64Encoded": "BASE64_IMG_BYTES" } ] }

Python

Per scoprire come installare o aggiornare l'SDK Vertex AI Python, consulta Installare l'SDK Vertex AI Python. Per saperne di più, consulta la documentazione di riferimento dell'API Python.

import vertexai from vertexai.preview.vision_models import Image, ImageGenerationModel # TODO(developer): Update and un-comment below lines # PROJECT_ID = "your-project-id" # input_file = "input-image.png" # mask_mode = "foreground" # 'background', 'foreground', or 'semantic' # output_file = "output-image.png" # prompt = "sports car" # The text prompt describing what you want to see in the edited image. vertexai.init(project=PROJECT_ID, location="us-central1") model = ImageGenerationModel.from_pretrained("imagegeneration@006") base_img = Image.load_from_file(location=input_file) images = model.edit_image( base_image=base_img, mask_mode=mask_mode, prompt=prompt, edit_mode="inpainting-remove", ) images[0].save(location=output_file, include_generation_parameters=False) # Optional. View the edited image in a notebook. # images[0].show() print(f"Created output image using {len(images[0]._image_bytes)} bytes") # Example response: # Created output image using 1279948 bytes
Limitazioni

Le sezioni seguenti spiegano le limitazioni della funzionalità di rimozione degli oggetti di Imagen.

Pixel modificati

Non è garantito che i pixel generati dal modello che non si trovano nella maschera siano identici all'input e vengono generati alla risoluzione del modello (ad esempio 1024 x 1024). Nell'immagine generata potrebbero essere presenti modifiche minime.

Se vuoi una conservazione perfetta dell'immagine, ti consigliamo di unire l'immagine generata con l'immagine di input utilizzando la maschera. In genere, se la risoluzione dell'immagine di input è 2K o superiore, è necessario combinare l'immagine generata e l'immagine di input.

Limitazione della rimozione

Potrebbero essere rimossi anche alcuni piccoli oggetti adiacenti alle maschere. Come best practice, ti consigliamo di rendere la maschera il più precisa possibile.

La rimozione di aree di grandi dimensioni nelle regioni del cielo delle immagini esterne potrebbe comportare artefatti indesiderati. Come best practice, ti consigliamo di fornire un prompt.

Passaggi successivi

Leggi gli articoli su Imagen e altri prodotti di AI generativa su Vertex AI:

Rimuovere oggetti da un'immagine utilizzando la pittura interna

Esempio di rimozione dei contenuti

Prima di iniziare

Console

Java

Node.js

Python

REST

Rimuovere con un'area della maschera definita

Imagen 3

Console

Python

Installa

REST

curl

PowerShell

Imagen 2

Console

REST

curl

PowerShell

Python

Java

Node.js

Rimuovere con il rilevamento automatico della maschera

Imagen 3

Console

Python

Installa

REST

curl

PowerShell

Imagen 2

Console

REST

curl

PowerShell

Python

Limitazioni

Pixel modificati

Limitazione della rimozione

Passaggi successivi