Ausgabeauflösung festlegen

Mit Imagen in Vertex AI können Sie die Ausgaberesolution generierter Bilder festlegen, wenn Sie die folgenden Imagen 4-Modelle verwenden:

  • imagen-4.0-generate-001
  • imagen-4.0-ultra-generate-001

Konsole

  1. Rufen Sie in der Google Cloud Console die Seite Vertex AI > Media Studio auf.

    Zu Media Studio

  2. Klicken Sie auf Imagen. Die Seite zur Bildgenerierung von Imagen Media Studio wird angezeigt.

  3. Passen Sie im Bereich Einstellungen die folgenden Optionen an:

    • Modell: Wählen Sie ein Modell aus den verfügbaren Optionen aus.

      Weitere Informationen zu den verfügbaren Modellen finden Sie unter Imagen-Modelle.

    • Ausgabeauflösung: Wählen Sie eine Ausgabeauflösung aus den verfügbaren Optionen aus.

  4. Geben Sie im Feld Prompt schreiben Ihren Textprompt ein, der die zu generierenden Bilder beschreibt. Beispiel: "small boat on water in the morning watercolor illustration".

  5. Klicken Sie auf Erstellen.

REST

Ersetzen Sie diese Werte in den folgenden Anfragedaten:

  • REGION: Die Region, in der sich Ihr Projekt befindet. Weitere Informationen zu unterstützten Regionen finden Sie unter Generative AI in Vertex AI-Standorten.
  • TEXT_PROMPT: Der Text-Prompt, der zum Generieren von Bildern verwendet werden soll.
  • PROJECT_ID: Ihre Google Cloud -Projekt-ID.
  • MODEL_VERSION: Die zu verwendende Imagen-Modellversion. Die folgenden Werte sind zulässig, wenn Sie sampleImageSize verwenden:
    • imagen-4.0-generate-001
    • imagen-4.0-ultra-generate-001
  • IMAGE_RESOLUTION: Die Auflösung des Ausgabebilds. Folgendes wird akzeptiert:
    • "1K"
    • "2K"

    Die Standardeinstellung ist "1K".

  • IMAGE_COUNT: Die Anzahl der zu generierenden Bilder. Der zulässige Wertebereich liegt zwischen 1 und 4.

HTTP-Methode und URL:

POST https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_VERSION:predict

JSON-Text der Anfrage:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT"
    }
  ],
  "parameters": {
    "sampleImageSize": "IMAGE_RESOLUTION",
    "sampleCount": IMAGE_COUNT
  }
}

Wenn Sie die Anfrage senden möchten, wählen Sie eine der folgenden Optionen aus:

curl

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_VERSION:predict"

PowerShell

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_VERSION:predict" | Select-Object -Expand Content
Bei der Anfrage werden Bildobjekte zurückgegeben. In diesem Beispiel werden zwei Bildobjekte mit zwei Vorhersageobjekten als base64-codierte Bilder zurückgegeben.
{
  "predictions": [
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    },
    {
      "bytesBase64Encoded": "BASE64_IMG_BYTES",
      "mimeType": "image/png"
    }
  ]
}