Veo on Vertex AI Video Generation API

Veo ist der Name des Modells, das die Videogenerierung unterstützt. Veo generiert ein Video aus einem von Ihnen bereitgestellten Text- oder Bild-Prompt. Weitere Informationen zu Veo finden Sie unter Veo-Videoerstellung – Übersicht.

Weitere Informationen zu diesem Modell finden Sie in der Console auf der Video Generation-Modellkarte in Model Garden.

Veo in Vertex AI (Vertex AI Studio) ausprobieren

Veo in einem Colab ausprobieren

Unterstützte Modelle

Die Veo API unterstützt die folgenden Modelle:

HTTP-Anfrage

curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:predictLongRunning \

-d '{
  "instances": [
    {
      "prompt": string,
      "image": {
        // Union field can be only one of the following:
        "bytesBase64Encoded": string,
        "gcsUri": string,
        // End of list of possible types for union field.
        "mimeType": string
      },
      "lastFrame": {
        // Union field can be only one of the following:
        "bytesBase64Encoded": string,
        "gcsUri": string,
        // End of list of possible types for union field.
        "mimeType": string
      },
      "video": {
        // Union field can be only one of the following:
        "bytesBase64Encoded": string,
        "gcsUri": string,
        // End of list of possible types for union field.
        "mimeType": string
      },
      "referenceImages": [
        // A list of up to three asset images or at most one style image for the
        // model to use when generating videos.
        //
        // referenceImages is supported by veo-2.0-generate-exp in Preview
        {
        "image:" {
          // Union field can be only one of the following:
          "bytesBase64Encoded": string,
          "gcsUri": string,
          // End of list of possible types for union field.
          "mimeType": string
        },
        "referenceType": string
        }
      ]
    }
  ],
  "parameters": {
    "aspectRatio": string,
    "compressionQuality": string,
    "durationSeconds": integer,
    "enhancePrompt": boolean,
    "generateAudio": boolean,
    "negativePrompt": string,
    "personGeneration": string,
    "resolution": string, // Veo 3 models only
    "sampleCount": integer,
    "seed": uint32,
    "storageUri": string
  }
}'

Instanzen

Instanzen

prompt

string

Für Text-zu-Video erforderlich.
 Optional, wenn ein Eingabe-Bild-Prompt angegeben wird (Bild-zu-Video).

Ein Textstring, der die ersten acht Sekunden des Videos beschreibt. Zum Beispiel:

  • Eine schnelle Kamerafahrt durch eine geschäftige dystopische Stadt mit hellen Neonschildern, fliegenden Autos und Nebel, Nacht, Lens Flare, volumetrischer Beleuchtung
  • Ein Neonhologramm eines Autos, das mit Höchstgeschwindigkeit fährt, Lichtgeschwindigkeit, cinematisch, unglaubliche Details, volumetrische Beleuchtung
  • Viele gepunktete Quallen pulsieren unter Wasser. Ihre Körper sind durchsichtig und leuchten im tiefen Ozean.
  • Extremes Close-up mit geringer Schärfentiefe einer Pfütze auf einer Straße, die eine belebte, futuristische Stadt Tokio mit hellen Neonschildern bei Nacht und Lens Flare widerspiegelt
  • Zeitrafferaufnahme von Nordlichtern, die über den arktischen Himmel tanzen, Sterne, die funkeln, schneebedeckte Landschaft
  • Ein einsamer Cowboy reitet bei einem wunderschönen Sonnenuntergang mit seinem Pferd über eine offene Ebene, weiches Licht, warme Farben
image

Union-Feld

Optional. Ein Bild, das als Grundlage für die Videogenerierung dient. Es kann entweder ein bytesBase64Encoded-String sein, der ein Bild codiert, oder ein gcsUri-String-URI zu einem Cloud Storage-Bucket-Speicherort.

lastFrame

Union-Feld

Optional. Ein Bild des ersten Frames eines Videos, um den Zwischenraum zu füllen. lastFrame kann entweder ein bytesBase64Encoded-String sein, der ein Bild codiert, oder ein gcsUri-String-URI zu einem Cloud Storage-Bucket-Speicherort.

lastFrame wird nur von veo-2.0-generate-001 unterstützt.

video

Union-Feld

Optional. Ein von Veo generiertes Video, das verlängert werden soll. Dabei kann es sich entweder um einen bytesBase64Encoded-String, der ein Video codiert, oder um einen gcsUri-String-URI für einen Cloud Storage-Bucket-Standort handeln.

video wird nur von veo-2.0-generate-001 unterstützt.

referenceImages

list[referenceImages]

Optional. Eine Liste mit bis zu drei Asset-Bildern oder höchstens einem Stilbild, die den referenceImages beschreiben, den das Modell beim Generieren von Videos verwenden soll.

referenceImages wird von veo-2.0-generate-exp in der Vorschau unterstützt.

referenceImages.image

Union-Feld

Optional. Enthält die Referenzbilder für veo-2.0-generate-exp, die als Eingabe für das Motiv verwendet werden sollen. Jedes Bild kann entweder ein bytesBase64Encoded-String sein, der ein Bild codiert, oder ein gcsUri-String-URI für einen Cloud Storage-Bucket-Speicherort.

referenceImages.referenceType

string

Erforderlich in einem referenceImages-Objekt. Gibt den Typ des bereitgestellten Referenzbilds an. Folgende Werte werden unterstützt:

  • "asset": Das Referenzbild enthält Assets für das generierte Video, z. B. die Szene, ein Objekt oder eine Figur.
  • "style": Das Referenzbild enthält Stilinformationen für die generierten Videos, z. B. Szenenfarben, Beleuchtung oder Textur.
bytesBase64Encoded

string

Ein Base64-codierter String einer Bild- oder Videodatei in Bytes. Wird mit den folgenden Objekten verwendet:

gcsUri

string

Ein String-URI für einen Cloud Storage-Bucket-Speicherort. Wird mit den folgenden Objekten verwendet:

mimeType

string

Erforderlich für die folgenden Objekte:

Gibt den MIME-Typ eines Videos oder Bildes an.

Für Bilder werden die folgenden MIME-Typen akzeptiert:

  • image/jpeg
  • image/png

Für Videos werden die folgenden MIME-Typen akzeptiert:

  • video/mp4

Parameter

Parameter
aspectRatio

string

Optional. Gibt das Seitenverhältnis der generierten Videos an. Folgende Werte sind zulässig:

  • 16:9 (Standardwert)
  • 9:16
compressionQuality

string

Optional. Gibt die Komprimierungsqualität der generierten Videos an. Die zulässigen Werte sind "optimized" oder "lossless".

Der Standardwert ist "optimized".

durationSeconds

integer

Erforderlich. Die Länge der Videodateien, die Sie generieren möchten, in Sekunden.

Folgende Werte sind zulässig:

  • veo-2.0-generate-001: 58. Der Standardwert ist 8.
  • veo-3.0-generate-preview: 8.
  • Bei Verwendung von referenceImages: 8.
enhancePrompt

boolean

Optional. Gemini verwenden, um Prompts zu optimieren Zulässige Werte sind true oder false. Der Standardwert ist true.

enhancePrompt wird von veo-3.0-generate-001 oder veo-3.0-fast-generate-001 nicht unterstützt.

generateAudio

boolean

Erforderlich für veo-3.0-generate-preview. Audio für das Video generieren Zulässige Werte sind true oder false.

generateAudio wird von veo-2.0-generate-001 oder veo-2.0-generate-exp nicht unterstützt.

negativePrompt

string

Optional. Ein Textstring, der beschreibt, was das Modell nicht generieren soll. Beispiel:

  • Deckenbeleuchtung, helle Farben
  • Personen, Tiere
  • mehrere Autos, Wind
personGeneration

string

Optional. Die Sicherheitseinstellung, die bestimmt, ob die Generierung von Personen oder Gesichtern zulässig ist. Eines der folgenden Betriebssysteme:

  • allow_adult (Standardwert): Es dürfen nur Erwachsene generiert werden.
  • dont_allow: Das Einfügen von Personen/Gesichtern in Bilder wird nicht zugelassen.
resolution

string

Optional. Nur Veo 3-Modelle: Die Auflösung des generierten Videos. Zulässige Werte sind 720p (Standard) oder 1080p.

sampleCount

int

Optional. Die Anzahl der angeforderten Ausgabevideos. Zulässige Werte sind 14.

seed

uint32

Optional. Eine Zahl, die Sie einer Anfrage hinzufügen, um generierte Videos deterministisch zu machen. Wenn Sie Ihrer Anfrage eine Quell-Nummer hinzufügen, ohne andere Parameter zu ändern, generiert das Modell dieselben Videos.

Der akzeptierte Bereich liegt zwischen 0 und 4,294,967,295.

storageUri

string

Optional. Ein Cloud Storage-Bucket-URI zum Speichern des Ausgabevideos im Format gs://BUCKET_NAME/SUBDIRECTORY. Wenn kein Cloud Storage-Bucket angegeben wird, werden Base64-codierte Videobytes in der Antwort zurückgegeben.

Beispielanforderungen

Anhand der folgenden Beispiele können Sie Ihre eigene Videoanfrage erstellen:

Antrag auf Generierung von Videos aus Text

REST

Senden Sie zum Testen eines Text-Prompts mit der Vertex AI Veo API eine POST-Anfrage an den Endpunkt des Publisher-Modells.

Ersetzen Sie diese Werte in den folgenden Anfragedaten:

  • PROJECT_ID: Ein String, der Ihre Google Cloud -Projekt-ID darstellt.
  • MODEL_ID: Ein String, der die zu verwendende Modell-ID darstellt. Folgende Werte sind zulässig:
    • "veo-2.0-generate-001"
    • "veo-3.0-generate-001"
    • "veo-3.0-fast-generate-001"
    • "veo-3.0-generate-preview" (Vorschau)
    • "veo-3.0-fast-generate-preview" (Vorschau)
  • TEXT_PROMPT: Der Text-Prompt, der zur Steuerung der Videogenerierung verwendet wird.
  • OUTPUT_STORAGE_URI: Optional: Ein String, der den Cloud Storage-Bucket darstellt, in dem die Ausgabevideos gespeichert werden sollen. Wenn nicht angegeben, werden Videobyte in der Antwort zurückgegeben. Beispiel: "gs://video-bucket/output/".
  • RESPONSE_COUNT: Die Anzahl der zu generierenden Videodateien. Der akzeptierte Wertebereich ist 14.
  • DURATION: Eine Ganzzahl, die die Länge der generierten Videodateien angibt. Die folgenden Werte sind für die einzelnen Modelle zulässig:
    • Veo 2-Modelle: 58
    • Veo 3-Modelle: 8
  • Zusätzliche optionale Parameter

    Je nach Anwendungsfall können Sie die folgenden optionalen Variablen verwenden. Fügen Sie dem "parameters": {}-Objekt einige oder alle der folgenden Parameter hinzu.

    "parameters": {
      "aspectRatio": "ASPECT_RATIO",
      "negativePrompt": "NEGATIVE_PROMPT",
      "personGeneration": "PERSON_SAFETY_SETTING",
      // "resolution": RESOLUTION, // Veo 3 models only
      "sampleCount": RESPONSE_COUNT,
      "seed": SEED_NUMBER
    }
    • ASPECT_RATIO: Optional: Ein Stringwert, der das Seitenverhältnis der generierten Videos beschreibt. Sie können die folgenden Werte verwenden:
      • "16:9" für Landschaft
      • "9:16" für Hochformat

      Der Standardwert ist "16:9".

    • NEGATIVE_PROMPT (optional): Ein Stringwert, der Inhalte beschreibt, die das Modell nicht generieren soll.
    • PERSON_SAFETY_SETTING: Optional: Ein Stringwert, der die Sicherheitseinstellung für die Generierung von Personen oder Gesichtern steuert. Sie können die folgenden Werte verwenden:
      • "allow_adult": Nur Generierung von Erwachsenen und Gesichtern zulassen.
      • "disallow": Es werden keine Personen oder Gesichter generiert.

      Der Standardwert ist "allow_adult".

    • RESOLUTION: Optional: Ein Stringwert, der die Auflösung des generierten Videos steuert. Wird nur von Veo 3-Modellen unterstützt. Sie können die folgenden Werte verwenden:
      • "720p"
      • "1080p"

      Der Standardwert ist "720p".

    • RESPONSE_COUNT: Optional. Ein Ganzzahlwert, der die Anzahl der zu generierenden Videos angibt. Der akzeptierte Wertebereich ist 14.
    • SEED_NUMBER: Optional. Ein uint32-Wert, den das Modell zum Generieren deterministischer Videos verwendet. Wenn Sie eine Quell-Nummer in Ihrer Anfrage angeben, ohne andere Parameter zu ändern, wird das Modell angewiesen, dieselben Videos zu erstellen. Der akzeptierte Wertebereich ist 04294967295.

HTTP-Methode und URL:

POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:predictLongRunning

JSON-Text der Anfrage:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT"
    }
  ],
  "parameters": {
    "storageUri": "OUTPUT_STORAGE_URI",
    "sampleCount": "RESPONSE_COUNT"
  }
}

Wenn Sie die Anfrage senden möchten, wählen Sie eine der folgenden Optionen aus:

curl

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:predictLongRunning"

PowerShell

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:predictLongRunning" | Select-Object -Expand Content
Diese Anfrage gibt einen vollständigen Vorgangsnamen mit einer eindeutigen Vorgangs-ID zurück. Verwenden Sie diesen vollständigen Vorgangsnamen, um den Status der Videogenerierungsanfrage abzurufen.
{
  "name": "projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID/operations/a1b07c8e-7b5a-4aba-bb34-3e1ccb8afcc8"
}

Antrag auf Bild-zu-Video-Generierung

REST

Senden Sie zum Testen eines Text-Prompts mit der Vertex AI Veo API eine POST-Anfrage an den Endpunkt des Publisher-Modells.

Ersetzen Sie diese Werte in den folgenden Anfragedaten:

  • PROJECT_ID: Ein String, der Ihre Google Cloud -Projekt-ID darstellt.
  • MODEL_ID: Ein String, der die zu verwendende Modell-ID darstellt. Folgende Werte sind zulässig:
    • veo-2.0-generate-001 (GA)
    • veo-3.0-generate-preview (Vorschau)
  • TEXT_PROMPT: Der Text-Prompt, der zur Steuerung der Videogenerierung verwendet wird.
  • INPUT_IMAGE: Ein base64-codierter String, der das Eingabebild darstellt. Für eine optimale Qualität sollte das Eingabebild eine Auflösung von mindestens 720p (1.280 × 720 Pixel) und ein Seitenverhältnis von 16:9 oder 9:16 haben. Bilder mit anderen Seitenverhältnissen oder Größen können beim Hochladen in der Größe angepasst oder mittig zugeschnitten werden.
  • MIME_TYPE: Ein String, der den MIME-Typ des Eingabebilds darstellt. Es werden nur Bilder mit den folgenden MIME-Typen unterstützt:
    • "image/jpeg"
    • "image/png"
  • OUTPUT_STORAGE_URI: Optional: Ein String, der den Cloud Storage-Bucket darstellt, in dem die Ausgabevideos gespeichert werden sollen. Wenn nicht angegeben, werden Videobyte in der Antwort zurückgegeben. Beispiel: "gs://video-bucket/output/".
  • RESPONSE_COUNT: Die Anzahl der zu generierenden Videodateien. Der akzeptierte Wertebereich ist 14.
  • DURATION: Eine Ganzzahl, die die Länge der generierten Videodateien angibt. Die folgenden Werte sind für die einzelnen Modelle zulässig:
    • Veo 2-Modelle: 58
    • Veo 3-Modelle: 8
  • Zusätzliche optionale Parameter

    Je nach Anwendungsfall können Sie die folgenden optionalen Variablen verwenden. Fügen Sie dem "parameters": {}-Objekt einige oder alle der folgenden Parameter hinzu.

    "parameters": {
      "aspectRatio": "ASPECT_RATIO",
      "negativePrompt": "NEGATIVE_PROMPT",
      "personGeneration": "PERSON_SAFETY_SETTING",
      // "resolution": RESOLUTION, // Veo 3 models only
      "sampleCount": RESPONSE_COUNT,
      "seed": SEED_NUMBER
    }
    • ASPECT_RATIO: Optional: Ein Stringwert, der das Seitenverhältnis der generierten Videos beschreibt. Sie können die folgenden Werte verwenden:
      • "16:9" für Landschaft
      • "9:16" für Hochformat

      Der Standardwert ist "16:9".

    • NEGATIVE_PROMPT (optional): Ein Stringwert, der Inhalte beschreibt, die das Modell nicht generieren soll.
    • PERSON_SAFETY_SETTING: Optional: Ein Stringwert, der die Sicherheitseinstellung für die Generierung von Personen oder Gesichtern steuert. Sie können die folgenden Werte verwenden:
      • "allow_adult": Nur Generierung von Erwachsenen und Gesichtern zulassen.
      • "disallow": Es werden keine Personen oder Gesichter generiert.

      Der Standardwert ist "allow_adult".

    • RESOLUTION: Optional: Ein Stringwert, der die Auflösung des generierten Videos steuert. Wird nur von Veo 3-Modellen unterstützt. Sie können die folgenden Werte verwenden:
      • "720p"
      • "1080p"

      Der Standardwert ist "720p".

    • RESPONSE_COUNT: Optional. Ein Ganzzahlwert, der die Anzahl der zu generierenden Videos angibt. Der akzeptierte Wertebereich ist 14.
    • SEED_NUMBER: Optional. Ein uint32-Wert, den das Modell zum Generieren deterministischer Videos verwendet. Wenn Sie eine Quell-Nummer in Ihrer Anfrage angeben, ohne andere Parameter zu ändern, wird das Modell angewiesen, dieselben Videos zu erstellen. Der akzeptierte Wertebereich ist 04294967295.

HTTP-Methode und URL:

POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:predictLongRunning

JSON-Text der Anfrage:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT",
      "image": {
        "bytesBase64Encoded": "INPUT_IMAGE",
        "mimeType": "MIME_TYPE"
      }
    }
  ],
  "parameters": {
    "storageUri": "OUTPUT_STORAGE_URI",
    "sampleCount": RESPONSE_COUNT
  }
}

Wenn Sie die Anfrage senden möchten, wählen Sie eine der folgenden Optionen aus:

curl

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:predictLongRunning"

PowerShell

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:predictLongRunning" | Select-Object -Expand Content
Diese Anfrage gibt einen vollständigen Vorgangsnamen mit einer eindeutigen Vorgangs-ID zurück. Verwenden Sie diesen vollständigen Vorgangsnamen, um den Status der Videogenerierungsanfrage abzurufen.
{
  "name": "projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID/operations/a1b07c8e-7b5a-4aba-bb34-3e1ccb8afcc8"
}

Videoanfrage mit Asset-Bildern

REST

Senden Sie zum Testen eines Text-Prompts mit der Vertex AI Veo API eine POST-Anfrage an den Endpunkt des Publisher-Modells.

Ersetzen Sie diese Werte in den folgenden Anfragedaten:

  • PROJECT_ID: Ihre Google Cloud -Projekt-ID.
  • TEXT_PROMPT: Der Text-Prompt, der zur Steuerung der Videogenerierung verwendet wird.
  • BASE64_ENCODED_IMAGE: Ein base64-codiertes Bild des Motivs. Sie können dieses Feld und mimeType wiederholen, um bis zu drei Motivbilder anzugeben.
  • IMAGE_MIME_TYPE: Der MIME-Typ des Eingabebilds. Nur einer der Folgenden:

    • image/jpeg
    • image/png

    Sie können dieses Feld und bytesBase64Encoded wiederholen, um bis zu drei Motivbilder anzugeben.

  • OUTPUT_STORAGE_URI: Optional: Der Cloud Storage-Bucket, in dem die Ausgabevideos gespeichert werden sollen. Wenn nicht angegeben, wird in der Antwort ein Base64-Byte-codiertes Video zurückgegeben. Beispiel: gs://video-bucket/output/.
  • RESPONSE_COUNT: Die Anzahl der Videodateien, die Sie generieren möchten. Zulässige Ganzzahlwerte: 1–4.
  • Zusätzliche optionale Parameter

    Je nach Anwendungsfall können Sie die folgenden optionalen Variablen verwenden. Fügen Sie dem "parameters": {}-Objekt einige oder alle der folgenden Parameter hinzu.

    "parameters": {
      "aspectRatio": "ASPECT_RATIO",
      "negativePrompt": "NEGATIVE_PROMPT",
      "personGeneration": "PERSON_SAFETY_SETTING",
      // "resolution": RESOLUTION, // Veo 3 models only
      "sampleCount": RESPONSE_COUNT,
      "seed": SEED_NUMBER
    }
    • ASPECT_RATIO: Optional: Ein Stringwert, der das Seitenverhältnis der generierten Videos beschreibt. Sie können die folgenden Werte verwenden:
      • "16:9" für Landschaft
      • "9:16" für Hochformat

      Der Standardwert ist "16:9".

    • NEGATIVE_PROMPT (optional): Ein Stringwert, der Inhalte beschreibt, die das Modell nicht generieren soll.
    • PERSON_SAFETY_SETTING: Optional: Ein Stringwert, der die Sicherheitseinstellung für die Generierung von Personen oder Gesichtern steuert. Sie können die folgenden Werte verwenden:
      • "allow_adult": Nur Generierung von Erwachsenen und Gesichtern zulassen.
      • "disallow": Es werden keine Personen oder Gesichter generiert.

      Der Standardwert ist "allow_adult".

    • RESOLUTION: Optional: Ein Stringwert, der die Auflösung des generierten Videos steuert. Wird nur von Veo 3-Modellen unterstützt. Sie können die folgenden Werte verwenden:
      • "720p"
      • "1080p"

      Der Standardwert ist "720p".

    • RESPONSE_COUNT: Optional. Ein Ganzzahlwert, der die Anzahl der zu generierenden Videos angibt. Der akzeptierte Wertebereich ist 14.
    • SEED_NUMBER: Optional. Ein uint32-Wert, den das Modell zum Generieren deterministischer Videos verwendet. Wenn Sie eine Quell-Nummer in Ihrer Anfrage angeben, ohne andere Parameter zu ändern, wird das Modell angewiesen, dieselben Videos zu erstellen. Der akzeptierte Wertebereich ist 04294967295.

HTTP-Methode und URL:

POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/veo-2.0-generate-001:predictLongRunning

JSON-Text der Anfrage:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT",
      // The following fields can be repeated for up to three total
      // images.
      "referenceImages": [
        {
          "image": {
            "bytesBase64Encoded": "BASE64_ENCODED_IMAGE",
            "mimeType": "IMAGE_MIME_TYPE"
          },
          "referenceType": "asset"
        }
      ]
    }
  ],
  "parameters": {
    "durationSeconds": 8,
    "storageUri": "OUTPUT_STORAGE_URI",
    "sampleCount": RESPONSE_COUNT
  }
}

Wenn Sie die Anfrage senden möchten, wählen Sie eine der folgenden Optionen aus:

curl

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/veo-2.0-generate-001:predictLongRunning"

PowerShell

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/veo-2.0-generate-001:predictLongRunning" | Select-Object -Expand Content
Diese Anfrage gibt einen vollständigen Vorgangsnamen mit einer eindeutigen Vorgangs-ID zurück. Verwenden Sie diesen vollständigen Vorgangsnamen, um den Status der Videogenerierungsanfrage abzurufen.
{
  "name": "projects/PROJECT_ID/locations/us-central1/publishers/google/models/veo-2.0-generate-001/operations/a1b07c8e-7b5a-4aba-bb34-3e1ccb8afcc8"
}

Videoanfrage mit einem Stilbild

REST

Senden Sie zum Testen eines Text-Prompts mit der Vertex AI Veo API eine POST-Anfrage an den Endpunkt des Publisher-Modells.

Ersetzen Sie diese Werte in den folgenden Anfragedaten:

  • PROJECT_ID: Ihre Google Cloud -Projekt-ID.
  • TEXT_PROMPT: Der Text-Prompt, der zur Steuerung der Videogenerierung verwendet wird.
  • BASE64_ENCODED_IMAGE: Ein base64-codiertes Stilbild.
  • IMAGE_MIME_TYPE: Der MIME-Typ des Eingabebilds. Nur eines der folgenden Elemente:
    • image/jpeg
    • image/png
  • OUTPUT_STORAGE_URI: Optional: Der Cloud Storage-Bucket, in dem die Ausgabevideos gespeichert werden sollen. Wenn nicht angegeben, werden Videobyte in der Antwort zurückgegeben. Beispiel: gs://video-bucket/output/.
  • RESPONSE_COUNT: Die Anzahl der Videodateien, die Sie generieren möchten. Zulässige Ganzzahlwerte: 1–4.
  • Zusätzliche optionale Parameter

    Je nach Anwendungsfall können Sie die folgenden optionalen Variablen verwenden. Fügen Sie dem "parameters": {}-Objekt einige oder alle der folgenden Parameter hinzu.

    "parameters": {
      "aspectRatio": "ASPECT_RATIO",
      "negativePrompt": "NEGATIVE_PROMPT",
      "personGeneration": "PERSON_SAFETY_SETTING",
      // "resolution": RESOLUTION, // Veo 3 models only
      "sampleCount": RESPONSE_COUNT,
      "seed": SEED_NUMBER
    }
    • ASPECT_RATIO: Optional: Ein Stringwert, der das Seitenverhältnis der generierten Videos beschreibt. Sie können die folgenden Werte verwenden:
      • "16:9" für Landschaft
      • "9:16" für Hochformat

      Der Standardwert ist "16:9".

    • NEGATIVE_PROMPT (optional): Ein Stringwert, der Inhalte beschreibt, die das Modell nicht generieren soll.
    • PERSON_SAFETY_SETTING: Optional: Ein Stringwert, der die Sicherheitseinstellung für die Generierung von Personen oder Gesichtern steuert. Sie können die folgenden Werte verwenden:
      • "allow_adult": Nur Generierung von Erwachsenen und Gesichtern zulassen.
      • "disallow": Es werden keine Personen oder Gesichter generiert.

      Der Standardwert ist "allow_adult".

    • RESOLUTION: Optional: Ein Stringwert, der die Auflösung des generierten Videos steuert. Wird nur von Veo 3-Modellen unterstützt. Sie können die folgenden Werte verwenden:
      • "720p"
      • "1080p"

      Der Standardwert ist "720p".

    • RESPONSE_COUNT: Optional. Ein Ganzzahlwert, der die Anzahl der zu generierenden Videos angibt. Der akzeptierte Wertebereich ist 14.
    • SEED_NUMBER: Optional. Ein uint32-Wert, den das Modell zum Generieren deterministischer Videos verwendet. Wenn Sie eine Quell-Nummer in Ihrer Anfrage angeben, ohne andere Parameter zu ändern, wird das Modell angewiesen, dieselben Videos zu erstellen. Der akzeptierte Wertebereich ist 04294967295.

HTTP-Methode und URL:

POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/veo-2.0-generate-001:predictLongRunning

JSON-Text der Anfrage:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT",
      "referenceImages": [
        {
          "image": {
            "bytesBase64Encoded": "BASE64_ENCODED_IMAGE",
            "mimeType": "IMAGE_MIME_TYPE"
          },
          "referenceType": "style"
        }
      ]
    }
  ],
  "parameters": {
    "durationSeconds": 8,
    "storageUri": "OUTPUT_STORAGE_URI",
    "sampleCount": RESPONSE_COUNT
  }
}

Wenn Sie die Anfrage senden möchten, wählen Sie eine der folgenden Optionen aus:

curl

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/veo-2.0-generate-001:predictLongRunning"

PowerShell

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/veo-2.0-generate-001:predictLongRunning" | Select-Object -Expand Content
Diese Anfrage gibt einen vollständigen Vorgangsnamen mit einer eindeutigen Vorgangs-ID zurück. Verwenden Sie diesen vollständigen Vorgangsnamen, um den Status der Videogenerierungsanfrage abzurufen.
{
  "name": "projects/PROJECT_ID/locations/us-central1/publishers/google/models/veo-2.0-generate-001/operations/a1b07c8e-7b5a-4aba-bb34-3e1ccb8afcc8"
}

Status des Vorgangs mit langer Ausführungszeit für die Videogenerierung abfragen

Prüfen Sie den Status des Vorgangs mit langer Ausführungszeit für die Videogenerierung.

REST

Ersetzen Sie diese Werte in den folgenden Anfragedaten:

  • PROJECT_ID: Ihre Google Cloud Projekt-ID.
  • MODEL_ID: Die zu verwendende Modell-ID.
  • OPERATION_ID: Die eindeutige Vorgangs-ID, die in der ursprünglichen Anfrage zum Generieren von Videos zurückgegeben wurde.

HTTP-Methode und URL:

POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:fetchPredictOperation

JSON-Text der Anfrage:

{
  "operationName": "projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID/operations/OPERATION_ID"
}

Wenn Sie die Anfrage senden möchten, wählen Sie eine der folgenden Optionen aus:

curl

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:fetchPredictOperation"

PowerShell

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:fetchPredictOperation" | Select-Object -Expand Content
Diese Anfrage gibt Informationen zum Vorgang zurück, einschließlich der Frage, ob der Vorgang noch ausgeführt wird oder abgeschlossen ist.

Antworttext (Anfrage zum Generieren von Videos)

Wenn Sie eine Text-zu-Video- oder Bild-zu-Video-Anfrage senden, wird die folgende Antwort zurückgegeben:

{
  "name": string
}
Antwortelement Beschreibung
name Der vollständige Vorgangsname des Vorgangs mit langer Ausführungszeit, der nach dem Senden einer Anfrage zur Videogenerierung beginnt.

Beispielantwort (Anfrage zum Generieren von Videos)

{
  "name": "projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID/operations/OPERATION_ID"
}

Antworttext (Vorgang mit langer Ausführungszeit abfragen)

Wenn Sie den Status des ursprünglichen Vorgangs mit langer Ausführungszeit für die Videogenerierung abrufen, erhalten Sie eine Antwort wie die folgende:

{
   "name": string,
   "done": boolean,
   "response":{
      "@type":"type.googleapis.com/cloud.ai.large_models.vision.GenerateVideoResponse",
      "raiMediaFilteredCount": integer,
      "videos":[
         {
           "gcsUri": string,
           "mimeType": string
         },
         {
           "gcsUri": string,
           "mimeType": string
         },
         {
           "gcsUri": string,
           "mimeType": string
         },
         {
           "gcsUri": string,
           "mimeType": string
         },
      ]
   }
}
Antwortelement Beschreibung
bytesBase64Encoded Ein Base64-codierter String, der das Videoobjekt darstellt.
done Ein boolescher Wert, der angibt, ob der Vorgang abgeschlossen ist.
encoding Der Videocodierungstyp.
gcsUri Der Cloud Storage-URI des generierten Videos.
name Der vollständige Vorgangsname des Vorgangs mit langer Ausführungszeit, der beginnt, nachdem eine Anfrage zur Videogenerierung gesendet wurde.
raiMediaFilteredCount Gibt die Anzahl der Videos zurück, die von Veo aufgrund von Richtlinien für verantwortungsbewusste KI gefiltert wurden. Wenn keine Videos gefiltert werden, ist die zurückgegebene Anzahl 0.
raiMediaFilteredReasons Hier werden die Gründe für alle Veo-Videos aufgeführt, die aufgrund von Richtlinien für verantwortungsbewusste KI herausgefiltert wurden. Weitere Informationen finden Sie unter Codekategorien für Sicherheitsfilter.
response Der Antworttext des Vorgangs mit langer Ausführungszeit.
video Das generierte Video.

Beispielantwort (Vorgang mit langer Ausführungszeit abfragen)

{
   "name": "projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID/operations/OPERATION_ID",
   "done":true,
   "response":{
      "@type":"type.googleapis.com/cloud.ai.large_models.vision.GenerateVideoResponse",
      "raiMediaFilteredCount": 0,
      "videos":[
        {
          "gcsUri":"gs://STORAGE_BUCKET/TIMESTAMPED_SUBDIRECTORY/sample_0.mp4",
          "mimeType":"video/mp4"
        },
        {
          "gcsUri":"gs://STORAGE_BUCKET/TIMESTAMPED_SUBDIRECTORY/sample_1.mp4",
          "mimeType":"video/mp4"
        },
        {
          "gcsUri":"gs://STORAGE_BUCKET/TIMESTAMPED_SUBDIRECTORY/sample_2.mp4",
          "mimeType":"video/mp4"
        },
        {
          "gcsUri":"gs://STORAGE_BUCKET/TIMESTAMPED_SUBDIRECTORY/sample_3.mp4",
          "mimeType":"video/mp4"
        }
      ]
   }
}

Weitere Informationen

Nächste Schritte