Cette page explique comment obtenir des prédictions par lot à l'aide de Cloud Storage.
1. Préparer les entrées
Les requêtes par lot pour les modèles Gemini acceptent un fichier JSON Lines (JSONL) stocké dans Cloud Storage comme données d'entrée. Chaque ligne des données d'entrée par lot est une requête adressée au modèle, suivant le même format que pour l'API Gemini.
Exemple :
{"request":{"contents": [{"role": "user", "parts": [{"text": "What is the relation between the following video and image samples?"}, {"fileData": {"fileUri": "gs://cloud-samples-data/generative-ai/video/animals.mp4", "mimeType": "video/mp4"}}, {"fileData": {"fileUri": "gs://cloud-samples-data/generative-ai/image/cricket.jpeg", "mimeType": "image/jpeg"}}]}], "generationConfig": {"temperature": 0.9, "topP": 1, "maxOutputTokens": 256}}}
Téléchargez l'exemple de fichier de requête par lot.
Une fois que vous avez préparé vos données d'entrée et que vous les avez importées dans Cloud Storage. Assurez-vous que l'agent de service AI Platform est autorisé à accéder au fichier Cloud Storage.
2. Envoyer un job par lot
Vous pouvez créer un job par lot à l'aide de la console Google Cloud , de l'API REST ou du SDK Google Gen AI.
Console
- Dans la section Vertex AI de la console Google Cloud , accédez à la page Inférence par lot.
- Cliquez sur Créer.
REST
Pour créer un job de prédiction par lots, utilisez la méthode projects.locations.batchPredictionJobs.create
.
Avant d'utiliser les données de requête ci-dessous, effectuez les remplacements suivants :
- LOCATION : région compatible avec les modèles Gemini.
- PROJECT_ID : l'ID de votre projet.
- MODEL_PATH : nom du modèle d'éditeur (par exemple,
publishers/google/models/gemini-2.5-flash
) ou nom du point de terminaison réglé (par exemple,projects/PROJECT_ID/locations/LOCATION/models/MODEL_ID
), où MODEL_ID est l'ID du modèle réglé. - INPUT_URI : emplacement Cloud Storage de votre entrée de prédiction par lots JSONL, par exemple
gs://bucketname/path/to/file.jsonl
. - OUTPUT_FORMAT : pour générer un résultat dans un bucket Cloud Storage, spécifiez
jsonl
. - DESTINATION : pour BigQuery, spécifiez
bigqueryDestination
. Pour Cloud Storage, spécifiezgcsDestination
. - OUTPUT_URI_FIELD_NAME : pour BigQuery, spécifiez
outputUri
. Pour Cloud Storage, spécifiezoutputUriPrefix
. - OUTPUT_URI : pour BigQuery, spécifiez l'emplacement de la table, par exemple
bq://myproject.mydataset.output_result
. La région de l'ensemble de données BigQuery de sortie doit être identique à celle du job de prédiction par lots Vertex AI. Pour Cloud Storage, spécifiez l'emplacement du bucket et du répertoire, par exemplegs://mybucket/path/to/output
.
Méthode HTTP et URL :
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/batchPredictionJobs
Corps JSON de la requête :
{ "displayName": "my-cloud-storage-batch-prediction-job", "model": "MODEL_PATH", "inputConfig": { "instancesFormat": "jsonl", "gcsSource": { "uris" : "INPUT_URI" } }, "outputConfig": { "predictionsFormat": "OUTPUT_FORMAT", "DESTINATION": { "OUTPUT_URI_FIELD_NAME": "OUTPUT_URI" } } }
Pour envoyer votre requête, choisissez l'une des options suivantes :
curl
Enregistrez le corps de la requête dans un fichier nommé request.json
, puis exécutez la commande suivante :
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/batchPredictionJobs"
PowerShell
Enregistrez le corps de la requête dans un fichier nommé request.json
, puis exécutez la commande suivante :
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/batchPredictionJobs" | Select-Object -Expand Content
Vous devriez recevoir une réponse JSON semblable à la suivante.
La réponse inclut un identifiant unique pour le job par lot. Vous pouvez interroger l'état de la job par lot à l'aide de BATCH_JOB_ID. Pour en savoir plus, consultez Surveiller l'état du job. Remarque : Les rapports sur le compte de service personnalisé, la progression en temps réel, les clés CMEK et les rapports VPCSC ne sont pas pris en charge.Python
Installer
pip install --upgrade google-genai
Pour en savoir plus, lisez la documentation de référence du SDK.
Définissez les variables d'environnement pour utiliser le SDK Gen AI avec Vertex AI :
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
3. Surveiller l'état et la progression du job
Une fois la tâche envoyée, vous pouvez vérifier son état à job par lot;aide de la console Google Cloud , de l'API REST ou du SDK Google Gen AI.
Console
- Accédez à la page Inférence par lot.
- Sélectionnez votre job par lot pour suivre sa progression.
REST
Pour surveiller un job de prédiction par lots, utilisez la méthode projects.locations.batchPredictionJobs.get
et affichez le champ CompletionStats
dans la réponse.
Avant d'utiliser les données de requête, effectuez les remplacements suivants :
- LOCATION : région compatible avec les modèles Gemini.
- PROJECT_ID : .
- BATCH_JOB_ID : ID de votre job par lot.
Méthode HTTP et URL :
GET https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/batchPredictionJobs/BATCH_JOB_ID
Pour envoyer votre requête, choisissez l'une des options suivantes :
curl
Exécutez la commande suivante :
curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/batchPredictionJobs/BATCH_JOB_ID"
PowerShell
Exécutez la commande suivante :
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method GET `
-Headers $headers `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/batchPredictionJobs/BATCH_JOB_ID" | Select-Object -Expand Content
Vous devriez recevoir une réponse JSON semblable à la suivante.
Python
Installer
pip install --upgrade google-genai
Pour en savoir plus, lisez la documentation de référence du SDK.
Définissez les variables d'environnement pour utiliser le SDK Gen AI avec Vertex AI :
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
Pour obtenir la description des états des jobs, consultez JobState.
4. Récupérer une sortie par lot
Lorsqu'une tâche de prédiction par lot est terminée, le résultat est stocké dans le bucket Cloud Storage que vous avez spécifié lors de la création de la tâche. Pour les lignes réussies, les réponses du modèle sont stockées dans le champ response
. Sinon, les détails de l'erreur sont stockés dans le champ status
en vue d'une inspection plus approfondie.
Pendant les jobs de longue durée, les prédictions terminées sont exportées en continu vers la destination de sortie spécifiée. Si le job de prédiction par lots est arrêté, toutes les lignes terminées sont exportées. Vous n'êtes facturé que pour les prédictions terminées.
Exemples de résultats
Exemple de réussite
{
"status": "",
"processed_time": "2024-11-01T18:13:16.826+00:00",
"request": {
"contents": [
{
"parts": [
{
"fileData": null,
"text": "What is the relation between the following video and image samples?"
},
{
"fileData": {
"fileUri": "gs://cloud-samples-data/generative-ai/video/animals.mp4",
"mimeType": "video/mp4"
},
"text": null
},
{
"fileData": {
"fileUri": "gs://cloud-samples-data/generative-ai/image/cricket.jpeg",
"mimeType": "image/jpeg"
},
"text": null
}
],
"role": "user"
}
]
},
"response": {
"candidates": [
{
"avgLogprobs": -0.5782725546095107,
"content": {
"parts": [
{
"text": "This video shows a Google Photos marketing campaign where animals at the Los Angeles Zoo take self-portraits using a modified Google phone housed in a protective case. The image is unrelated."
}
],
"role": "model"
},
"finishReason": "STOP"
}
],
"modelVersion": "gemini-2.0-flash-001@default",
"usageMetadata": {
"candidatesTokenCount": 36,
"promptTokenCount": 29180,
"totalTokenCount": 29216
}
}
}
Exemple d'échec
{
"status": "Bad Request: {\"error\": {\"code\": 400, \"message\": \"Please use a valid role: user, model.\", \"status\": \"INVALID_ARGUMENT\"}}",
"processed_time": "2025-07-09T19:57:43.558+00:00",
"request": {
"contents": [
{
"parts": [
{
"text": "Explain how AI works in a few words"
}
],
"role": "tester"
}
]
},
"response": {}
}