Prediksi batch memungkinkan Anda mengirim perintah multimodal dalam jumlah besar dalam satu permintaan batch.
Untuk informasi selengkapnya tentang alur kerja batch dan cara memformat data input, lihat Mendapatkan prediksi batch untuk Gemini.
Model yang Didukung:
Model | Versi |
---|---|
Gemini 1.5 Flash | gemini-1.5-flash-002 gemini-1.5-flash-001 |
Gemini 1.5 Pro | gemini-1.5-pro-002 gemini-1.5-pro-001 |
Gemini 1.0 Pro | gemini-1.0-pro-001 gemini-1.0-pro-002 |
Contoh sintaksis
Sintaksis berikut menunjukkan cara mengirim permintaan API prediksi batch menggunakan
perintah curl
. Contoh ini khusus untuk penyimpanan BigQuery.
curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/batchPredictionJobs \ -d '{ "displayName": "...", "model": "publishers/google/models/${MODEL_ID}", "inputConfig": { "instancesFormat": "bigquery", "bigquerySource": { "inputUri" : "..." } }, "outputConfig": { "predictionsFormat": "bigquery", "bigqueryDestination": { "outputUri": "..." } } }'
Parameter
Lihat contoh untuk mengetahui detail penerapan.
Permintaan isi
Parameter | |
---|---|
|
Nama yang Anda pilih untuk pekerjaan Anda. |
|
Model yang akan digunakan untuk prediksi batch. |
|
Format data. Untuk prediksi batch Gemini, sumber input Cloud Storage dan BigQuery didukung. |
|
Konfigurasi output yang menentukan lokasi output model. Lokasi output Cloud Storage dan BigQuery didukung. |
inputConfig
Parameter | |
---|---|
|
Format input perintah. Gunakan |
|
URI sumber input. Ini adalah lokasi Cloud Storage file JSONL dalam bentuk |
|
URI sumber input. Ini adalah URI tabel BigQuery dalam
bentuk |
outputConfig
Parameter | |
---|---|
|
Format output prediksi. Menggunakan |
|
Bucket dan lokasi direktori Cloud Storage, dalam bentuk |
|
URI BigQuery dari tabel output target, dalam
bentuk |
Contoh
Meminta respons batch
Permintaan batch untuk model multimodal menerima penyimpanan Cloud Storage dan sumber penyimpanan BigQuery. Untuk mempelajari lebih lanjut, lihat referensi berikut:
Bergantung pada jumlah item input yang Anda kirimkan, tugas pembuatan batch dapat memerlukan waktu beberapa saat untuk diselesaikan.
Untuk membuat tugas prediksi batch, gunakan metode projects.locations.batchPredictionJobs.create
.
Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:
LOCATION : Region yang mendukung model Gemini.PROJECT_ID : Project ID Anda.INPUT_URI : Lokasi Cloud Storage input prediksi batch JSONL Anda sepertigs://bucketname/path/to/file.jsonl
.OUTPUT_FORMAT : Untuk menghasilkan output ke tabel BigQuery, tentukanbigquery
. Untuk menghasilkan output ke bucket Cloud Storage, tentukanjsonl
.DESTINATION : Untuk BigQuery, tentukanbigqueryDestination
. Untuk Cloud Storage, tentukangcsDestination
.OUTPUT_URI_FIELD_NAME : Untuk BigQuery, tentukanoutputUri
. Untuk Cloud Storage, tentukanoutputUriPrefix
.OUTPUT_URI : Untuk BigQuery, tentukan lokasi tabel sepertibq://myproject.mydataset.output_result
. Region set data BigQuery output harus sama dengan tugas prediksi batch Vertex AI. Untuk Cloud Storage, tentukan bucket dan lokasi direktori sepertigs://mybucket/path/to/output
.
Meminta isi JSON:
{ "displayName": "my-cloud-storage-batch-prediction-job", "model": "publishers/google/models/gemini-1.5-flash-002", "inputConfig": { "instancesFormat": "jsonl", "gcsSource": { "uris" : "INPUT_URI " } }, "outputConfig": { "predictionsFormat": "OUTPUT_FORMAT ", "DESTINATION ": { "OUTPUT_URI_FIELD_NAME ": "OUTPUT_URI " } } }
Untuk mengirim permintaan Anda, pilih salah satu opsi berikut:
Simpan isi permintaan dalam file bernama request.json
,
dan jalankan perintah berikut:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION -aiplatform.googleapis.com/v1/projects/PROJECT_ID /locations/LOCATION /batchPredictionJobs"
Simpan isi permintaan dalam file bernama request.json
,
dan jalankan perintah berikut:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION -aiplatform.googleapis.com/v1/projects/PROJECT_ID /locations/LOCATION /batchPredictionJobs" | Select-Object -Expand Content
Anda akan melihat respons JSON yang mirip seperti berikut:
Respons
{ "name": "projects/PROJECT_ID /locations/LOCATION /batchPredictionJobs/BATCH_JOB_ID ", "displayName": "my-cloud-storage-batch-prediction-job", "model": "publishers/google/models/gemini-1.5-flash-002", "inputConfig": { "instancesFormat": "jsonl", "gcsSource": { "uris": [ "INPUT_URI " ] } }, "outputConfig": { "predictionsFormat": "OUTPUT_FORMAT ", "DESTINATION ": { "OUTPUT_URI_FIELD_NAME ": "OUTPUT_URI " } }, "state": "JOB_STATE_PENDING", "createTime": "2024-10-16T19:33:59.153782Z", "updateTime": "2024-10-16T19:33:59.153782Z", "modelVersionId": "1" }
Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:
LOCATION : Region yang mendukung model Gemini.PROJECT_ID : Project ID Anda.INPUT_URI : Tabel BigQuery tempat input prediksi batch Anda berada, sepertibq://myproject.mydataset.input_table
. Set data multi-region tidak didukung.OUTPUT_FORMAT : Untuk menghasilkan output ke tabel BigQuery, tentukanbigquery
. Untuk menghasilkan output ke bucket Cloud Storage, tentukanjsonl
.DESTINATION : Untuk BigQuery, tentukanbigqueryDestination
. Untuk Cloud Storage, tentukangcsDestination
.OUTPUT_URI_FIELD_NAME : Untuk BigQuery, tentukanoutputUri
. Untuk Cloud Storage, tentukanoutputUriPrefix
.OUTPUT_URI : Untuk BigQuery, tentukan lokasi tabel sepertibq://myproject.mydataset.output_result
. Region set data BigQuery output harus sama dengan tugas prediksi batch Vertex AI. Untuk Cloud Storage, tentukan bucket dan lokasi direktori sepertigs://mybucket/path/to/output
.
Meminta isi JSON:
{ "displayName": "my-bigquery-batch-prediction-job", "model": "publishers/google/models/gemini-1.5-flash-002", "inputConfig": { "instancesFormat": "bigquery", "bigquerySource":{ "inputUri" : "INPUT_URI " } }, "outputConfig": { "predictionsFormat": "OUTPUT_FORMAT ", "DESTINATION ": { "OUTPUT_URI_FIELD_NAME ": "OUTPUT_URI " } } }
Untuk mengirim permintaan Anda, pilih salah satu opsi berikut:
Simpan isi permintaan dalam file bernama request.json
,
dan jalankan perintah berikut:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION -aiplatform.googleapis.com/v1/projects/PROJECT_ID /locations/LOCATION /batchPredictionJobs"
Simpan isi permintaan dalam file bernama request.json
,
dan jalankan perintah berikut:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION -aiplatform.googleapis.com/v1/projects/PROJECT_ID /locations/LOCATION /batchPredictionJobs" | Select-Object -Expand Content
Anda akan melihat respons JSON yang mirip seperti berikut:
Respons
{ "name": "projects/PROJECT_ID /locations/LOCATION /batchPredictionJobs/BATCH_JOB_ID ", "displayName": "my-bigquery-batch-prediction-job", "model": "publishers/google/models/gemini-1.5-flash-002", "inputConfig": { "instancesFormat": "bigquery", "bigquerySource": { "inputUri" : "INPUT_URI " } }, "outputConfig": { "predictionsFormat": "OUTPUT_FORMAT ", "DESTINATION ": { "OUTPUT_URI_FIELD_NAME ": "OUTPUT_URI " } }, "state": "JOB_STATE_PENDING", "createTime": "2024-10-16T19:33:59.153782Z", "updateTime": "2024-10-16T19:33:59.153782Z", "modelVersionId": "1" }
Responsnya menyertakan ID unik untuk tugas batch.
Anda dapat melakukan polling untuk status tugas batch menggunakan BATCH_JOB_ID hingga state
tugas menjadi JOB_STATE_SUCCEEDED
. Contoh:
curl -X GET \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID /locations/us-central1/batchPredictionJobs/BATCH_JOB_ID
Untuk mempelajari cara menginstal atau mengupdate Vertex AI SDK untuk Python, lihat Menginstal Vertex AI SDK untuk Python. Untuk mengetahui informasi selengkapnya, lihat Dokumentasi referensi API Vertex AI SDK untuk Python.
Sebelum mencoba contoh ini, ikuti petunjuk penyiapan Node.js di Panduan memulai Vertex AI menggunakan library klien. Untuk mengetahui informasi selengkapnya, lihat Dokumentasi referensi API Node.js Vertex AI.
Untuk melakukan autentikasi ke Vertex AI, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Sebelum mencoba contoh ini, ikuti petunjuk penyiapan Java di Panduan memulai Vertex AI menggunakan library klien. Untuk mengetahui informasi selengkapnya, lihat Dokumentasi referensi API Java Vertex AI.
Untuk melakukan autentikasi ke Vertex AI, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Sebelum mencoba contoh ini, ikuti petunjuk penyiapan Go di Panduan memulai Vertex AI menggunakan library klien. Untuk mengetahui informasi selengkapnya, lihat Dokumentasi referensi API Go Vertex AI.
Untuk melakukan autentikasi ke Vertex AI, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Mengambil output batch
Setelah tugas prediksi batch selesai, outputnya akan disimpan di bucket Cloud Storage atau tabel BigQuery yang Anda tentukan dalam permintaan Anda.
Langkah berikutnya
- Pelajari cara menyesuaikan model Gemini di Ringkasan penyesuaian model untuk Gemini.
- Pelajari lebih lanjut cara Mendapatkan prediksi batch untuk Gemini.