Harga Vertex AI

Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.

Harga Vertex AI dibandingkan dengan harga produk lama

Biaya untuk Vertex AI tetap sama seperti untuk produk AI Platform dan AutoML lama yang digantikan oleh Vertex AI, dengan pengecualian berikut:

Prediksi AI Platform Prediction dan AutoML Tables lama mendukung jenis mesin berbiaya lebih rendah dan berperforma lebih rendah yang tidak didukung untuk Inferensi Vertex AI dan tabulasi AutoML.
AI Platform Prediction lama mendukung penskalaan hingga nol, yang tidak didukung untuk Inferensi Vertex AI.

Vertex AI juga menawarkan lebih banyak cara untuk mengoptimalkan biaya, seperti berikut:

Runtime TensorFlow yang dioptimalkan.
Dukungan untuk model hosting bersama.
Tidak ada durasi penggunaan minimum untuk Training dan Prediction. Sebagai gantinya, penggunaan dikenai biaya per penambahan 30 detik.

Harga untuk AI Generatif di Vertex AI

Untuk mengetahui informasi harga AI Generatif di Vertex AI, lihat Harga AI Generatif di Vertex AI.

Harga untuk model AutoML

Untuk model Vertex AI AutoML, Anda membayar tiga aktivitas utama:

Melatih model
Men-deploy model ke endpoint
Menggunakan model untuk membuat prediksi

Vertex AI menggunakan konfigurasi mesin yang telah ditetapkan untuk model Vertex AutoML, dan tarif per jam untuk aktivitas ini mencerminkan penggunaan resource.

Waktu yang diperlukan untuk melatih model bergantung pada ukuran dan kompleksitas data pelatihan Anda. Model harus di-deploy sebelum dapat memberikan prediksi online atau penjelasan online.

Anda membayar untuk setiap model yang di-deploy ke endpoint, meskipun tidak ada prediksi yang dibuat. Anda harus membatalkan deployment model agar tidak dikenai biaya tambahan. Model yang tidak di-deploy atau gagal di-deploy tidak dikenakan biaya.

Anda hanya membayar untuk jam komputasi yang digunakan; jika pelatihan gagal karena alasan selain pembatalan yang dimulai oleh pengguna, Anda tidak akan ditagih. Anda akan dikenai biaya untuk waktu pelatihan jika membatalkan operasi.

Pilih jenis model di bawah untuk mendapatkan informasi harga.

Data gambar

Operasi	Harga (klasifikasi) (USD)	Harga (deteksi objek) (USD)
Pelatihan	US$3,465 / 1 hour	US$3,465 / 1 hour
Pelatihan (Model di perangkat edge)	US$18,00 / 1 hour	US$18,00 / 1 hour
Deployment dan prediksi online	US$1,375 / 1 hour	US$2,002 / 1 hour
Prediksi batch	US$2,222 / 1 hour	US$2,222 / 1 hour

Data tabular

Operasi	Harga per jam kerja node untuk klasifikasi/regresi	Harga untuk perkiraan
Pelatihan	US$21,252 / 1 hour	Lihat Perkiraan Vertex AI
Inferensi	Harga yang sama dengan inferensi untuk model yang dilatih khusus. Vertex AI melakukan inferensi batch menggunakan 40 mesin n1-highmem-8.	Lihat Perkiraan Vertex AI

Operasi

Harga per jam kerja node untuk klasifikasi/regresi

Harga untuk perkiraan

Pelatihan

US$21,252 / 1 hour

Lihat Perkiraan Vertex AI

Inferensi

Harga yang sama dengan inferensi untuk model yang dilatih khusus.

Vertex AI melakukan inferensi batch menggunakan 40 mesin n1-highmem-8.

Lihat Perkiraan Vertex AI

Biaya inferensi untuk Vertex Explainable AI

Komputasi yang terkait dengan Vertex Explainable AI ditagih dengan tarif yang sama seperti inferensi. Namun, penjelasan memerlukan waktu pemrosesan yang lebih lama daripada inferensi normal, sehingga penggunaan Vertex Explainable AI yang besar beserta penskalaan otomatis dapat mengakibatkan lebih banyak node dimulai, yang akan meningkatkan biaya inferensi.

Perkiraan Vertex AI

AutoML

Panggung	Harga
Prediksi	0 count to 1,000,000 count US$0,20 / 1,000 count, per 1 month / account 1,000,000 count to 50,000,000 count US$0,10 / 1,000 count, per 1 month / account 50,000,000 count and above US$0,02 / 1,000 count, per 1 month / account
Pelatihan	US$21,252 / 1 hour
Explainable AI	Penjelasan menggunakan nilai Shapley. Lihat halaman harga Inferensi dan Penjelasan Vertex AI.

* Titik data prediksi adalah satu titik waktu di cakrawala perkiraan. Misalnya, dengan perincian harian, horizon 7 hari adalah 7 poin per setiap deret waktu.

Hingga 5 kuantil prediksi dapat disertakan tanpa biaya tambahan.
Jumlah poin data yang digunakan per tingkat diperbarui setiap bulan.

ARIMA+

Panggung	Harga
Prediksi	US$5,00 / 1,000 count
Pelatihan	$250,00 per TB x Jumlah Model Kandidat x Jumlah Jendela Uji Coba*
Explainable AI	Penjelasan dengan dekomposisi deret waktu tidak menambahkan biaya tambahan. Penjelasan menggunakan nilai Shapley tidak didukung.

Lihat halaman harga BigQuery ML untuk mengetahui detail lainnya. Setiap tugas pelatihan dan prediksi akan dikenai biaya untuk 1 operasi pipeline terkelola, seperti yang dijelaskan dalam harga Vertex AI.

* Periode percobaan ulang dibuat untuk setiap periode dalam set pengujian. AUTO_ARIMA_MAX_ORDER yang digunakan menentukan jumlah model kandidat. Rentangnya antara 6-42 untuk model dengan beberapa deret waktu.

Model yang dilatih khusus

Pelatihan

Tabel di bawah ini memberikan perkiraan harga per jam untuk berbagai konfigurasi pelatihan. Anda dapat memilih konfigurasi kustom dari jenis mesin yang dipilih. Untuk menghitung harga, jumlahkan biaya mesin virtual yang Anda gunakan.

Jika Anda menggunakan jenis mesin Compute Engine dan menambahkan akselerator, biaya akselerator akan dihitung terpisah. Untuk menghitung biaya ini, kalikan harga dalam tabel akselerator di bawah ini dengan jumlah jam mesin setiap jenis akselerator yang Anda gunakan.

Jenis mesin

Anda dapat menggunakan VM Spot dengan pelatihan kustom Vertex AI. Spot VM ditagih sesuai dengan harga Spot VM Compute Engine. Terdapat biaya pengelolaan pelatihan kustom Vertex AI selain penggunaan infrastruktur Anda, yang ditunjukkan pada tabel berikut.

Anda dapat menggunakan reservasi Compute Engine dengan pelatihan kustom Vertex AI. Saat menggunakan pemesanan Compute Engine, Anda akan ditagih sesuai dengan Harga Compute Engine, termasuk diskon abonemen (CUD) yang berlaku. Terdapat biaya pengelolaan pelatihan kustom Vertex AI selain penggunaan infrastruktur Anda, yang ditunjukkan pada tabel berikut.

Jenis mesin	Harga (USD)
g4-standard-48	US$5,17508763 / 1 hour
g4-standard-96	US$10,35017526 / 1 hour
g4-standard-192	US$20,70035052 / 1 hour
g4-standard-384	US$41,40070104 / 1 hour
n1-standard-4	US$0,21849885 / 1 hour
n1-standard-8	US$0,4369977 / 1 hour
n1-standard-16	US$0,8739954 / 1 hour
n1-standard-32	US$1,7479908 / 1 hour
n1-standard-64	US$3,4959816 / 1 hour
n1-standard-96	US$5,2439724 / 1 hour
n1-highmem-2	US$0,13604845 / 1 hour
n1-highmem-4	US$0,2720969 / 1 hour
n1-highmem-8	US$0,5441938 / 1 hour
n1-highmem-16	US$1,0883876 / 1 hour
n1-highmem-32	US$2,1767752 / 1 hour
n1-highmem-64	US$4,3535504 / 1 hour
n1-highmem-96	US$6,5303256 / 1 hour
n1-highcpu-16	US$0,65180712 / 1 hour
n1-highcpu-32	US$1,30361424 / 1 hour
n1-highcpu-64	US$2,60722848 / 1 hour
n1-highcpu-96	US$3,91084272 / 1 hour
a2-highgpu-1g*	US$4,425248914 / 1 hour
a2-highgpu-2g*	US$8,850497829 / 1 hour
a2-highgpu-4g*	US$17,700995658 / 1 hour
a2-highgpu-8g*	US$35,401991315 / 1 hour
a2-megagpu-16g*	US$65,707278915 / 1 hour
a3-highgpu-8g*	US$101,007352 / 1 hour
a3-megagpu-8g*	US$106,0464232 / 1 hour
a3-ultragpu-8g*	US$99,7739296 / 1 hour
a4-highgpu-8g*	US$148,212 / 1 hour
e2-standard-4	US$0,154126276 / 1 hour
e2-standard-8	US$0,308252552 / 1 hour
e2-standard-16	US$0,616505104 / 1 hour
e2-standard-32	US$1,233010208 / 1 hour
e2-highmem-2	US$0,103959618 / 1 hour
e2-highmem-4	US$0,207919236 / 1 hour
e2-highmem-8	US$0,415838472 / 1 hour
e2-highmem-16	US$0,831676944 / 1 hour
e2-highcpu-16	US$0,455126224 / 1 hour
e2-highcpu-32	US$0,910252448 / 1 hour
n2-standard-4	US$0,2233714 / 1 hour
n2-standard-8	US$0,4467428 / 1 hour
n2-standard-16	US$0,8934856 / 1 hour
n2-standard-32	US$1,7869712 / 1 hour
n2-standard-48	US$2,6804568 / 1 hour
n2-standard-64	US$3,5739424 / 1 hour
n2-standard-80	US$4,467428 / 1 hour
n2-highmem-2	US$0,1506661 / 1 hour
n2-highmem-4	US$0,3013322 / 1 hour
cloud-tpu	Harga ditentukan oleh jenis akselerator. Lihat 'Akselerator'.
n2-highmem-8	US$0,6026644 / 1 hour
n2-highmem-16	US$1,2053288 / 1 hour
n2-highmem-32	US$2,4106576 / 1 hour
n2-highmem-48	US$3,6159864 / 1 hour
n2-highmem-64	US$4,8213152 / 1 hour
n2-highmem-80	US$6,026644 / 1 hour
n2-highcpu-16	US$0,6596032 / 1 hour
n2-highcpu-32	US$1,3192064 / 1 hour
n2-highcpu-48	US$1,9788096 / 1 hour
n2-highcpu-64	US$2,6384128 / 1 hour
n2-highcpu-80	US$3,298016 / 1 hour
c2-standard-4	US$0,2401292 / 1 hour
c2-standard-8	US$0,4802584 / 1 hour
c2-standard-16	US$0,9605168 / 1 hour
c2-standard-30	US$1,800969 / 1 hour
c2-standard-60	US$3,601938 / 1 hour
m1-ultramem-40	US$7,237065 / 1 hour
m1-ultramem-80	US$14,47413 / 1 hour
m1-ultramem-160	US$28,94826 / 1 hour
m1-megamem-96	US$12,249984 / 1 hour

*Jumlah ini mencakup harga GPU, karena jenis instance ini selalu memerlukan jumlah akselerator GPU yang tetap.

Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.

Akselerator

Jenis mesin	Harga (USD)	Biaya Pengelolaan Vertex
NVIDIA_TESLA_A100	US$2,933908 / 1 hour	US$0,4400862 / 1 hour
NVIDIA_TESLA_A100_80GB	US$3,92808 / 1 hour	US$0,589212 / 1 hour
NVIDIA_H100_80GB	US$9,79655057 / 1 hour	US$1,4694826 / 1 hour
NVIDIA_H200_141GB	US$10,708501 / 1 hour	Tidak tersedia
NVIDIA_H100_MEGA_80GB	US$11,8959171 / 1 hour	Tidak tersedia
NVIDIA_TESLA_L4	US$0,644046276 / 1 hour	Tidak tersedia
NVIDIA_TESLA_P4	US$0,69 / 1 hour	Tidak tersedia
NVIDIA_TESLA_P100	US$1,679 / 1 hour	Tidak tersedia
NVIDIA_TESLA_T4	US$0,4025 / 1 hour	Tidak tersedia
NVIDIA_TESLA_V100	US$2,852 / 1 hour	Tidak tersedia
TPU_V2 Single (8 core)	US$5,175 / 1 hour	Tidak tersedia
Pod TPU_V2 (32 core)^*	US$27,60 / 1 hour	Tidak tersedia
TPU_V3 Single (8 core)	US$9,20 / 1 hour	Tidak tersedia
Pod TPU_V3 (32 core)^*	US$36,80 / 1 hour	Tidak tersedia
tpu7x-standard-4t (1 chip)	US$13,80 / 1 hour	Tidak tersedia

Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.

* Harga pelatihan menggunakan Pod Cloud TPU didasarkan pada jumlah core dalam Pod. Jumlah core dalam sebuah pod selalu kelipatan 32. Untuk menentukan harga pelatihan pada Pod yang memiliki lebih dari 32 core, ambil harga untuk Pod 32 core, lalu kalikan dengan jumlah core, yang dibagi 32. Misalnya, untuk Pod 128 core, harganya adalah (harga Pod 32 core) * (128/32). Untuk mengetahui informasi tentang Pod Cloud TPU yang tersedia untuk region tertentu, lihat Arsitektur Sistem di dokumentasi Cloud TPU.

Disk

Jenis mesin	Harga (USD)
pd-standard	US$0,000063014 / 1 gibibyte hour
pd-ssd	US$0,000267808 / 1 gibibyte hour

Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.

Semua penggunaan tunduk pada kebijakan kuota Vertex AI.
Anda harus menyimpan data dan file program dalam bucket Google Cloud Storage selama siklus proses Vertex AI. Baca selengkapnya tentang penggunaan Cloud Storage.

Anda akan dikenai biaya untuk melatih model sejak resource disediakan untuk suatu tugas hingga tugas tersebut selesai.

Peringatan: Tugas pelatihan Anda dibatasi oleh kebijakan kuota Vertex AI. Jika memilih cluster pemrosesan yang sangat kuat untuk tugas pelatihan pertama, kemungkinan Anda akan melebihi kuota yang ditetapkan.

Tingkatan skala untuk konfigurasi yang telah ditetapkan (AI Platform Training)

Anda dapat mengontrol jenis kluster pemrosesan yang akan digunakan saat melatih model. Cara yang paling mudah adalah dengan memilih salah satu konfigurasi bawaan yang disebut tingkat skala. Baca lebih lanjut tentang tingkat skala.

Jenis mesin untuk konfigurasi kustom

Jika menggunakan Vertex AI atau memilih CUSTOM sebagai tingkat skala untuk AI Platform Training, Anda memiliki kontrol atas jumlah dan jenis virtual machine yang akan digunakan untuk master, worker, dan server parameter cluster. Baca selengkapnya tentang jenis mesin untuk Vertex AI dan jenis mesin untuk AI Platform Training.

Biaya pelatihan dengan cluster pemrosesan kustom adalah gabungan dari semua mesin yang Anda tentukan. Anda dikenai biaya untuk total waktu tugas, bukan untuk waktu pemrosesan aktif masing-masing mesin.

Layanan Evaluasi AI Generatif

Untuk metrik berbasis model, biaya hanya dikenakan untuk biaya prediksi yang terkait dengan model penilaian otomatis yang mendasarinya. Model ini ditagih berdasarkan token input yang Anda berikan dalam set data evaluasi dan output autorater.

Layanan Evaluasi AI Generatif tersedia secara umum (GA). Perubahan harga mulai berlaku pada 14 April 2025.

Metrik	Harga
Pointwise	Model penilaian otomatis default Gemini 2.0 Flash
Pairwise	Model penilaian otomatis default Gemini 2.0 Flash

Metrik

Harga

Pointwise

Model penilaian otomatis default

Gemini 2.0 Flash

Pairwise

Model penilaian otomatis default

Gemini 2.0 Flash

Metrik berbasis komputasi dikenakan biaya $0,00003 per 1.000 karakter untuk input dan $0,00009 per 1.000 karakter untuk output. Metrik ini disebut sebagai Metrik Otomatis di SKU.

Nama Metrik	Jenis
Pencocokan Persis	Berbasis komputasi
Bleu	Berbasis komputasi
Rouge	Berbasis komputasi
Panggilan Alat Valid	Berbasis komputasi
Pencocokan Nama Alat	Berbasis komputasi
Pencocokan Kunci Parameter Alat	Berbasis komputasi
Tool Parameter KV Match	Berbasis komputasi

Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.

Metrik berbasis model lama dikenakan biaya $0,005 per 1.000 karakter untuk input dan $0,015 per 1.000 karakter untuk output.

Nama Metrik	Jenis
Coherence	Pointwise
Fluency	Pointwise
Fulfillment	Pointwise
Keamanan	Pointwise
Groundedness	Pointwise
Kualitas Ringkasan	Pointwise
Kegunaan Ringkasan	Pointwise
Panjang Ringkasan	Pointwise
Kualitas Penjawaban Pertanyaan	Pointwise
Relevansi Penjawaban Pertanyaan	Pointwise
Manfaat Penjawaban Pertanyaan	Pointwise
Keakuratan Penjawaban Pertanyaan	Pointwise
Kualitas Ringkasan Berpasangan	Pairwise
Kualitas Jawaban Pertanyaan Berpasangan	Pairwise

Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.

Vertex AI Agent Engine

Vertex AI Agent Engine adalah serangkaian layanan bagi developer untuk menskalakan agen dalam produksi. Layanan dapat digunakan bersama-sama atau satu per satu. Anda hanya membayar sesuai penggunaan. Saat ini, Anda membayar runtime Agent Engine.

Mulai 28 Januari 2026, penagihan akan dimulai untuk Eksekusi Kode, Sesi, dan Bank Memori.

Runtime

Harga didasarkan pada resource komputasi (jam vCPU) dan memori (jam GiB) yang digunakan oleh agen yang di-deploy ke runtime Agent Engine. Penagihan dibulatkan ke detik terdekat dari penggunaan. Waktu tidak aktif agen tidak ditagih.

Paket Gratis

Untuk membantu Anda memulai runtime, kami menawarkan paket gratis bulanan.

vCPU - 180.000 vCPU-detik (50 jam) pertama gratis per bulan
RAM - 360.000 GiB-detik pertama (100 jam) gratis per bulan

Penentuan harga berbasis penggunaan

Setelah penggunaan bulanan Anda melebihi tingkat gratis, penagihan akan dimulai sesuai tarif di bawah.

Resource	Harga (USD)
vCPU	0 hour to 50 hour US$0,00 (Free) / 3,600 second, per 1 month / project 50 hour and above US$0,0864 / 3,600 second, per 1 month / project
RAM	0 gibibyte hour to 100 gibibyte hour US$0,00 (Free) / 3,600 gibibyte second, per 1 month / project 100 gibibyte hour and above US$0,009 / 3,600 gibibyte second, per 1 month / project

Eksekusi Kode

Mirip dengan runtime, Anda membayar komputasi dan memori yang diperlukan untuk menjalankan sandbox. Penagihan dibulatkan ke detik terdekat dari penggunaan. Waktu tidak aktif tidak ditagih.

Compute: $0,0864 per vCPU hour
Memori: $0,0090 per GiB-jam

Sesi

Anda membayar berdasarkan jumlah peristiwa yang disimpan dalam layanan sesi. Kami menagih peristiwa sesi yang disimpan yang mencakup konten. Hal ini mencakup permintaan pengguna awal, respons model, panggilan fungsi, dan respons fungsi. Kami tidak menagih peristiwa kontrol sistem (seperti checkpoint) yang disimpan di layanan sesi.

$0,25 per 1.000 peristiwa yang disimpan

Memory Bank

Bayar berdasarkan jumlah memori yang disimpan dan ditampilkan.

Memori yang Disimpan: $0,25 per 1.000 memori yang disimpan / bulan (+ biaya LLM untuk membuat memori, dibayar terpisah)
Pengambilan memori: $0,50 per 1.000 memori yang dikembalikan; 1.000 memori pertama yang dikembalikan per bulan gratis

Skenario harga

Untuk membantu Anda memahami biaya penggunaan layanan Agent Engine, kami menawarkan dua agen hipotetis: Agen Ringan dan Agen Standar. Untuk kedua skenario, kami membuat asumsi berikut:

Paket gratis: Untuk perhitungan ini, kami mengasumsikan bahwa paket gratis runtime dan bank memori telah digunakan dalam sebulan untuk eksperimen sebelumnya.
Permintaan Runtime per Sesi: "Sesi penuh" atau percakapan terdiri dari 10 permintaan runtime.
Sesi: Setiap permintaan runtime menghasilkan rata-rata 3 peristiwa sesi.
Memory Bank:
Penyimpanan: Di akhir setiap sesi penuh, 1 memori akan diekstraksi dan disimpan.
Pengambilan: Kami mengasumsikan rata-rata 1 memori yang ditampilkan per permintaan runtime.
Eksekusi Kode dipanggil untuk 30% dari semua permintaan runtime.
Bulan Penagihan: Semua perhitungan bulanan didasarkan pada bulan 30 hari.

Catatan tambahan:

Modularitas layanan: Meskipun skenario di bawah menunjukkan biaya layanan Agent Engine yang digunakan bersama-sama, Anda dapat memilih untuk menggunakan layanan secara individual. Misalnya, Anda dapat menggunakan layanan sesi dan bank memori Agent Engine tanpa menggunakan runtime Agent Engine.
Biaya model tambahan: Agen memerlukan LLM untuk bernalar dan merencanakan. Token LLM yang digunakan oleh agen ditagih secara terpisah dan tidak termasuk dalam skenario di bawah.
Biaya alat tambahan: Agen memerlukan alat untuk mengambil tindakan. Alat yang digunakan oleh agen (misalnya, panggilan API, penyimpanan) ditagih secara terpisah dan tidak termasuk dalam skenario di bawah ini.

Skenario Hipotesis

Skenario 1: Agen Internal Ringan

Skenario ini menggambarkan agen yang menangani traffic sporadis dengan volume rendah.

Contoh Kasus Penggunaan: Bot meja bantuan IT untuk perusahaan kecil, agen produktivitas pribadi yang membuat draf email, atau bot Slack yang memberikan jawaban dari dokumentasi.
Komputasi dan memori yang diperlukan untuk runtime dan eksekusi kode: 1 vCPU / 1 GiB RAM.
Traffic: 0,16 kueri per detik (10 kueri per menit), dengan total 432.000 permintaan per bulan.
Durasi Permintaan Rata-Rata: 3 detik

Layanan	Penghitungan	Biaya Bulanan
Runtime	(432.000 permintaan × 3 dtk/permintaan ÷ 3.600 dtk/jam) = 360 jam vCPU: (360 jam × 1 vCPU × $0,0864/jam) = $31,10 RAM: (360 jam × 1 GiB × $0,0090/jam) = $3,24	$34,34
Eksekusi Kode	(360 jam runtime × 30% penggunaan) = 108 jam vCPU: (108 jam × 1 vCPU × $0,0864/jam) = $9,33 RAM: (108 jam × 1 GiB × $0,0090/jam) = $0,97	$10,30
Sesi	432.000 permintaan x 3 peristiwa ÷ 1.000 × $0,25	$324
Memory Bank	Disimpan: (432.000 permintaan ÷ 10 permintaan/sesi × 1 memori/sesi ÷ 1.000) × $0,25 = $10,80 Pengambilan: (432.000 permintaan × 1 memori yang ditampilkan ÷ 1.000) × $0,50 = $216,00	$226,80
Total Estimasi Biaya Bulanan		$595,44

Skenario 2: Agen Standar

Skenario ini merepresentasikan agen produksi yang terintegrasi ke dalam aplikasi bisnis, yang menangani traffic pengguna yang konsisten.

Contoh Kasus Penggunaan: Agen layanan pelanggan di situs e-commerce, bot kualifikasi prospek di situs B2B, atau agen analisis data internal untuk tim penjualan.
Compute: 2 vCPU / 5 GiB RAM
Traffic: 10 kueri per detik (600 kueri per menit), dengan total 25.920.000 permintaan per bulan.
Durasi Permintaan Rata-Rata: 5 detik

Layanan	Penghitungan	Biaya Bulanan
Runtime	(25.920.000 permintaan × 5 dtk/permintaan ÷ 3.600 dtk/jam) = 36.000 jam vCPU: (36.000 jam × 2 vCPU × $0,0864/jam) = $6.220,80 RAM: (36.000 jam × 5 GiB × $0,0090/jam) = $1.620,00	$7.840,80
Eksekusi Kode	(36.000 jam runtime × 30% penggunaan) = 10.800 jam vCPU: (10.800 jam × 2 vCPU × $0,0864/jam) = $1.866,24 RAM: (10.800 jam × 5 GiB × $0,0090/jam) = $486	$2.352,24
Sesi	25.920.000 permintaan * 3 peristiwa ÷ 1.000 × $0,25	$19.440
Memory Bank	Disimpan: (25.920.000 permintaan ÷ 10 permintaan/sesi × 1 memori/sesi ÷ 1.000) × $0,25 = $648,00 Retrieval: (25.920.000 permintaan × 1 memori yang ditampilkan ÷ 1.000) × $0,50 = $12.960,00	$13.608
Total Estimasi Biaya Bulanan		$43.241,04

Ray di Vertex AI

Pelatihan

Jenis mesin

Jenis mesin	Harga (USD)
n1-standard-4	US$0,2279988 / 1 hour
n1-standard-8	US$0,4559976 / 1 hour
n1-standard-16	US$0,9119952 / 1 hour
n1-standard-32	US$1,8239904 / 1 hour
n1-standard-64	US$3,6479808 / 1 hour
n1-standard-96	US$5,4719712 / 1 hour
n1-highmem-2	US$0,1419636 / 1 hour
n1-highmem-4	US$0,2839272 / 1 hour
n1-highmem-8	US$0,5678544 / 1 hour
n1-highmem-16	US$1,1357088 / 1 hour
n1-highmem-32	US$2,2714176 / 1 hour
n1-highmem-64	US$4,5428352 / 1 hour
n1-highmem-96	US$6,8142528 / 1 hour
n1-highcpu-16	US$0,68014656 / 1 hour
n1-highcpu-32	US$1,36029312 / 1 hour
n1-highcpu-64	US$2,72058624 / 1 hour
n1-highcpu-96	US$4,08087936 / 1 hour
a2-highgpu-1g*	US$4,408062 / 1 hour
a2-highgpu-2g*	US$8,816124 / 1 hour
a2-highgpu-4g*	US$17,632248 / 1 hour
a2-highgpu-8g*	US$35,264496 / 1 hour
a2-highgpu-16g*	US$70,528992 / 1 hour
a3-highgpu-8g*	US$105,39898088 / 1 hour
a3-megagpu-8g*	US$110,65714224 / 1 hour
a4-highgpu-8g*	US$148,212 / 1 hour
e2-standard-4	US$0,16082748 / 1 hour
e2-standard-4	US$0,32165496 / 1 hour
e2-standard-16	US$0,64330992 / 1 hour
e2-standard-32	US$1,28661984 / 1 hour
e2-highmem-2	US$0,10847966 / 1 hour
e2-highmem-4	US$0,21695932 / 1 hour
e2-highmem-8	US$0,43391864 / 1 hour
e2-highmem-16	US$0,86783728 / 1 hour
e2-highcpu-16	US$0,4749144 / 1 hour
e2-highcpu-32	US$0,9498288 / 1 hour
n2-standard-4	US$0,2330832 / 1 hour
n2-standard-8	US$0,4661664 / 1 hour
n2-standard-16	US$0,9323328 / 1 hour
n2-standard-32	US$1,8646656 / 1 hour
n2-standard-48	US$2,7969984 / 1 hour
n2-standard-64	US$3,7293312 / 1 hour
n2-standard-80	US$4,661664 / 1 hour
n2-highmem-2	US$0,1572168 / 1 hour
n2-highmem-4	US$0,3144336 / 1 hour
n2-highmem-8	US$0,6288672 / 1 hour
n2-highmem-16	US$1,2577344 / 1 hour
n2-highmem-32	US$2,5154688 / 1 hour
n2-highmem-48	US$3,7732032 / 1 hour
n2-highmem-64	US$5,0309376 / 1 hour
n2-highmem-80	US$6,288672 / 1 hour
n2-highcpu-16	US$0,6882816 / 1 hour
n2-highcpu-32	US$1,3765632 / 1 hour
n2-highcpu-48	US$2,0648448 / 1 hour
n2-highcpu-64	US$2,7531264 / 1 hour
n2-highcpu-80	US$3,441408 / 1 hour
c2-standard-4	US$0,2505696 / 1 hour
c2-standard-8	US$0,5011392 / 1 hour
c2-standard-16	US$1,0022784 / 1 hour
c2-standard-30	US$1,879272 / 1 hour
c2-standard-60	US$3,758544 / 1 hour
m1-ultramem-40	US$7,55172 / 1 hour
m1-ultramem-80	US$15,10344 / 1 hour
m1-ultramem-160	US$30,20688 / 1 hour
m1-megamem-96	US$12,782592 / 1 hour
cloud-tpu	Harga ditentukan oleh jenis akselerator. Lihat 'Akselerator'.

Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.

Akselerator

Jenis GPU	Harga (USD)
NVIDIA_TESLA_A100	US$3,5206896 / 1 hour
NVIDIA_TESLA_A100_80GB	US$4,517292 / 1 hour
NVIDIA_H100_80GB	US$11,75586073 / 1 hour
NVIDIA_TESLA_P4	US$0,72 / 1 hour
NVIDIA_TESLA_P100	US$1,752 / 1 hour
NVIDIA_TESLA_T4	US$0,42 / 1 hour
NVIDIA_TESLA_V100	US$2,976 / 1 hour
TPU_V2 Single (8 core)	US$5,40 / 1 hour
Pod TPU_V2 (32 core)^*	US$28,80 / 1 hour
TPU_V3 Single (8 core)	US$9,60 / 1 hour
Pod TPU_V3 (32 core)^*	US$38,40 / 1 hour

Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.

Disk

Jenis disk	Harga (USD)
pd-standard	US$0,000065753 / 1 gibibyte hour
pd-ssd	US$0,000279452 / 1 gibibyte hour

Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.

Semua penggunaan tunduk pada kebijakan kuota Vertex AI.
Anda harus menyimpan data dan file program dalam bucket Google Cloud Storage selama siklus proses Vertex AI. Baca selengkapnya tentang penggunaan Cloud Storage.

Anda akan dikenai biaya untuk melatih model sejak resource disediakan untuk suatu tugas hingga tugas tersebut selesai.

Prediksi dan penjelasan

Tabel berikut memberikan harga prediksi batch, prediksi online, dan penjelasan online per jam kerja node. Jam kerja node menunjukkan waktu yang dihabiskan mesin virtual untuk menjalankan tugas prediksi atau menunggu dalam status aktif (endpoint dengan satu atau beberapa model yang di-deploy) untuk menangani permintaan prediksi atau penjelasan.

Anda dapat menggunakan Spot VM dengan Inferensi Vertex AI. Spot VM ditagih sesuai dengan harga Spot VM Compute Engine. Terdapat biaya pengelolaan Inferensi Vertex AI selain penggunaan infrastruktur Anda, yang ditunjukkan pada tabel berikut.

Anda dapat menggunakan reservasi Compute Engine dengan Inferensi Vertex AI. Saat menggunakan pemesanan Compute Engine, Anda akan ditagih sesuai dengan Harga Compute Engine, termasuk diskon abonemen (CUD) yang berlaku. Terdapat biaya pengelolaan Inferensi Vertex AI selain penggunaan infrastruktur Anda, yang ditunjukkan pada tabel berikut.

Seri E2

Jenis mesin	Harga (USD)
e2-standard-2	US$0,0770564 / 1 hour
e2-standard-4	US$0,1541128 / 1 hour
e2-standard-8	US$0,3082256 / 1 hour
e2-standard-16	US$0,6164512 / 1 hour
e2-standard-32	US$1,2329024 / 1 hour
e2-highmem-2	US$0,1039476 / 1 hour
e2-highmem-4	US$0,2078952 / 1 hour
e2-highmem-8	US$0,4157904 / 1 hour
e2-highmem-16	US$0,8315808 / 1 hour
e2-highcpu-2	US$0,056888 / 1 hour
e2-highcpu-4	US$0,113776 / 1 hour
e2-highcpu-8	US$0,227552 / 1 hour
e2-highcpu-16	US$0,455104 / 1 hour
e2-highcpu-32	US$0,910208 / 1 hour

Seri N1

Jenis mesin	Harga (USD)
n1-standard-2	US$0,1095 / 1 hour
n1-standard-4	US$0,219 / 1 hour
n1-standard-8	US$0,438 / 1 hour
n1-standard-16	US$0,876 / 1 hour
n1-standard-32	US$1,752 / 1 hour
n1-highmem-2	US$0,137 / 1 hour
n1-highmem-4	US$0,274 / 1 hour
n1-highmem-8	US$0,548 / 1 hour
n1-highmem-16	US$1,096 / 1 hour
n1-highcpu-2	US$0,081 / 1 hour
n1-highcpu-4	US$0,162 / 1 hour
n1-highcpu-8	US$0,324 / 1 hour
n1-highcpu-16	US$0,648 / 1 hour
n1-highcpu-32	US$1,296 / 1 hour

Seri N2

Jenis mesin	Harga (USD)
n2-standard-2	US$0,1116854 / 1 hour
n2-standard-4	US$0,2233708 / 1 hour
n2-standard-8	US$0,4467416 / 1 hour
n2-standard-16	US$0,8934832 / 1 hour
n2-standard-32	US$1,7869664 / 1 hour
n2-highmem-2	US$0,1506654 / 1 hour
n2-highmem-4	US$0,3013308 / 1 hour
n2-highmem-8	US$0,6026616 / 1 hour
n2-highmem-16	US$1,2053232 / 1 hour
n2-highcpu-2	US$0,0824504 / 1 hour
n2-highcpu-4	US$0,1649008 / 1 hour
n2-highcpu-8	US$0,3298016 / 1 hour
n2-highcpu-16	US$0,6596032 / 1 hour
n2-highcpu-32	US$1,3192064 / 1 hour

Seri N2D

Jenis mesin	Harga (USD)
n2d-standard-2	US$0,0971658 / 1 hour
n2d-standard-4	US$0,1943316 / 1 hour
n2d-standard-8	US$0,3886632 / 1 hour
n2d-standard-16	US$0,7773264 / 1 hour
n2d-standard-32	US$1,5546528 / 1 hour
n2d-highmem-2	US$0,131077 / 1 hour
n2d-highmem-4	US$0,262154 / 1 hour
n2d-highmem-8	US$0,524308 / 1 hour
n2d-highmem-16	US$1,048616 / 1 hour
n2d-highcpu-2	US$0,0717324 / 1 hour
n2d-highcpu-4	US$0,1434648 / 1 hour
n2d-highcpu-8	US$0,2869296 / 1 hour
n2d-highcpu-16	US$0,5738592 / 1 hour
n2d-highcpu-32	US$1,1477184 / 1 hour

Seri C2

Jenis mesin	Harga (USD)
c2-standard-4	US$0,240028 / 1 hour
c2-standard-8	US$0,480056 / 1 hour
c2-standard-16	US$0,960112 / 1 hour
c2-standard-30	US$1,80021 / 1 hour
c2-standard-60	US$3,60042 / 1 hour

Seri C2D

Jenis mesin	Harga (USD)
c2d-standard-2	US$0,1044172 / 1 hour
c2d-standard-4	US$0,2088344 / 1 hour
c2d-standard-8	US$0,4176688 / 1 hour
c2d-standard-16	US$0,8353376 / 1 hour
c2d-standard-32	US$1,6706752 / 1 hour
c2d-standard-56	US$2,9236816 / 1 hour
c2d-standard-112	US$5,8473632 / 1 hour
c2d-highmem-2	US$0,1408396 / 1 hour
c2d-highmem-4	US$0,2816792 / 1 hour
c2d-highmem-8	US$0,5633584 / 1 hour
c2d-highmem-16	US$1,1267168 / 1 hour
c2d-highmem-32	US$2,2534336 / 1 hour
c2d-highmem-56	US$3,9435088 / 1 hour
c2d-highmem-112	US$7,8870176 / 1 hour
c2d-highcpu-2	US$0,086206 / 1 hour
c2d-highcpu-4	US$0,172412 / 1 hour
c2d-highcpu-8	US$0,344824 / 1 hour
c2d-highcpu-16	US$0,689648 / 1 hour
c2d-highcpu-32	US$1,379296 / 1 hour
c2d-highcpu-56	US$2,413768 / 1 hour
c2d-highcpu-112	US$4,827536 / 1 hour

Seri C3

Jenis mesin	Harga (USD)
c3-highcpu-4	US$0,19824 / 1 hour
c3-highcpu-8	US$0,39648 / 1 hour
c3-highcpu-22	US$1,09032 / 1 hour
c3-highcpu-44	US$2,18064 / 1 hour
c3-highcpu-88	US$4,36128 / 1 hour
c3-highcpu-176	US$8,72256 / 1 hour

Seri A2

Jenis mesin	Harga (USD)
a2-highgpu-1g	US$4,2244949 / 1 hour
a2-highgpu-2g	US$8,4489898 / 1 hour
a2-highgpu-4g	US$16,8979796 / 1 hour
a2-highgpu-8g	US$33,7959592 / 1 hour
a2-megagpu-16g	US$64,1020592 / 1 hour
a2-ultragpu-1g	US$5,7818474 / 1 hour
a2-ultragpu-2g	US$11,5636948 / 1 hour
a2-ultragpu-4g	US$23,1273896 / 1 hour
a2-ultragpu-8g	US$46,2547792 / 1 hour

Saat menggunakan kapasitas reservasi atau spot, penagihan dibagi ke dalam dua SKU: SKU GCE dengan label 'vertex-ai-online-prediction' dan SKU Biaya Pengelolaan Vertex AI. Hal ini memungkinkan Anda menggunakan Diskon Penggunaan Berkelanjutan (CUD) di Vertex AI.

Seri A3

Jenis mesin	Harga (USD)
a3-ultragpu-8g	US$96,015616 / 1 hour
a3-megagpu-8g	US$106,65474 / 1 hour

Seri A4

Jenis mesin	Harga (USD)
a4-highgpu-8g	US$148,212 / 1 hour

Seri A4X

Jenis mesin	Harga (USD)
a4x-highgpu-4g	US$74,75 / 1 hour

a4x-highgpu-4g memerlukan setidaknya 18 VM.

Seri G2

Jenis mesin	Harga (USD)
g2-standard-4	US$0,81293 / 1 hour
g2-standard-8	US$0,98181 / 1 hour
g2-standard-12	US$1,15069 / 1 hour
g2-standard-16	US$1,31957 / 1 hour
g2-standard-24	US$2,30138 / 1 hour
g2-standard-32	US$1,99509 / 1 hour
g2-standard-48	US$4,60276 / 1 hour
g2-standard-96	US$9,20552 / 1 hour

Seri G4

Jenis mesin	Harga (USD)
g4-standard-48	US$5,17508763 / 1 hour
g4-standard-96	US$10,35017526 / 1 hour
g4-standard-192	US$20,70035052 / 1 hour
g4-standard-384	US$41,40070104 / 1 hour

Harga TPU v5e

Jenis mesin	Harga (USD)
ct5lp-hightpu-1t	US$1,38 / 1 hour
ct5lp-hightpu-4t	US$5,52 / 1 hour
ct5lp-hightpu-8t	US$5,52 / 1 hour

Harga TPU v6e

Jenis mesin	Harga (USD)
ct6e-standard-1t	US$3,105 / 1 hour
ct6e-standard-4t	US$12,42 / 1 hour
ct6e-standard-8t	US$24,84 / 1 hour

Setiap jenis mesin dikenai biaya sebagai SKU berikut di tagihan Google Cloud Anda:

Biaya vCPU: diukur dalam jam vCPU
Biaya RAM: diukur dalam GB jam
Biaya GPU: jika terintegrasi ke dalam mesin atau dikonfigurasi secara opsional, diukur dalam jam GPU

Harga untuk jenis mesin digunakan untuk memperkirakan total biaya per jam untuk setiap node prediksi dari versi model yang menggunakan jenis mesin tersebut.

Misalnya, jenis mesin n1-highcpu-32 mencakup 32 vCPU dan RAM 32 GB. Oleh karena itu, harga per jam sama dengan 32 jam vCPU + 32 jam GB.

Seri E2

Item	Harga (USD)
vCPU	US$0,0250826 / 1 hour
RAM	US$0,0033614 / 1 gibibyte hour

Seri N1

Item	Harga (USD)
vCPU	US$0,036 / 1 hour
RAM	US$0,005 / 1 gibibyte hour

Seri N2

Item	Harga (USD)
vCPU	US$0,0363527 / 1 hour
RAM	US$0,0048725 / 1 gibibyte hour

Seri N2D

Item	Harga (USD)
vCPU	US$0,0316273 / 1 hour
RAM	US$0,0042389 / 1 gibibyte hour

Seri C2

Item	Harga (USD)
vCPU	US$0,039077 / 1 hour
RAM	US$0,0052325 / 1 gibibyte hour

Seri C2D

Item	Harga (USD)
vCPU	US$0,0339974 / 1 hour
RAM	US$0,0045528 / 1 gibibyte hour

Seri C3

Item	Harga (USD)
vCPU	US$0,03908 / 1 hour
RAM	US$0,00524 / 1 gibibyte hour

Seri A2

Item	Harga (USD)
vCPU	US$0,0363527 / 1 hour
RAM	US$0,0048725 / 1 gibibyte hour
GPU (A100 40 GB)	US$3,3741 / 1 hour
GPU (A100 80 GB)	US$4,51729 / 1 hour

Seri A3

Item	Harga (USD)
vCPU	US$0,0293227 / 1 hour
RAM	US$0,0025534 / 1 gibibyte hour
GPU (H100 80 GB)	US$11,2660332 / 1 hour
GPU (H200)	US$10,708501 / 1 hour

Seri G2

Item	Harga (USD)
vCPU	US$0,02874 / 1 hour
RAM	US$0,00337 / 1 gibibyte hour
GPU (L4)	US$0,64405 / 1 hour

Beberapa jenis mesin memungkinkan Anda menambahkan akselerator GPU opsional untuk prediksi. GPU opsional dikenai biaya tambahan, terpisah dari biaya yang dijelaskan dalam tabel sebelumnya. Lihat setiap tabel harga, yang menjelaskan harga untuk setiap jenis GPU opsional.

Akselerator - harga per jam

Jenis GPU	Harga (USD)
NVIDIA_TESLA_P4	US$0,69 / 1 hour
NVIDIA_TESLA_P100	US$1,679 / 1 hour
NVIDIA_TESLA_T4	US$0,402 / 1 hour
NVIDIA_TESLA_V100	US$2,852 / 1 hour

Harga dihitung per GPU. Jika Anda menggunakan beberapa GPU per node prediksi (atau jika versi Anda diskalakan untuk menggunakan beberapa node),biaya akan diskalakan sebagaimana mestinya.

AI Platform Prediction menyajikan prediksi dari model Anda dengan menjalankan sejumlah virtual machine ("node"). Secara default, Vertex AI otomatis menskalakan jumlah node yang berjalan kapan saja. Untuk prediksi online, jumlah node diskalakan untuk memenuhi permintaan. Setiap node dapat merespons beberapa permintaan prediksi. Untuk prediksi batch, jumlah node diskalakan untuk mengurangi total waktu yang diperlukan untuk menjalankan tugas. Anda dapat menyesuaikan cara node prediksi diskalakan.

Anda akan dikenai biaya untuk waktu setiap node berjalan untuk model Anda, termasuk:

Saat node memproses tugas prediksi batch.
Saat node memproses permintaan prediksi online.
Saat node dalam status siap untuk menyajikan prediksi online.

Biaya satu node yang berjalan selama satu jam adalah jam kerja node. Tabel harga prediksi menjelaskan harga jam kerja node, yang bervariasi antar-region serta antara prediksi online dan prediksi batch.

Anda dapat menggunakan jam kerja node dalam kelipatan pecahan. Misalnya, satu node yang berjalan selama 30 menit memerlukan 0,5 jam kerja node.

Penghitungan biaya untuk jenis mesin Compute Engine (N1)

Waktu berjalan node ditagih dalam kelipatan 30 detik. Artinya, setiap 30 detik, project Anda dikenai biaya untuk resource vCPU, RAM, dan GPU apa pun yang digunakan node Anda pada saat itu selama 30 detik.

Selengkapnya tentang penskalaan otomatis node prediksi

Prediksi online	Prediksi batch
Prioritas penskalaan adalah mengurangi latensi permintaan tertentu. Layanan mempertahankan model dalam kondisi siap selama beberapa menit tanpa aktivitas setelah menayangkan permintaan.	Prioritas penskalaan adalah mengurangi total waktu berlalu tugas.
Penskalaan memengaruhi total biaya setiap bulan: semakin banyak dan sering permintaan, semakin banyak node yang digunakan.	Penskalaan tidak berpengaruh besar pada harga tugas, meskipun ada overhead yang terkait dengan memunculkan node baru.
Anda dapat membiarkan layanan melakukan penyesuaian sebagai respons atas traffic (penskalaan otomatis) atau menentukan jumlah node yang akan terus berjalan untuk menghindari latensi (penskalaan manual). Jika Anda memilih penskalaan otomatis, jumlah node akan diskalakan secara otomatis. Untuk deployment jenis mesin lama AI Platform Prediction (MLS1), jumlah node dapat diperkecil hingga nol selama durasi tanpa traffic. Deployment Vertex AI dan jenis deployment AI Platform Prediction lainnya tidak dapat menurunkan skala hingga nol node. Jika memilih penskalaan manual, Anda menentukan jumlah node yang akan terus berjalan sepanjang waktu. Anda dikenai biaya untuk sepanjang waktu node ini berjalan, mulai saat deployment dan hingga Anda menghapus versi model.	Penskalaan dapat dipengaruhi dengan menetapkan jumlah maksimum node yang digunakan untuk tugas prediksi batch, dan dengan menetapkan jumlah node yang akan terus berjalan untuk suatu model saat Anda menerapkannya.

Prediksi online

Prediksi batch

Prioritas penskalaan adalah mengurangi latensi permintaan tertentu. Layanan mempertahankan model dalam kondisi siap selama beberapa menit tanpa aktivitas setelah menayangkan permintaan.

Prioritas penskalaan adalah mengurangi total waktu berlalu tugas.

Penskalaan memengaruhi total biaya setiap bulan: semakin banyak dan sering permintaan, semakin banyak node yang digunakan.

Penskalaan tidak berpengaruh besar pada harga tugas, meskipun ada overhead yang terkait dengan memunculkan node baru.

Anda dapat membiarkan layanan melakukan penyesuaian sebagai respons atas traffic (penskalaan otomatis) atau menentukan jumlah node yang akan terus berjalan untuk menghindari latensi (penskalaan manual).

Jika Anda memilih penskalaan otomatis, jumlah node akan diskalakan secara otomatis. Untuk deployment jenis mesin lama AI Platform Prediction (MLS1), jumlah node dapat diperkecil hingga nol selama durasi tanpa traffic. Deployment Vertex AI dan jenis deployment AI Platform Prediction lainnya tidak dapat menurunkan skala hingga nol node.
Jika memilih penskalaan manual, Anda menentukan jumlah node yang akan terus berjalan sepanjang waktu. Anda dikenai biaya untuk sepanjang waktu node ini berjalan, mulai saat deployment dan hingga Anda menghapus versi model.

Penskalaan dapat dipengaruhi dengan menetapkan jumlah maksimum node yang digunakan untuk tugas prediksi batch, dan dengan menetapkan jumlah node yang akan terus berjalan untuk suatu model saat Anda menerapkannya.

Tugas prediksi batch dikenai biaya setelah tugas selesai

Tugas prediksi batch dikenai biaya setelah tugas selesai, bukan secara bertahap selama tugas tersebut. Semua pemberitahuan anggaran Penagihan Cloud yang telah dikonfigurasi tidak akan dipicu saat tugas berjalan. Sebelum memulai tugas besar, pertimbangkan untuk menjalankan beberapa tugas benchmark biaya dengan data input kecil terlebih dahulu.

Contoh penghitungan prediksi

Sebuah perusahaan real estat di wilayah Amerika menjalankan prediksi mingguan untuk nilai perumahan di area yang dilayaninya. Dalam satu bulan, platform ini menjalankan prediksi selama empat minggu dalam batch 3920, 4277, 3849, dan 3961. Tugas dibatasi pada satu node dan setiap instance memerlukan rata-rata 0,72 detik pemrosesan.

Pertama, hitung durasi waktu setiap tugas dijalankan:

Memuat...

Setiap tugas berjalan selama lebih dari sepuluh menit, sehingga dikenai biaya untuk setiap menit pemrosesan:

Memuat...

Total tagihan untuk bulan tersebut adalah $0,26.

Contoh ini mengasumsikan tugas berjalan pada satu node dan mengambil jumlah waktu yang konsisten per instance input. Dalam penggunaan sebenarnya, pastikan untuk memperhitungkan beberapa node dan gunakan jumlah waktu sebenarnya yang dihabiskan setiap node untuk menjalankan kalkulasi Anda.

Biaya untuk Vertex Explainable AI

Penjelasan berbasis fitur

Penjelasan berbasis fitur tidak dikenai biaya tambahan untuk harga prediksi. Namun, penjelasan memerlukan waktu pemrosesan yang lebih lama daripada prediksi normal sehingga penggunaan Vertex Explainable AI yang besar beserta penskalaan otomatis dapat mengakibatkan lebih banyak node dimulai, yang akan meningkatkan biaya prediksi.

Penjelasan berbasis contoh

Harga untuk penjelasan berbasis contoh terdiri dari hal berikut:

Saat mengupload model atau memperbarui set data model, Anda akan dikenai biaya:
per jam kerja node untuk tugas prediksi batch yang digunakan untuk menghasilkan representasi ruang laten dari contoh. Biaya ini ditagih dengan tarif yang sama seperti prediksi.
biaya untuk membangun atau memperbarui indeks. Biaya ini sama dengan biaya pengindeksan untuk Vector Search, yaitu jumlah contoh * jumlah dimensi * 4 byte per float * $3,00 per GB. Misalnya, jika Anda memiliki 1 juta contoh dan 1.000 ruang laten dimensi, biayanya adalah $12 (1.000.000 * 1.000 * 4 * 3,00 / 1.000.000.000).
Saat men-deploy ke endpoint, Anda akan dikenai biaya per jam kerja node untuk setiap node di endpoint. Semua komputasi yang terkait dengan endpoint dikenai biaya dengan tarif yang sama seperti prediksi. Namun, karena penjelasan berbasis Contoh memerlukan resource komputasi tambahan untuk menayangkan indeks Penelusuran Vektor, hal ini mengakibatkan lebih banyak node yang dimulai yang meningkatkan biaya prediksi.

Vertex AI Neural Architecture Search

Tabel berikut meringkas harga di setiap region tempat Neural Architecture Search tersedia.

Harga

Tabel berikut memberikan harga per jam untuk berbagai konfigurasi.

Anda dapat memilih tingkat skala bawaan atau konfigurasi kustom dari jenis mesin yang dipilih. Jika Anda memilih konfigurasi kustom, jumlahkan biaya virtual machine yang Anda gunakan.

Jenis mesin lama yang mengaktifkan akselerator mencakup biaya akselerator dalam harganya. Jika Anda menggunakan jenis mesin Compute Engine dan menambahkan akselerator, biaya akselerator akan dihitung terpisah. Untuk menghitung biaya ini, kalikan harga dalam tabel akselerator berikut dengan jumlah setiap jenis akselerator yang Anda gunakan.

Jenis mesin

Jenis mesin	Harga (USD)
n1-standard-4	US$0,2849985 / 1 hour
n1-standard-8	US$0,569997 / 1 hour
n1-standard-16	US$1,139994 / 1 hour
n1-standard-32	US$2,279988 / 1 hour
n1-standard-64	US$4,559976 / 1 hour
n1-standard-96	US$6,839964 / 1 hour
n1-highmem-2	US$0,1774545 / 1 hour
n1-highmem-4	US$0,1774545 / 1 hour
n1-highmem-8	US$0,709818 / 1 hour
n1-highmem-16	US$1,419636 / 1 hour
n1-highmem-32	US$2,839272 / 1 hour
n1-highmem-64	US$5,678544 / 1 hour
n1-highmem-96	US$8,517816 / 1 hour
n1-highcpu-16	US$0,8501832 / 1 hour
n1-highcpu-32	US$1,7003664 / 1 hour
n1-highcpu-64	US$3,4007328 / 1 hour
n1-highcpu-96	US$5,1010992 / 1 hour
a2-highgpu-1g	US$5,641070651 / 1 hour
a2-highgpu-2g	US$11,282141301 / 1 hour
a2-highgpu-4g	US$22,564282603 / 1 hour
a2-highgpu-8g	US$45,128565205 / 1 hour
a2-highgpu-16g	US$90,257130411 / 1 hour
e2-standard-4	US$0,20103426 / 1 hour
e2-standard-8	US$0,40206852 / 1 hour
e2-standard-16	US$0,80413704 / 1 hour
e2-standard-32	US$1,60827408 / 1 hour
e2-highmem-2	US$0,13559949 / 1 hour
e2-highmem-4	US$0,27119898 / 1 hour
e2-highmem-8	US$0,54239796 / 1 hour
e2-highmem-16	US$1,08479592 / 1 hour
e2-highcpu-16	US$0,59364288 / 1 hour
e2-highcpu-32	US$1,18728576 / 1 hour
n2-standard-4	US$0,291354 / 1 hour
n2-standard-8	US$0,582708 / 1 hour
n2-standard-16	US$1,165416 / 1 hour
n2-standard-32	US$2,330832 / 1 hour
n2-standard-48	US$3,496248 / 1 hour
n2-standard-64	US$4,661664 / 1 hour
n2-standard-80	US$5,82708 / 1 hour
n2-highmem-2	US$0,196521 / 1 hour
n2-highmem-4	US$0,393042 / 1 hour
n2-highmem-8	US$0,786084 / 1 hour
n2-highmem-16	US$1,572168 / 1 hour
n2-highmem-32	US$3,144336 / 1 hour
n2-highmem-48	US$4,716504 / 1 hour
n2-highmem-64	US$6,288672 / 1 hour
n2-highmem-80	US$7,86084 / 1 hour
n2-highcpu-16	US$0,860352 / 1 hour
n2-highcpu-32	US$1,720704 / 1 hour
n2-highcpu-64	US$3,441408 / 1 hour
n2-highcpu-80	US$4,30176 / 1 hour
c2-standard-4	US$0,313212 / 1 hour
c2-standard-8	US$0,626424 / 1 hour
c2-standard-16	US$1,252848 / 1 hour
c2-standard-30	US$2,34909 / 1 hour
c2-standard-60	US$4,69818 / 1 hour

Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.

Harga untuk instance a2-highgpu mencakup biaya untuk Akselerator NVIDIA_TESLA_A100 yang terlampir.

Akselerator

Jenis GPU	Harga (USD)
NVIDIA_TESLA_A100	US$4,400862 / 1 hour
NVIDIA_TESLA_P4	US$0,90 / 1 hour
NVIDIA_TESLA_P100	US$2,19 / 1 hour
NVIDIA_TESLA_T4	US$0,525 / 1 hour
NVIDIA_TESLA_V100	US$3,72 / 1 hour

Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.

Disk

Jenis disk	Harga (USD)
pd-standard	US$0,000082192 / 1 gibibyte hour
pd-ssd	US$0,000349315 / 1 gibibyte hour

Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.

Catatan:

Semua penggunaan tunduk pada kebijakan kuota Neural Architecture Search.
Anda harus menyimpan file data dan program dalam bucket Cloud Storage selama siklus proses Neural Architecture Search. Baca selengkapnya tentang penggunaan Cloud Storage.
Untuk mendapatkan diskon berdasarkan volume, hubungi tim Penjualan.
Harga disk hanya dikenakan saat Anda mengonfigurasi ukuran disk setiap VM agar lebih besar dari 100 GB. 100 GB (ukuran disk default) disk pertama untuk setiap VM tidak dikenakan biaya. Misalnya, jika Anda mengonfigurasi setiap VM agar memiliki disk sebesar 105 GB, Anda akan dikenai biaya untuk 5 GB disk untuk setiap VM.

Penggunaan Cloud Storage yang diwajibkan

Selain biaya yang dijelaskan dalam dokumen ini, Anda juga diwajibkan menyimpan file data dan program dalam bucket Cloud Storage selama siklus proses Neural Architecture Search. Penyimpanan ini tunduk pada kebijakan harga Cloud Storage.

Penggunaan Cloud Storage yang diwajibkan meliputi:

Menjalankan penahapan (staging) untuk paket aplikasi pelatihan Anda.
Menyimpan data input pelatihan Anda.

Catatan: Anda dapat menggunakan layanan Google Cloud lain untuk menyimpan data input, seperti BigQuery, yang memiliki harga tersendiri.

Menyimpan output tugas Anda. Neural Architecture Search tidak memerlukan penyimpanan jangka panjang item ini. Anda dapat menghapusnya segera setelah operasi selesai.

Operasi gratis untuk mengelola resource Anda

Operasi pengelolaan resource yang disediakan oleh Neural Architecture Search tersedia tanpa biaya. Kebijakan kuota Neural Architecture Search membatasi beberapa operasi ini.

Resource	Operasi gratis
tugas	get, list, cancel
operasi	get, list, cancel, delete

Vertex AI Pipelines

Vertex AI Pipelines mengenakan biaya eksekusi operasi sebesar $0,03 per Pipeline Run. Anda tidak akan ditagih biaya eksekusi selama rilis Pratinjau. Anda juga membayar resource Google Cloud yang digunakan dengan Vertex AI Pipelines, seperti resource Compute Engine yang digunakan oleh komponen pipeline (dikenai biaya yang sama seperti untuk pelatihan Vertex AI). Terakhir, Anda bertanggung jawab atas biaya layanan (seperti Dataflow) yang dipanggil oleh pipeline Anda.

Vertex AI Feature Store

Vertex AI Feature Store Tersedia Secara Umum (GA) sejak November 2023. Untuk mengetahui informasi tentang versi produk sebelumnya, buka Vertex AI Feature Store (Lama).

Vertex AI Feature Store Baru

Vertex AI Feature Store baru mendukung fungsi di 2 jenis operasi:

Operasi offline adalah operasi untuk mentransfer, menyimpan, mengambil, dan mengubah data di penyimpanan offline (BigQuery)
Operasi online adalah operasi untuk mentransfer data ke toko online dan operasi pada data saat data berada di toko online.

Harga Operasi Offline

Karena BigQuery digunakan untuk operasi offline, lihat harga BigQuery untuk fungsi seperti penyerapan ke toko offline, mengkueri toko offline, dan penyimpanan offline.

Harga Operasi Online

Untuk operasi online, Vertex AI Feature Store mengenakan biaya atas semua fitur GA untuk mentransfer data ke toko online, menyajikan data, atau menyimpan data. Jam kerja node mewakili waktu yang dihabiskan mesin virtual untuk menyelesaikan operasi, yang ditagih per menit.

Operasi	Harga (USD)
Node pemrosesan data Pemrosesan data (misalnya, penyerapan ke penyimpanan, pemantauan, dll.)	US$0,08 / 1 hour
Node penyaluran online yang dioptimalkan Penayangan latensi rendah dan penayangan embedding Setiap node mencakup penyimpanan sebesar 200 GB	US$0,30 / 1 hour
Node penyaluran online Bigtable Menyajikan dengan Cloud Bigtable	US$0,94 / 1 hour
Penyimpanan penyaluran online Bigtable Penyimpanan untuk penyajian dengan Cloud Bigtable	US$0,000342466 / 1 gibibyte hour

Penyaluran online yang dioptimalkan dan penyaluran online Bigtable menggunakan arsitektur yang berbeda, sehingga node-nya tidak sebanding.

Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.

Estimasi Workload Operasi Online

Pertimbangkan panduan berikut saat memperkirakan workload Anda. Jumlah node yang diperlukan untuk workload tertentu dapat berbeda di setiap pendekatan inferensi.

Pemrosesan data:
Penyerapan - Satu node dapat menyerap minimal sekitar 100 MiB data per jam ke Bigtable Online Store atau Optimized Online Store jika tidak ada fungsi analisis yang digunakan.
Penyaluran online Bigtable: Setiap node dapat mendukung sekitar 15.000 QPS dan penyimpanan hingga 5 TB.
Penayangan online yang dioptimalkan: Performa didasarkan pada jenis mesin dan replika, yang dikonfigurasi secara otomatis untuk meminimalkan biaya yang dikenakan pada workload. Setiap node dapat memiliki minimal 2 dan maksimal 6 replika untuk ketersediaan tinggi dan penskalaan otomatis. Anda akan dikenai biaya sesuai dengan jumlah replika. Untuk mengetahui detail selengkapnya, lihat contoh skenario bulanan.
Untuk workload yang tidak terkait embedding, setiap node dapat mendukung sekitar 500 QPS dan penyimpanan hingga 200 GB.
Untuk workload terkait embedding, setiap node dapat mendukung sekitar 500 QPS dan penyimpanan hingga 4 GB data berdimensi 512.

Anda dapat melihat jumlah node (dengan replika) di Metric Explorer:

Metric Explorer untuk mengetahui jumlah node yang telah digunakan.

Contoh Skenario Bulanan (dengan asumsi us-central1)

Workload streaming data - Penyaluran online Bigtable dengan data 2,5 TB (1 GB dimuat ulang setiap hari) dan 1.200 QPS

Operasi	Penggunaan Bulanan	Biaya Bulanan
Node pemrosesan data	(1 GB/hari) * (30 hari/bulan) * (1.000 MB/GB) * (1 node-jam / 100 MB) = 300 node-jam	300 node-jam * ($0,08 per node-jam) = $24
Node penyaluran online yang dioptimalkan	T/A	T/A
Node penyaluran online Bigtable	(1 node) * (24 jam/hari) * (30 hari/bulan) = 720 node-jam	720 node-jam * ($0,94 per node-jam) = $677
Penyimpanan penyaluran online Bigtable	(2,5 TB-bulan) * (1000 GB/TB) = 2.500 GB-bulan	2.500 GB-bulan * ($0,25 per GB-bulan) = $625
Total		$1.326

Workload QPS tinggi - Penyaluran online yang dioptimalkan dengan data non-embedding 10 GB (5 GB dimuat ulang setiap hari) dan 2.000 QPS

Operasi	Penggunaan Bulanan	Biaya Bulanan
Node pemrosesan data	(5 GB/hari) * (30 hari/bulan) * (1.000 MB/GB) * (1 node-jam / 100 MB) = 1.500 node-jam	1.500 jam node * ($0,08 per node-jam) = $120
Node penyaluran online yang dioptimalkan	Roundup(10 GB * (1 node / 200 GB)) = 1 * max(2 replika default, 2.000 QPS * (1 replika / 500 QPS)) = 4 total node * (24 jam/hari) * (30 hari/bulan) =2.880 node-jam	2.880 node-jam * (0,30 per node-jam) = $864
Node penyaluran online Bigtable	T/A	T/A
Penyimpanan penyaluran online Bigtable	T/A	T/A
Total		$984

Workload penyaluran embedding - Penyaluran online yang dioptimalkan dengan data embedding 20 GB (2 GB dimuat ulang setiap hari) dan 800 QPS

Operasi	Penggunaan Bulanan	Biaya Bulanan
Node pemrosesan data	(2 GB/hari) * (30 hari/bulan) * (1.000 MB/GB) * (1 node-jam / 100 MB) = 600 node-jam	600 node-jam * ($0,08 per node-jam) = $48
Node penyaluran online yang dioptimalkan	Roundup(20 GB* (1 node / 4 GB) = 5 * max(2 replika default, 800 QPS * (1 replika / 500 QPS)) = 10 total node * (24 jam/hari) * (30 hari/bulan) = 7.200 node-jam	7.200 node-jam * (0,30 per node-jam) = $2.160
Node penyaluran online Bigtable	T/A	T/A
Penyimpanan penyaluran online Bigtable	T/A	T/A
Total		$2.208

Vertex AI Feature Store (Lama)

Harga untuk Vertex AI Feature Store (Lama) didasarkan pada jumlah data fitur di penyimpanan online dan offline, serta ketersediaan penyaluran online. Node per jam menunjukkan waktu yang dihabiskan virtual machine untuk menyajikan data fitur atau menunggu dalam status siap untuk menangani permintaan data fitur.

Operasi	Harga (USD)
Penyimpanan online	$0,25 per GB-bulan
Penyimpanan offline	$0,023 per GB-bulan
Penyaluran online	$0,94 per node per jam
Ekspor batch	$0,005 per GB
Penyerapan streaming	$0,10 per GB penyerapan

Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.

Saat Anda mengaktifkan pemantauan nilai fitur, penagihan mencakup biaya yang berlaku di atas selain biaya yang berlaku sebagai berikut:

$3,50 per GB untuk semua data yang dianalisis. Dengan mengaktifkan analisis snapshot, snapshot yang diambil untuk data di Vertex AI Feature Store (Lama) akan disertakan. Dengan mengaktifkan analisis fitur impor, batch data yang diserap akan disertakan.
Biaya tambahan untuk operasi Vertex AI Feature Store (Lama) lainnya yang digunakan dengan pemantauan nilai fitur mencakup hal-hal berikut:
Fitur analisis snapshot secara berkala mengambil snapshot nilai fitur berdasarkan konfigurasi Anda untuk interval pemantauan.
Biaya untuk ekspor snapshot sama dengan operasi ekspor batch reguler.

Contoh Analisis Snapshot

Seorang data scientist mengaktifkan pemantauan nilai fitur untuk Vertex AI Feature Store (Lama) dan mengaktifkan pemantauan untuk analisis snapshot harian. Pipeline berjalan setiap hari untuk pemantauan jenis entity. Pipeline memindai data sebesar 2 GB di Vertex AI Feature Store (Lama) dan mengekspor snapshot yang berisi data sebesar 0,1 GB. Total biaya untuk analisis satu hari adalah:

(0,1 GB * $3,50) + (2 GB * $0,005) = $0,36

Contoh Analisis Penyerapan

Seorang data scientist mengaktifkan pemantauan nilai fitur untuk Vertex AI Feature Store (Lama) dan mengaktifkan pemantauan untuk operasi penyerapan. Operasi penyerapan mengimpor data 1 GB ke Vertex AI Feature Store (Lama). Total biaya untuk pemantauan nilai fitur adalah:

(1 GB * $3,50) = $3,50

Vertex ML Metadata

Penyimpanan metadata diukur dalam gigabyte biner (GiB), dengan 1 GiB sama dengan 1.073.741.824 byte. Satuan pengukuran ini juga disebut sebagai gibibyte.

Vertex ML Metadata mengenakan biaya $10 per gibibyte (GiB) per bulan untuk penyimpanan metadata. Harga dihitung secara prorata per megabyte (MB). Misalnya, jika Anda menyimpan 10 MB metadata, Anda akan dikenai biaya $0,10 per bulan untuk 10 MB metadata tersebut.

Harga sama di semua region tempat Vertex ML Metadata didukung.

Vertex AI TensorBoard

Untuk menggunakan Vertex AI TensorBoard, minta agar administrator IAM project menetapkan Anda ke peran "Vertex AI TensorBoard Web App User". Peran Administrator Vertex AI juga memiliki akses.

Mulai Agustus 2023, harga Vertex AI TensorBoard akan diubah dari lisensi bulanan per pengguna sebesar $300/bulan menjadi $10 GiB/bulan untuk penyimpanan data log dan metrik. Artinya, tidak ada lagi biaya langganan. Anda hanya perlu membayar untuk penyimpanan yang telah Anda gunakan. Lihat tutorial Vertex AI TensorBoard: Menghapus Eksperimen TensorBoard yang Sudah Usang untuk mengetahui cara mengelola penyimpanan.

Vertex AI Vizier

Vertex AI Vizier adalah layanan pengoptimalan black-box di dalam Vertex AI. Model penetapan harga Vertex AI Vizier terdiri dari:

Uji coba yang menggunakan RANDOM_SEARCH dan GRID_SEARCH tidak dikenai biaya. Pelajari algoritma penelusuran lebih lanjut.
100 uji coba Vertex AI Vizier pertama per bulan kalender tersedia tanpa biaya (uji coba menggunakan RANDOM_SEARCH dan GRID_SEARCH tidak termasuk dalam jumlah total ini).
Setelah 100 uji coba Vertex AI Vizier, uji coba berikutnya selama bulan kalender yang sama akan dikenai biaya $1 per uji coba (uji coba yang menggunakan RANDOM_SEARCH atau GRID_SEARCH tidak dikenai biaya).

Vector Search

Harga untuk layanan Approximate Nearest Neighbor oleh Vector Search terdiri dari:

Harga per jam kerja node untuk setiap VM yang digunakan untuk menghosting indeks yang di-deploy.
Biaya untuk membuat indeks baru, mengupdate indeks yang ada, dan menggunakan update indeks streaming.

Data yang diproses selama proses build dan pembaruan indeks diukur dalam gigabyte biner (GiB), dengan 1 GiB sama dengan 1.073.741.824 byte. Satuan pengukuran ini juga disebut sebagai gibibyte.

Vector Search mengenakan biaya $3,00 per gibibyte (GiB) data yang diproses di semua region. Vector Search mengenakan biaya $0,45/GiB yang diserap untuk penyisipan Update Streaming.

Tabel berikut meringkas harga penyajian indeks di setiap region tempat Vector Search tersedia. Harganya sesuai dengan jenis mesin, berdasarkan region, dan dikenakan per jam kerja node.

Jenis mesin	Harga (USD)
e2-standard-2	US$0,0938084 / 1 hour
e2-standard-16	US$0,7504672 / 1 hour
e2-highmem-16	US$1,012368 / 1 hour
n2d-standard-32	US$1,8926208 / 1 hour
n1-standard-16	US$1,0639944 / 1 hour
n1-standard-32	US$2,1279888 / 1 hour

Contoh penetapan harga Vector Search

Harga Vector Search ditentukan oleh ukuran data, jumlah kueri per detik (QPS) yang ingin dijalankan, dan jumlah node yang Anda gunakan. Untuk mendapatkan estimasi biaya penayangan, Anda perlu menghitung total ukuran data. Ukuran data adalah jumlah embedding/vektor* jumlah dimensi yang Anda miliki* 4 byte per dimensi. Setelah memiliki ukuran data, Anda dapat menghitung biaya penayangan dan biaya pembuatan. Biaya penayangan ditambah biaya pembuatan sama dengan total biaya bulanan.

Biaya penayangan: # replika/shard * # shard (~ukuran data/ukuran shard) * biaya per jam * 730 jam
Biaya pembuatan: ukuran data(dalam GiB) * $3/GiB * # update/bulan

Streaming update: Penelusuran Vektor menggunakan metrik berbasis heuristik untuk menentukan kapan harus memicu pemadatan. Jika data yang tidak dikompresi terlama sudah berusia lima hari, kompresi akan selalu dipicu. Anda akan dikenai biaya pembuatan ulang indeks dengan tingkat update batch yang sama, selain biaya update streaming.

Jumlah embedding/vektor	Jumlah dimensi	Kueri per detik (QPS)	Jenis Mesin	Node	Estimasi biaya penayangan bulanan (USD)
2 juta	128	100	e2-standard-2	1	$68
20 juta	256	1.000	e2-standard-16	1	$547
20 juta	256	3.000	e2-standard-16	3	$1.642
100 juta	256	500	e2-highmem-16	2	$1.477
1 miliar	100	500	e2-highmem-16	8	$5.910

Semua contoh didasarkan pada jenis mesin di us-central1. Biaya yang Anda keluarkan akan bervariasi sesuai dengan persyaratan latensi dan tingkat perolehan. Estimasi biaya penayangan bulanan terkait langsung dengan jumlah node yang digunakan di konsol. Untuk mempelajari lebih lanjut parameter konfigurasi yang memengaruhi biaya, lihat Parameter konfigurasi yang memengaruhi perolehan dan latensi.

Jika Anda memiliki kueri per detik (QPS) yang tinggi, pengelompokan kueri ini dapat mengurangi total biaya hingga 30%-40%.

Tingkat Penelusuran Vektor yang dioptimalkan untuk penyimpanan

Alih-alih mengelola dan membayar VM individual dan tugas pemadatan terpisah, terdapat dua SKU:

Unit Kapasitas (CU): Ini adalah alat ukur utama untuk penayangan. CU adalah unit gabungan komputasi dan penyimpanan SSD aktif, masing-masing hingga 1 TiB, dengan harga $2,30 per CU, per jam, per replika. Tarif tunggal ini mencakup biaya penyajian dan pengelolaan indeks berkelanjutan. Layanan ini diskalakan secara otomatis dan CU tambahan ditambahkan seiring bertambahnya ukuran indeks.
Unit Tulis: Untuk menambahkan data, ada biaya sebesar $0,45 per GiB. Biaya ini berlaku untuk update indeks batch dan streaming.

Unit	Harga
Unit Kapasitas yang Dioptimalkan untuk Penyimpanan	US$2,30 / 1 hour
Unit Tulis	US$0,45 / 1 gibibyte

Vertex AI Model Registry

Vertex AI Model Registry adalah repositori pusat yang melacak dan mencantumkan model dan versi model Anda. Anda dapat mengimpor model ke Vertex AI dan model tersebut akan muncul di Vertex AI Model Registry. Anda tidak akan dikenai biaya jika memiliki model di Registry Model. Biaya hanya timbul jika Anda men-deploy model ke endpoint atau melakukan prediksi batch pada model. Biaya ini ditentukan oleh jenis model yang Anda deploy.

Untuk mempelajari lebih lanjut harga men-deploy model kustom dari Vertex AI Model Registry, lihat Model yang dilatih khusus. Untuk mempelajari lebih lanjut harga deployment model AutoML, baca artikel Harga untuk model AutoML.

Vertex AI Model Monitoring

Vertex AI memungkinkan Anda memantau efektivitas model yang berkelanjutan setelah di-deploy ke produksi. Untuk mengetahui informasi selengkapnya, lihat Pengantar Pemantauan Model Vertex AI.

Saat menggunakan Pemantauan Model Vertex AI, Anda akan dikenai biaya untuk hal-hal berikut:

$3,50 per GB untuk semua data yang dianalisis, termasuk data pelatihan yang diberikan dan data prediksi yang dicatat ke dalam log dalam tabel BigQuery.
Biaya untuk produk Google Cloud lain yang Anda gunakan dengan Pemantauan Model, seperti penyimpanan BigQuery atau Batch Explain saat pemantauan atribusi diaktifkan.

Pemantauan Model Vertex AI didukung di region berikut: us-central1, europe-west4, asia-east1, dan asia-southeast1. Harga sama untuk semua region.

Ukuran data diukur setelah dikonversi ke format TfRecord.

Set data pelatihan dikenai biaya satu kali saat Anda menyiapkan tugas Pemantauan Model Vertex AI.

Set Data Prediksi terdiri dari log yang dikumpulkan dari layanan Prediksi Online. Karena permintaan prediksi ada selama jangka waktu yang berbeda, data untuk setiap periode waktu akan dikumpulkan dan jumlah data yang dianalisis untuk setiap periode prediksi digunakan untuk menghitung biaya.

Contoh: Data scientist menjalankan pemantauan model pada traffic prediksi yang termasuk dalam modelnya.

Model dilatih dari set data BigQuery. Ukuran data setelah dikonversi ke TfRecord adalah 1,5 GB.
Data prediksi yang dicatat antara pukul 13.00 - 14.00 adalah 0,1 GB, antara pukul 15.00 - 16.00 adalah 0.2 GB.
Total harga untuk menyiapkan tugas pemantauan model adalah:
(1,5 GB * $3,50) + ((0,1 GB + 0,2 GB) * $3,50) = $6,30

Vertex AI Workbench

Pilih instance, notebook terkelola, atau notebook yang dikelola pengguna untuk mendapatkan informasi tentang harga.

Instance

Tabel di bawah memberikan perkiraan harga per jam untuk berbagai konfigurasi VM. Anda dapat memilih konfigurasi kustom dari jenis mesin yang dipilih. Untuk menghitung harga, jumlahkan biaya mesin virtual yang Anda gunakan.

CPU

Jenis mesin	Harga per vCPU (USD)
N1	US$0,0379332 / 1 hour
N2	US$0,0379332 / 1 hour
E2	US$0,026173908 / 1 hour
A2	US$0,0379332 / 1 hour

Memori

Jenis mesin	Harga (USD)
N1	US$0,0050844 / 1 gibibyte hour
N2	US$0,0050844 / 1 gibibyte hour
E2	US$0,003508236 / 1 gibibyte hour
A2	US$0,0050844 / 1 gibibyte hour

Akselerator

Jenis mesin	Harga (USD)
Nvidia Tesla A100	US$4,400862 / 1 hour
Nvidia Tesla A100 80GB	US$4,51729 / 1 hour
Nvidia Tesla T4	US$0,525 / 1 hour
Nvidia Tesla V100	US$3,72 / 1 hour
Nvidia Tesla P100	US$2,19 / 1 hour

Disk

Jenis mesin	Harga (USD)
Ruang yang disediakan Hyperdisk Extreme	US$0,000205479 / 1 gibibyte hour
Ruang yang disediakan Balanced	US$0,000164384 / 1 gibibyte hour
Ruang yang disediakan Extreme	US$0,000205479 / 1 gibibyte hour
Ruang yang disediakan SSD	US$0,000279452 / 1 gibibyte hour
Ruang yang disediakan standar	US$0,000065753 / 1 gibibyte hour

Instance Vertex AI Workbench Anda dikenai biaya sebagai berikut:

Untuk penggunaan CPU dan akselerator, Anda akan dikenai biaya saat instance berada dalam status berikut:
MEMULAI
PENYEDIAAN
ACTIVE
UPGRADING
ROLLBACKING
MEMULIHKAN
BERHENTI
PENANGGUHAN
Untuk penyimpanan disk, Anda akan dikenai biaya saat instance berada dalam status berikut:
MEMULAI
PENYEDIAAN
ACTIVE
UPGRADING
ROLLBACKING
MEMULIHKAN
BERHENTI
DIHENTIKAN
PENANGGUHAN
DITANGGUHKAN

Notebook terkelola

Harga terdiri dari resource komputasi dan penyimpanan yang Anda gunakan, biaya pengelolaan untuk instance Vertex AI Workbench, dan resource cloud tambahan apa pun yang Anda gunakan. Lihat bagian berikut untuk mengetahui detail selengkapnya.

Resource komputasi dan penyimpanan

Resource komputasi dan penyimpanan dikenai biaya dengan tarif yang sama dengan yang Anda bayar saat ini untuk Compute Engine dan Cloud Storage.

Biaya pengelolaan

Terdapat biaya pengelolaan Vertex AI Workbench selain penggunaan infrastruktur Anda, yang ditunjukkan pada tabel di bawah.

SKU	Harga (USD)
vCPU	$0,05 per vCPU
T4 dan P4 (GPU Standar)	$0,35 per GPU
GPU P100, V100, L4, dan A100 (GPU Premium)	$2,48 per GPU

Notebook yang dikelola pengguna

Resource komputasi dan penyimpanan

Resource komputasi dan penyimpanan dikenai biaya dengan tarif yang sama dengan yang Anda bayar saat ini untuk Compute Engine dan Cloud Storage.

Biaya pengelolaan

Terdapat biaya pengelolaan Vertex AI Workbench selain penggunaan infrastruktur Anda, yang ditunjukkan pada tabel di bawah.

SKU	Harga (USD)
vCPU	$0,005 per vCPU
T4 dan P4 (GPU Standar)	$0,035 per GPU
GPU P100, V100, dan A100 (GPU Premium)	$0,25 per GPU

Referensi Google Cloud tambahan

Selain biaya yang disebutkan sebelumnya, Anda juga membayar untuk setiap resource Google Cloud yang digunakan. Contoh:

Layanan analisis data: Anda dikenai biaya BigQuery saat menerbitkan kueri SQL dalam notebook (lihat harga BigQuery).
Kunci enkripsi yang dikelola pelanggan: Anda akan dikenai biaya saat menggunakan kunci enkripsi yang dikelola pelanggan. Setiap kali notebook terkelola atau instance notebook yang dikelola pengguna menggunakan kunci Cloud Key Management Service, operasi tersebut akan ditagih sesuai tarif operasi kunci Cloud KMS (lihat Harga Cloud Key Management Service).

Colab Enterprise

Untuk informasi harga Colab Enterprise, lihat Harga Colab Enterprise.

Deep Learning Containers, Deep Learning VM, dan AI Platform Pipelines

Untuk Deep Learning Containers, Deep Learning VM Image, dan AI Platform Pipelines, harga dihitung berdasarkan resource komputasi dan penyimpanan yang Anda gunakan. Resource ini ditagih dengan tarif yang sama dengan yang Anda bayar saat ini untuk Compute Engine dan Cloud Storage.

Selain biaya komputasi dan penyimpanan, Anda juga membayar untuk setiap resource Google Cloud yang digunakan. Contoh:

Layanan analisis data: Anda dikenai biaya BigQuery saat menerbitkan kueri SQL dalam notebook (lihat harga BigQuery).
Kunci enkripsi yang dikelola pelanggan: Anda akan dikenai biaya saat menggunakan kunci enkripsi yang dikelola pelanggan. Setiap kali notebook terkelola atau instance notebook yang dikelola pengguna menggunakan kunci Cloud Key Management Service, operasi tersebut akan ditagih sesuai tarif operasi kunci Cloud KMS (lihat Harga Cloud Key Management Service).

Pelabelan data

Dengan Vertex AI, Anda dapat meminta pelabelan manusia untuk kumpulan data yang akan digunakan untuk melatih model machine learning kustom. Harga untuk layanan dihitung berdasarkan jenis tugas pelabelan.

Untuk tugas pelabelan reguler, harga ditentukan oleh jumlah unit anotasi.
Untuk tugas klasifikasi gambar, unit ditentukan oleh jumlah gambar dan jumlah pemberi label manual. Misalnya, gambar dengan 3 pemberi label manual dihitung untuk 1 * 3 = 3 unit. Harga untuk klasifikasi label tunggal dan multi-label sama.
Untuk tugas kotak pembatas gambar, unit ditentukan oleh jumlah kotak pembatas yang diidentifikasi dalam gambar dan jumlah pemberi label manual. Misalnya, jika gambar dengan 2 kotak pembatas dan 3 pemberi label manual dihitung untuk 2 * 3 = 6 unit. Gambar tanpa kotak pembatas tidak akan dikenakan biaya.
Untuk tugas segmentasi gambar/rotasi kotak/polyline/poligon, unit ditentukan dengan cara yang sama seperti tugas kotak pembatas gambar.
Untuk tugas klasifikasi video, unit ditentukan berdasarkan durasi video (setiap 5 detik adalah unit harga) dan jumlah pemberi label manual. Misalnya, video berdurasi 25 detik dengan 3 pemberi label manual dihitung untuk 25 / 5 * 3 = 15 unit. Harga untuk klasifikasi label tunggal dan multi-label sama.
Untuk tugas pelacakan objek video, unit ditentukan oleh jumlah objek yang diidentifikasi dalam video dan jumlah pemberi label manual. Misalnya, untuk video yang memiliki 2 objek dan 3 pemberi label manual, jumlah tersebut akan dihitung untuk 2 * 3 = 6 unit. Video tanpa objek tidak akan dikenakan biaya.
Untuk tugas pengenalan tindakan video, unit ditentukan dengan cara yang sama seperti tugas pelacakan objek video.
Untuk tugas klasifikasi teks, unit ditentukan berdasarkan panjang teks (setiap 50 kata adalah unit harga) dan jumlah pemberi label manual. Misalnya, satu teks dengan 100 kata dan 3 pemberi label manual dihitung untuk 100 / 50 * 3 = 6 unit. Harga untuk klasifikasi label tunggal dan multi-label sama.
Untuk tugas sentimen teks, unit ditentukan dengan cara yang sama seperti tugas klasifikasi teks.
Untuk tugas ekstraksi entity teks, unit ditentukan oleh panjang teks (setiap 50 kata adalah unit harga), jumlah entity yang diidentifikasi, dan jumlah pemberi label manual. Misalnya, satu teks dengan 100 kata, 2 entity yang diidentifikasi, dan 3 pemberi label manual dihitung untuk 100 / 50 * 2 * 3 = 12 unit. Teks tanpa entity tidak akan ditagih.
Untuk klasifikasi gambar/video/teks dan tugas sentimen teks, pemberi label manual dapat kehilangan pelacakan class jika ukuran set label terlalu besar. Karenanya, kami mengirim maksimal 20 class ke pemberi label manual dalam satu waktu. Misalnya, jika ukuran kumpulan label tugas pelabelan adalah 40, setiap item data akan dikirim untuk peninjauan manual 40 / 20 = 2 kali, dan kami akan menagih 2 kali lipat dari harga tersebut (sebagaimana dihitung di atas).
Untuk tugas pelabelan yang mengaktifkan fitur pemberi label kustom, setiap item data dihitung sebagai 1 unit pemberi label kustom.
Untuk tugas pelabelan pembelajaran aktif pada item data dengan anotasi yang dihasilkan oleh model (tanpa bantuan pemberi label dari manusia), setiap item data dihitung sebagai 1 unit pembelajaran aktif.
Untuk tugas pelabelan pembelajaran aktif pada item data dengan anotasi yang dihasilkan oleh pemberi label manusia, setiap item data dihitung sebagai tugas pelabelan reguler seperti yang dijelaskan di atas.

Tabel di bawah memberikan harga per 1.000 unit per pemberi label manual, berdasarkan unit yang tercantum untuk setiap tujuan. Harga Paket 1 berlaku untuk 50.000 unit pertama per bulan di setiap project Google Cloud. Harga Paket 2 berlaku untuk 950.000 unit berikutnya per bulan dalam project, hingga 1.000.000 unit. Hubungi kami untuk mengetahui harga di atas 1.000.000 unit per bulan.

Jenis data	Tujuan	Unit	Harga Paket 1 (USD)	Harga Paket 2 (USD)
Gambar	Klasifikasi	Gambar	$35	$25
	Kotak pembatas	Kotak pembatas	$63	$49
	Segmentation	Segmen	$870	$850
	Kotak yang diputar	Kotak pembatas	$86	$60
	Poligon/polyline	Poligon/Polyline	$257	$180
Video	Klasifikasi	Video 5 detik	$86	$60
	Pelacakan objek	Kotak pembatas	$86	$60
	Pengenalan tindakan	Peristiwa dalam video 30 detik	$214	$150
Teks	Klasifikasi	50 kata	$129	$90
	Sentimen	50 kata	$200	$140
	Ekstraksi entity	Entity	$86	$60
Pembelajaran aktif	Semua	Item data	$80	$56
Pemberi label kustom	Semua	Item data	$80	$56

Penggunaan Cloud Storage yang diwajibkan

Selain biaya yang dijelaskan dalam dokumen ini, Anda juga harus menyimpan file data dan program dalam bucket Cloud Storage selama siklus proses Vertex AI. Penyimpanan ini tunduk pada kebijakan harga Cloud Storage.

Penggunaan Cloud Storage yang diwajibkan meliputi:

Melakukan staging pada paket aplikasi pelatihan Anda untuk model yang dilatih kustom.
Menyimpan data input pelatihan Anda.
Menyimpan output tugas pelatihan Anda. Vertex AI tidak memerlukan penyimpanan item ini dalam jangka panjang. Anda dapat menghapusnya segera setelah operasi selesai.

Operasi gratis untuk mengelola resource Anda

Operasi pengelolaan resource yang disediakan oleh AI Platform tersedia tanpa biaya. Kebijakan kuota AI Platform membatasi beberapa operasi ini.

Resource	Operasi gratis
yang paling canggih	create, get, list, delete
versi	create, get, list, delete, setDefault
tugas	get, list, cancel
operasi	get, list, cancel, delete

Biaya Google Cloud

Jika Anda menyimpan gambar yang akan dianalisis di Cloud Storage atau menggunakan resource Google Cloud lain bersama dengan Vertex AI, Anda juga akan dikenai biaya atas penggunaan layanan tersebut.

Untuk melihat status penagihan saat ini di Konsol Google Cloud, beserta penggunaan dan tagihan Anda saat ini, lihat halaman Penagihan. Untuk detail selengkapnya tentang cara mengelola akun, lihat Dokumentasi Penagihan Cloud atau Dukungan Penagihan dan Pembayaran.

Langkah selanjutnya

Baca dokumentasi Vertex AI.
Pelajari solusi dan kasus penggunaan Vertex AI.

Meminta penawaran harga khusus

Dengan harga bayar sesuai penggunaan Google Cloud, Anda hanya membayar untuk layanan yang Anda gunakan. Hubungi tim penjualan kami untuk mendapatkan penawaran harga khusus bagi organisasi Anda.