Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.
Biaya untuk Vertex AI tetap sama seperti untuk produk AI Platform dan AutoML lama yang digantikan oleh Vertex AI, dengan pengecualian berikut:
Vertex AI juga menawarkan lebih banyak cara untuk mengoptimalkan biaya, seperti berikut:
Untuk mengetahui informasi harga AI Generatif di Vertex AI, lihat Harga AI Generatif di Vertex AI.
Untuk model Vertex AI AutoML, Anda membayar tiga aktivitas utama:
Vertex AI menggunakan konfigurasi mesin yang telah ditetapkan untuk model Vertex AutoML, dan tarif per jam untuk aktivitas ini mencerminkan penggunaan resource.
Waktu yang diperlukan untuk melatih model bergantung pada ukuran dan kompleksitas data pelatihan Anda. Model harus di-deploy sebelum dapat memberikan prediksi online atau penjelasan online.
Anda membayar untuk setiap model yang di-deploy ke endpoint, meskipun tidak ada prediksi yang dibuat. Anda harus membatalkan deployment model agar tidak dikenai biaya tambahan. Model yang tidak di-deploy atau gagal di-deploy tidak dikenakan biaya.
Anda hanya membayar untuk jam komputasi yang digunakan; jika pelatihan gagal karena alasan selain pembatalan yang dimulai oleh pengguna, Anda tidak akan ditagih. Anda akan dikenai biaya untuk waktu pelatihan jika membatalkan operasi.
Pilih jenis model di bawah untuk mendapatkan informasi harga.
Data gambar
Operasi | Harga (klasifikasi) (USD) | Harga (deteksi objek) (USD) |
|---|---|---|
Pelatihan | US$3,465 / 1 hour | US$3,465 / 1 hour |
Pelatihan (Model di perangkat edge) | US$18,00 / 1 hour | US$18,00 / 1 hour |
Deployment dan prediksi online | US$1,375 / 1 hour | US$2,002 / 1 hour |
Prediksi batch | US$2,222 / 1 hour | US$2,222 / 1 hour |
Data tabular
Operasi | Harga per jam kerja node untuk klasifikasi/regresi | Harga untuk perkiraan |
|---|---|---|
Pelatihan | US$21,252 / 1 hour | Lihat Perkiraan Vertex AI |
Inferensi | Harga yang sama dengan inferensi untuk model yang dilatih khusus. Vertex AI melakukan inferensi batch menggunakan 40 mesin n1-highmem-8. | Lihat Perkiraan Vertex AI |
Biaya inferensi untuk Vertex Explainable AI
Komputasi yang terkait dengan Vertex Explainable AI ditagih dengan tarif yang sama seperti inferensi. Namun, penjelasan memerlukan waktu pemrosesan yang lebih lama daripada inferensi normal sehingga penggunaan Vertex Explainable AI yang besar beserta penskalaan otomatis dapat mengakibatkan lebih banyak node dimulai, yang akan meningkatkan biaya inferensi.
AutoML
Panggung | Harga |
|---|---|
Prediksi | 0 count to 1,000,000 count US$0,20 / 1,000 count, per 1 month / account 1,000,000 count to 50,000,000 count US$0,10 / 1,000 count, per 1 month / account 50,000,000 count and above US$0,02 / 1,000 count, per 1 month / account |
Pelatihan | US$21,252 / 1 hour |
Explainable AI | Penjelasan menggunakan nilai Shapley. Lihat halaman harga Inferensi dan Penjelasan Vertex AI. |
* Titik data prediksi adalah satu titik waktu di cakrawala perkiraan. Misalnya, dengan perincian harian, horizon 7 hari adalah 7 poin per setiap deret waktu.
ARIMA+
Panggung | Harga |
|---|---|
Prediksi | US$5,00 / 1,000 count |
Pelatihan | $250,00 per TB x Jumlah Model Kandidat x Jumlah Jendela Uji Coba* |
Explainable AI | Penjelasan dengan dekomposisi deret waktu tidak menambahkan biaya tambahan. Penjelasan menggunakan nilai Shapley tidak didukung. |
Lihat halaman harga BigQuery ML untuk mengetahui detail lainnya. Setiap tugas pelatihan dan prediksi akan dikenai biaya untuk 1 operasi pipeline terkelola, seperti yang dijelaskan dalam harga Vertex AI.
* Periode percobaan ulang dibuat untuk setiap periode dalam set pengujian. AUTO_ARIMA_MAX_ORDER yang digunakan menentukan jumlah model kandidat. Rentangnya antara 6-42 untuk model dengan beberapa deret waktu.
Pelatihan
Tabel di bawah ini memberikan perkiraan harga per jam untuk berbagai konfigurasi pelatihan. Anda dapat memilih konfigurasi kustom dari jenis mesin yang dipilih. Untuk menghitung harga, jumlahkan biaya mesin virtual yang Anda gunakan.
Jika Anda menggunakan jenis mesin Compute Engine dan menambahkan akselerator, biaya akselerator akan dihitung terpisah. Untuk menghitung biaya ini, kalikan harga dalam tabel akselerator di bawah ini dengan jumlah jam mesin setiap jenis akselerator yang Anda gunakan.
Jenis mesin
Anda dapat menggunakan VM Spot dengan pelatihan kustom Vertex AI. Spot VM ditagih sesuai dengan harga Spot VM Compute Engine. Terdapat biaya pengelolaan pelatihan kustom Vertex AI selain penggunaan infrastruktur Anda, yang ditunjukkan pada tabel berikut.
Anda dapat menggunakan reservasi Compute Engine dengan pelatihan kustom Vertex AI. Saat menggunakan reservasi Compute Engine, Anda akan ditagih sesuai dengan Harga Compute Engine, termasuk diskon abonemen (CUD) yang berlaku. Terdapat biaya pengelolaan pelatihan kustom Vertex AI selain penggunaan infrastruktur Anda, yang ditunjukkan pada tabel berikut.
Jenis mesin | Harga (USD) |
|---|---|
g4-standard-48 | US$5,17508763 / 1 hour |
g4-standard-96 | US$10,35017526 / 1 hour |
g4-standard-192 | US$20,70035052 / 1 hour |
g4-standard-384 | US$41,40070104 / 1 hour |
n1-standard-4 | US$0,21849885 / 1 hour |
n1-standard-8 | US$0,4369977 / 1 hour |
n1-standard-16 | US$0,8739954 / 1 hour |
n1-standard-32 | US$1,7479908 / 1 hour |
n1-standard-64 | US$3,4959816 / 1 hour |
n1-standard-96 | US$5,2439724 / 1 hour |
n1-highmem-2 | US$0,13604845 / 1 hour |
n1-highmem-4 | US$0,2720969 / 1 hour |
n1-highmem-8 | US$0,5441938 / 1 hour |
n1-highmem-16 | US$1,0883876 / 1 hour |
n1-highmem-32 | US$2,1767752 / 1 hour |
n1-highmem-64 | US$4,3535504 / 1 hour |
n1-highmem-96 | US$6,5303256 / 1 hour |
n1-highcpu-16 | US$0,65180712 / 1 hour |
n1-highcpu-32 | US$1,30361424 / 1 hour |
n1-highcpu-64 | US$2,60722848 / 1 hour |
n1-highcpu-96 | US$3,91084272 / 1 hour |
a2-highgpu-1g* | US$4,425248914 / 1 hour |
a2-highgpu-2g* | US$8,850497829 / 1 hour |
a2-highgpu-4g* | US$17,700995658 / 1 hour |
a2-highgpu-8g* | US$35,401991315 / 1 hour |
a2-megagpu-16g* | US$65,707278915 / 1 hour |
a3-highgpu-8g* | US$101,007352 / 1 hour |
a3-megagpu-8g* | US$106,0464232 / 1 hour |
a3-ultragpu-8g* | US$99,7739296 / 1 hour |
a4-highgpu-8g* | US$148,212 / 1 hour |
e2-standard-4 | US$0,154126276 / 1 hour |
e2-standard-8 | US$0,308252552 / 1 hour |
e2-standard-16 | US$0,616505104 / 1 hour |
e2-standard-32 | US$1,233010208 / 1 hour |
e2-highmem-2 | US$0,103959618 / 1 hour |
e2-highmem-4 | US$0,207919236 / 1 hour |
e2-highmem-8 | US$0,415838472 / 1 hour |
e2-highmem-16 | US$0,831676944 / 1 hour |
e2-highcpu-16 | US$0,455126224 / 1 hour |
e2-highcpu-32 | US$0,910252448 / 1 hour |
n2-standard-4 | US$0,2233714 / 1 hour |
n2-standard-8 | US$0,4467428 / 1 hour |
n2-standard-16 | US$0,8934856 / 1 hour |
n2-standard-32 | US$1,7869712 / 1 hour |
n2-standard-48 | US$2,6804568 / 1 hour |
n2-standard-64 | US$3,5739424 / 1 hour |
n2-standard-80 | US$4,467428 / 1 hour |
n2-highmem-2 | US$0,1506661 / 1 hour |
n2-highmem-4 | US$0,3013322 / 1 hour |
cloud-tpu | Harga ditentukan oleh jenis akselerator. Lihat 'Akselerator'. |
n2-highmem-8 | US$0,6026644 / 1 hour |
n2-highmem-16 | US$1,2053288 / 1 hour |
n2-highmem-32 | US$2,4106576 / 1 hour |
n2-highmem-48 | US$3,6159864 / 1 hour |
n2-highmem-64 | US$4,8213152 / 1 hour |
n2-highmem-80 | US$6,026644 / 1 hour |
n2-highcpu-16 | US$0,6596032 / 1 hour |
n2-highcpu-32 | US$1,3192064 / 1 hour |
n2-highcpu-48 | US$1,9788096 / 1 hour |
n2-highcpu-64 | US$2,6384128 / 1 hour |
n2-highcpu-80 | US$3,298016 / 1 hour |
c2-standard-4 | US$0,2401292 / 1 hour |
c2-standard-8 | US$0,4802584 / 1 hour |
c2-standard-16 | US$0,9605168 / 1 hour |
c2-standard-30 | US$1,800969 / 1 hour |
c2-standard-60 | US$3,601938 / 1 hour |
m1-ultramem-40 | US$7,237065 / 1 hour |
m1-ultramem-80 | US$14,47413 / 1 hour |
m1-ultramem-160 | US$28,94826 / 1 hour |
m1-megamem-96 | US$12,249984 / 1 hour |
*Jumlah ini mencakup harga GPU, karena jenis instance ini selalu memerlukan jumlah akselerator GPU yang tetap.
Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.
Akselerator
Jenis mesin | Harga (USD) | Biaya Pengelolaan Vertex |
|---|---|---|
NVIDIA_TESLA_A100 | US$2,933908 / 1 hour | US$0,4400862 / 1 hour |
NVIDIA_TESLA_A100_80GB | US$3,92808 / 1 hour | US$0,589212 / 1 hour |
NVIDIA_H100_80GB | US$9,79655057 / 1 hour | US$1,4694826 / 1 hour |
NVIDIA_H200_141GB | US$10,708501 / 1 hour | Tidak tersedia |
NVIDIA_H100_MEGA_80GB | US$11,8959171 / 1 hour | Tidak tersedia |
NVIDIA_TESLA_L4 | US$0,644046276 / 1 hour | Tidak tersedia |
NVIDIA_TESLA_P4 | US$0,69 / 1 hour | Tidak tersedia |
NVIDIA_TESLA_P100 | US$1,679 / 1 hour | Tidak tersedia |
NVIDIA_TESLA_T4 | US$0,4025 / 1 hour | Tidak tersedia |
NVIDIA_TESLA_V100 | US$2,852 / 1 hour | Tidak tersedia |
TPU_V2 Single (8 core) | US$5,175 / 1 hour | Tidak tersedia |
Pod TPU_V2 (32 core)* | US$27,60 / 1 hour | Tidak tersedia |
TPU_V3 Single (8 core) | US$9,20 / 1 hour | Tidak tersedia |
Pod TPU_V3 (32 core)* | US$36,80 / 1 hour | Tidak tersedia |
Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.
* Harga pelatihan menggunakan Pod Cloud TPU didasarkan pada jumlah core dalam Pod. Jumlah core dalam sebuah pod selalu kelipatan 32. Untuk menentukan harga pelatihan pada Pod yang memiliki lebih dari 32 core, ambil harga untuk Pod 32 core, lalu kalikan dengan jumlah core, yang dibagi 32. Misalnya, untuk Pod 128 core, harganya adalah (harga Pod 32 core) * (128/32). Untuk mengetahui informasi tentang Pod Cloud TPU yang tersedia untuk region tertentu, lihat Arsitektur Sistem di dokumentasi Cloud TPU.
Disk
Jenis mesin | Harga (USD) |
|---|---|
pd-standard | US$0,000063014 / 1 gibibyte hour |
pd-ssd | US$0,000267808 / 1 gibibyte hour |
Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.
Anda akan dikenai biaya untuk melatih model sejak resource disediakan untuk suatu tugas hingga tugas tersebut selesai.
Peringatan: Tugas pelatihan Anda dibatasi oleh kebijakan kuota Vertex AI. Jika memilih cluster pemrosesan yang sangat kuat untuk tugas pelatihan pertama, kemungkinan Anda akan melebihi kuota yang ditetapkan.
Tingkatan skala untuk konfigurasi yang telah ditetapkan (AI Platform Training)
Anda dapat mengontrol jenis kluster pemrosesan yang akan digunakan saat melatih model. Cara yang paling mudah adalah dengan memilih salah satu konfigurasi bawaan yang disebut tingkat skala. Baca lebih lanjut tentang tingkat skala.
Jenis mesin untuk konfigurasi kustom
Jika menggunakan Vertex AI atau memilih CUSTOM sebagai tingkat skala untuk AI Platform Training, Anda memiliki kontrol atas jumlah dan jenis virtual machine yang akan digunakan untuk master, worker, dan server parameter cluster. Baca selengkapnya tentang jenis mesin untuk Vertex AI dan jenis mesin untuk AI Platform Training.
Biaya pelatihan dengan cluster pemrosesan kustom adalah gabungan dari semua mesin yang Anda tentukan. Anda dikenai biaya untuk total waktu tugas, bukan untuk waktu pemrosesan aktif masing-masing mesin.
Untuk metrik berbasis model, biaya hanya dikenakan untuk biaya prediksi yang terkait dengan model penilaian otomatis yang mendasarinya. Model ini ditagih berdasarkan token input yang Anda berikan dalam set data evaluasi dan output autorater.
Layanan Evaluasi AI Generatif kini tersedia secara umum (GA). Perubahan harga mulai berlaku pada 14 April 2025.
Metrik | Harga |
|---|---|
Pointwise | Model penilaian otomatis default Gemini 2.0 Flash |
Pairwise | Model penilaian otomatis default Gemini 2.0 Flash |
Metrik berbasis komputasi dikenakan biaya $0,00003 per 1.000 karakter untuk input dan $0,00009 per 1.000 karakter untuk output. Metrik ini disebut sebagai Metrik Otomatis di SKU.
Nama Metrik | Jenis |
|---|---|
Pencocokan Persis | Berbasis komputasi |
Bleu | Berbasis komputasi |
Rouge | Berbasis komputasi |
Panggilan Alat Valid | Berbasis komputasi |
Pencocokan Nama Alat | Berbasis komputasi |
Pencocokan Kunci Parameter Alat | Berbasis komputasi |
Tool Parameter KV Match | Berbasis komputasi |
Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.
Metrik berbasis model lama dikenakan biaya $0,005 per 1.000 karakter untuk input dan $0,015 per 1.000 karakter untuk output.
Nama Metrik | Jenis |
|---|---|
Coherence | Pointwise |
Fluency | Pointwise |
Fulfillment | Pointwise |
Keamanan | Pointwise |
Groundedness | Pointwise |
Kualitas Ringkasan | Pointwise |
Kegunaan Ringkasan | Pointwise |
Panjang Ringkasan | Pointwise |
Kualitas Penjawaban Pertanyaan | Pointwise |
Relevansi Penjawaban Pertanyaan | Pointwise |
Manfaat Penjawaban Pertanyaan | Pointwise |
Keakuratan Penjawaban Pertanyaan | Pointwise |
Kualitas Ringkasan Berpasangan | Pairwise |
Kualitas Jawaban Pertanyaan Berpasangan | Pairwise |
Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.
Vertex AI Agent Engine adalah serangkaian layanan bagi developer untuk menskalakan agen dalam produksi. Saat ini, harga telah ditetapkan untuk runtime Agent Engine. Harga untuk layanan Agent Engine lainnya seperti Sesi, Bank Memori, dan Eksekusi Kode, akan dipublikasikan di kemudian hari (saat ini layanan tersebut dapat digunakan secara gratis).
Harga didasarkan pada resource komputasi (jam vCPU) dan memori (jam GiB) yang digunakan oleh agen yang di-deploy ke runtime Agent Engine. Penagihan dibulatkan ke detik terdekat dari penggunaan. Waktu tidak aktif agen tidak ditagih.
Untuk membantu Anda memulai runtime, kami menawarkan paket gratis bulanan.
Setelah penggunaan bulanan Anda melebihi tingkat gratis, penagihan akan dimulai sesuai tarif di bawah.
Resource | Harga (USD) |
|---|---|
vCPU | 0 hour to 50 hour US$0,00 (Free) / 3,600 second, per 1 month / project 50 hour and above US$0,0994 / 3,600 second, per 1 month / project |
RAM | 0 gigabyte hour to 100 gigabyte hour US$0,00 (Free) / 3,600 gibibyte second, per 1 month / project 100 gigabyte hour and above US$0,0105 / 3,600 gibibyte second, per 1 month / project |
Mulai 6 November 2025, harga runtime Agent Engine telah disederhanakan menjadi satu tarif, yang diterapkan untuk semua region tempat runtime Agent Engine tersedia.
Pelatihan
Tabel di bawah ini memberikan perkiraan harga per jam untuk berbagai konfigurasi pelatihan. Anda dapat memilih konfigurasi kustom dari jenis mesin yang dipilih. Untuk menghitung harga, jumlahkan biaya mesin virtual yang Anda gunakan.
Jika Anda menggunakan jenis mesin Compute Engine dan menambahkan akselerator, biaya akselerator akan dihitung terpisah. Untuk menghitung biaya ini, kalikan harga dalam tabel akselerator di bawah ini dengan jumlah jam mesin setiap jenis akselerator yang Anda gunakan.
Jenis mesin
Jenis mesin | Harga (USD) |
|---|---|
n1-standard-4 | US$0,2279988 / 1 hour |
n1-standard-8 | US$0,4559976 / 1 hour |
n1-standard-16 | US$0,9119952 / 1 hour |
n1-standard-32 | US$1,8239904 / 1 hour |
n1-standard-64 | US$3,6479808 / 1 hour |
n1-standard-96 | US$5,4719712 / 1 hour |
n1-highmem-2 | US$0,1419636 / 1 hour |
n1-highmem-4 | US$0,2839272 / 1 hour |
n1-highmem-8 | US$0,5678544 / 1 hour |
n1-highmem-16 | US$1,1357088 / 1 hour |
n1-highmem-32 | US$2,2714176 / 1 hour |
n1-highmem-64 | US$4,5428352 / 1 hour |
n1-highmem-96 | US$6,8142528 / 1 hour |
n1-highcpu-16 | US$0,68014656 / 1 hour |
n1-highcpu-32 | US$1,36029312 / 1 hour |
n1-highcpu-64 | US$2,72058624 / 1 hour |
n1-highcpu-96 | US$4,08087936 / 1 hour |
a2-highgpu-1g* | US$4,408062 / 1 hour |
a2-highgpu-2g* | US$8,816124 / 1 hour |
a2-highgpu-4g* | US$17,632248 / 1 hour |
a2-highgpu-8g* | US$35,264496 / 1 hour |
a2-highgpu-16g* | US$70,528992 / 1 hour |
a3-highgpu-8g* | US$105,39898088 / 1 hour |
a3-megagpu-8g* | US$110,65714224 / 1 hour |
a4-highgpu-8g* | US$148,212 / 1 hour |
e2-standard-4 | US$0,16082748 / 1 hour |
e2-standard-4 | US$0,32165496 / 1 hour |
e2-standard-16 | US$0,64330992 / 1 hour |
e2-standard-32 | US$1,28661984 / 1 hour |
e2-highmem-2 | US$0,10847966 / 1 hour |
e2-highmem-4 | US$0,21695932 / 1 hour |
e2-highmem-8 | US$0,43391864 / 1 hour |
e2-highmem-16 | US$0,86783728 / 1 hour |
e2-highcpu-16 | US$0,4749144 / 1 hour |
e2-highcpu-32 | US$0,9498288 / 1 hour |
n2-standard-4 | US$0,2330832 / 1 hour |
n2-standard-8 | US$0,4661664 / 1 hour |
n2-standard-16 | US$0,9323328 / 1 hour |
n2-standard-32 | US$1,8646656 / 1 hour |
n2-standard-48 | US$2,7969984 / 1 hour |
n2-standard-64 | US$3,7293312 / 1 hour |
n2-standard-80 | US$4,661664 / 1 hour |
n2-highmem-2 | US$0,1572168 / 1 hour |
n2-highmem-4 | US$0,3144336 / 1 hour |
n2-highmem-8 | US$0,6288672 / 1 hour |
n2-highmem-16 | US$1,2577344 / 1 hour |
n2-highmem-32 | US$2,5154688 / 1 hour |
n2-highmem-48 | US$3,7732032 / 1 hour |
n2-highmem-64 | US$5,0309376 / 1 hour |
n2-highmem-80 | US$6,288672 / 1 hour |
n2-highcpu-16 | US$0,6882816 / 1 hour |
n2-highcpu-32 | US$1,3765632 / 1 hour |
n2-highcpu-48 | US$2,0648448 / 1 hour |
n2-highcpu-64 | US$2,7531264 / 1 hour |
n2-highcpu-80 | US$3,441408 / 1 hour |
c2-standard-4 | US$0,2505696 / 1 hour |
c2-standard-8 | US$0,5011392 / 1 hour |
c2-standard-16 | US$1,0022784 / 1 hour |
c2-standard-30 | US$1,879272 / 1 hour |
c2-standard-60 | US$3,758544 / 1 hour |
m1-ultramem-40 | US$7,55172 / 1 hour |
m1-ultramem-80 | US$15,10344 / 1 hour |
m1-ultramem-160 | US$30,20688 / 1 hour |
m1-megamem-96 | US$12,782592 / 1 hour |
cloud-tpu | Harga ditentukan oleh jenis akselerator. Lihat 'Akselerator'. |
Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.
Akselerator
Jenis GPU | Harga (USD) |
|---|---|
NVIDIA_TESLA_A100 | US$3,5206896 / 1 hour |
NVIDIA_TESLA_A100_80GB | US$4,517292 / 1 hour |
NVIDIA_H100_80GB | US$11,75586073 / 1 hour |
NVIDIA_TESLA_P4 | US$0,72 / 1 hour |
NVIDIA_TESLA_P100 | US$1,752 / 1 hour |
NVIDIA_TESLA_T4 | US$0,42 / 1 hour |
NVIDIA_TESLA_V100 | US$2,976 / 1 hour |
TPU_V2 Single (8 core) | US$5,40 / 1 hour |
Pod TPU_V2 (32 core)* | US$28,80 / 1 hour |
TPU_V3 Single (8 core) | US$9,60 / 1 hour |
Pod TPU_V3 (32 core)* | US$38,40 / 1 hour |
Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.
* Harga pelatihan menggunakan Pod Cloud TPU didasarkan pada jumlah core dalam Pod. Jumlah core dalam sebuah pod selalu kelipatan 32. Untuk menentukan harga pelatihan pada Pod yang memiliki lebih dari 32 core, ambil harga untuk Pod 32 core, lalu kalikan dengan jumlah core, yang dibagi 32. Misalnya, untuk Pod 128 core, harganya adalah (harga Pod 32 core) * (128/32). Untuk mengetahui informasi tentang Pod Cloud TPU yang tersedia untuk region tertentu, lihat Arsitektur Sistem di dokumentasi Cloud TPU.
Disk
Jenis disk | Harga (USD) |
|---|---|
pd-standard | US$0,000065753 / 1 gibibyte hour |
pd-ssd | US$0,000279452 / 1 gibibyte hour |
Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.
Anda akan dikenai biaya untuk melatih model sejak resource disediakan untuk suatu tugas hingga tugas tersebut selesai.
Peringatan: Tugas pelatihan Anda dibatasi oleh kebijakan kuota Vertex AI. Jika memilih cluster pemrosesan yang sangat kuat untuk tugas pelatihan pertama, kemungkinan Anda akan melebihi kuota yang ditetapkan.
Tabel berikut memberikan harga prediksi batch, prediksi online, dan penjelasan online per jam kerja node. Jam kerja node menunjukkan waktu yang dihabiskan mesin virtual untuk menjalankan tugas prediksi atau menunggu dalam status aktif (endpoint dengan satu atau beberapa model yang di-deploy) untuk menangani permintaan prediksi atau penjelasan.
Anda dapat menggunakan Spot VM dengan Inferensi Vertex AI. Spot VM ditagih sesuai dengan harga Spot VM Compute Engine. Terdapat biaya pengelolaan Inferensi Vertex AI selain penggunaan infrastruktur Anda, yang ditunjukkan pada tabel berikut.
Anda dapat menggunakan reservasi Compute Engine dengan Inferensi Vertex AI. Saat menggunakan reservasi Compute Engine, Anda akan ditagih sesuai dengan Harga Compute Engine, termasuk diskon abonemen (CUD) yang berlaku. Terdapat biaya pengelolaan Inferensi Vertex AI selain penggunaan infrastruktur Anda, yang ditunjukkan pada tabel berikut.
Seri E2
Jenis mesin | Harga (USD) |
|---|---|
e2-standard-2 | US$0,0770564 / 1 hour |
e2-standard-4 | US$0,1541128 / 1 hour |
e2-standard-8 | US$0,3082256 / 1 hour |
e2-standard-16 | US$0,6164512 / 1 hour |
e2-standard-32 | US$1,2329024 / 1 hour |
e2-highmem-2 | US$0,1039476 / 1 hour |
e2-highmem-4 | US$0,2078952 / 1 hour |
e2-highmem-8 | US$0,4157904 / 1 hour |
e2-highmem-16 | US$0,8315808 / 1 hour |
e2-highcpu-2 | US$0,056888 / 1 hour |
e2-highcpu-4 | US$0,113776 / 1 hour |
e2-highcpu-8 | US$0,227552 / 1 hour |
e2-highcpu-16 | US$0,455104 / 1 hour |
e2-highcpu-32 | US$0,910208 / 1 hour |
Seri N1
Jenis mesin | Harga (USD) |
|---|---|
n1-standard-2 | US$0,1095 / 1 hour |
n1-standard-4 | US$0,219 / 1 hour |
n1-standard-8 | US$0,438 / 1 hour |
n1-standard-16 | US$0,876 / 1 hour |
n1-standard-32 | US$1,752 / 1 hour |
n1-highmem-2 | US$0,137 / 1 hour |
n1-highmem-4 | US$0,274 / 1 hour |
n1-highmem-8 | US$0,548 / 1 hour |
n1-highmem-16 | US$1,096 / 1 hour |
n1-highcpu-2 | US$0,081 / 1 hour |
n1-highcpu-4 | US$0,162 / 1 hour |
n1-highcpu-8 | US$0,324 / 1 hour |
n1-highcpu-16 | US$0,648 / 1 hour |
n1-highcpu-32 | US$1,296 / 1 hour |
Seri N2
Jenis mesin | Harga (USD) |
|---|---|
n2-standard-2 | US$0,1116854 / 1 hour |
n2-standard-4 | US$0,2233708 / 1 hour |
n2-standard-8 | US$0,4467416 / 1 hour |
n2-standard-16 | US$0,8934832 / 1 hour |
n2-standard-32 | US$1,7869664 / 1 hour |
n2-highmem-2 | US$0,1506654 / 1 hour |
n2-highmem-4 | US$0,3013308 / 1 hour |
n2-highmem-8 | US$0,6026616 / 1 hour |
n2-highmem-16 | US$1,2053232 / 1 hour |
n2-highcpu-2 | US$0,0824504 / 1 hour |
n2-highcpu-4 | US$0,1649008 / 1 hour |
n2-highcpu-8 | US$0,3298016 / 1 hour |
n2-highcpu-16 | US$0,6596032 / 1 hour |
n2-highcpu-32 | US$1,3192064 / 1 hour |
Seri N2D
Jenis mesin | Harga (USD) |
|---|---|
n2d-standard-2 | US$0,0971658 / 1 hour |
n2d-standard-4 | US$0,1943316 / 1 hour |
n2d-standard-8 | US$0,3886632 / 1 hour |
n2d-standard-16 | US$0,7773264 / 1 hour |
n2d-standard-32 | US$1,5546528 / 1 hour |
n2d-highmem-2 | US$0,131077 / 1 hour |
n2d-highmem-4 | US$0,262154 / 1 hour |
n2d-highmem-8 | US$0,524308 / 1 hour |
n2d-highmem-16 | US$1,048616 / 1 hour |
n2d-highcpu-2 | US$0,0717324 / 1 hour |
n2d-highcpu-4 | US$0,1434648 / 1 hour |
n2d-highcpu-8 | US$0,2869296 / 1 hour |
n2d-highcpu-16 | US$0,5738592 / 1 hour |
n2d-highcpu-32 | US$1,1477184 / 1 hour |
Seri C2
Jenis mesin | Harga (USD) |
|---|---|
c2-standard-4 | US$0,240028 / 1 hour |
c2-standard-8 | US$0,480056 / 1 hour |
c2-standard-16 | US$0,960112 / 1 hour |
c2-standard-30 | US$1,80021 / 1 hour |
c2-standard-60 | US$3,60042 / 1 hour |
Seri C2D
Jenis mesin | Harga (USD) |
|---|---|
c2d-standard-2 | US$0,1044172 / 1 hour |
c2d-standard-4 | US$0,2088344 / 1 hour |
c2d-standard-8 | US$0,4176688 / 1 hour |
c2d-standard-16 | US$0,8353376 / 1 hour |
c2d-standard-32 | US$1,6706752 / 1 hour |
c2d-standard-56 | US$2,9236816 / 1 hour |
c2d-standard-112 | US$5,8473632 / 1 hour |
c2d-highmem-2 | US$0,1408396 / 1 hour |
c2d-highmem-4 | US$0,2816792 / 1 hour |
c2d-highmem-8 | US$0,5633584 / 1 hour |
c2d-highmem-16 | US$1,1267168 / 1 hour |
c2d-highmem-32 | US$2,2534336 / 1 hour |
c2d-highmem-56 | US$3,9435088 / 1 hour |
c2d-highmem-112 | US$7,8870176 / 1 hour |
c2d-highcpu-2 | US$0,086206 / 1 hour |
c2d-highcpu-4 | US$0,172412 / 1 hour |
c2d-highcpu-8 | US$0,344824 / 1 hour |
c2d-highcpu-16 | US$0,689648 / 1 hour |
c2d-highcpu-32 | US$1,379296 / 1 hour |
c2d-highcpu-56 | US$2,413768 / 1 hour |
c2d-highcpu-112 | US$4,827536 / 1 hour |
Seri C3
Jenis mesin | Harga (USD) |
|---|---|
c3-highcpu-4 | US$0,19824 / 1 hour |
c3-highcpu-8 | US$0,39648 / 1 hour |
c3-highcpu-22 | US$1,09032 / 1 hour |
c3-highcpu-44 | US$2,18064 / 1 hour |
c3-highcpu-88 | US$4,36128 / 1 hour |
c3-highcpu-176 | US$8,72256 / 1 hour |
Seri A2
Jenis mesin | Harga (USD) |
|---|---|
a2-highgpu-1g | US$4,2244949 / 1 hour |
a2-highgpu-2g | US$8,4489898 / 1 hour |
a2-highgpu-4g | US$16,8979796 / 1 hour |
a2-highgpu-8g | US$33,7959592 / 1 hour |
a2-megagpu-16g | US$64,1020592 / 1 hour |
a2-ultragpu-1g | US$5,7818474 / 1 hour |
a2-ultragpu-2g | US$11,5636948 / 1 hour |
a2-ultragpu-4g | US$23,1273896 / 1 hour |
a2-ultragpu-8g | US$46,2547792 / 1 hour |
Saat menggunakan kapasitas reservasi atau spot, penagihan tersebar di dua SKU: SKU GCE dengan label 'vertex-ai-online-prediction' dan SKU Biaya Pengelolaan Vertex AI. Hal ini memungkinkan Anda menggunakan Diskon Penggunaan Berkelanjutan (CUD) di Vertex AI.
Seri A3
Jenis mesin | Harga (USD) |
|---|---|
a3-ultragpu-8g | US$96,015616 / 1 hour |
a3-megagpu-8g | US$106,65474 / 1 hour |
Saat menggunakan kapasitas reservasi atau spot, penagihan tersebar di dua SKU: SKU GCE dengan label 'vertex-ai-online-prediction' dan SKU Biaya Pengelolaan Vertex AI. Hal ini memungkinkan Anda menggunakan Diskon Penggunaan Berkelanjutan (CUD) di Vertex AI.
Seri A4
Jenis mesin | Harga (USD) |
|---|---|
a4-highgpu-8g | US$148,212 / 1 hour |
Saat menggunakan kapasitas reservasi atau spot, penagihan tersebar di dua SKU: SKU GCE dengan label 'vertex-ai-online-prediction' dan SKU Biaya Pengelolaan Vertex AI. Hal ini memungkinkan Anda menggunakan Diskon Penggunaan Berkelanjutan (CUD) di Vertex AI.
Seri A4X
Jenis mesin | Harga (USD) |
|---|---|
a4x-highgpu-4g | US$74,75 / 1 hour |
Saat menggunakan kapasitas reservasi atau spot, penagihan tersebar di dua SKU: SKU GCE dengan label 'vertex-ai-online-prediction' dan SKU Biaya Pengelolaan Vertex AI. Hal ini memungkinkan Anda menggunakan Diskon Penggunaan Berkelanjutan (CUD) di Vertex AI.
a4x-highgpu-4g memerlukan setidaknya 18 VM.
Seri G2
Jenis mesin | Harga (USD) |
|---|---|
g2-standard-4 | US$0,81293 / 1 hour |
g2-standard-8 | US$0,98181 / 1 hour |
g2-standard-12 | US$1,15069 / 1 hour |
g2-standard-16 | US$1,31957 / 1 hour |
g2-standard-24 | US$2,30138 / 1 hour |
g2-standard-32 | US$1,99509 / 1 hour |
g2-standard-48 | US$4,60276 / 1 hour |
g2-standard-96 | US$9,20552 / 1 hour |
Saat menggunakan kapasitas reservasi atau spot, penagihan tersebar di dua SKU: SKU GCE dengan label 'vertex-ai-online-prediction' dan SKU Biaya Pengelolaan Vertex AI. Hal ini memungkinkan Anda menggunakan Diskon Penggunaan Berkelanjutan (CUD) di Vertex AI.
Seri G4
Jenis mesin | Harga (USD) |
|---|---|
g4-standard-48 | US$5,17508763 / 1 hour |
g4-standard-96 | US$10,35017526 / 1 hour |
g4-standard-192 | US$20,70035052 / 1 hour |
g4-standard-384 | US$41,40070104 / 1 hour |
Harga TPU v5e
Jenis mesin | Harga (USD) |
|---|---|
ct5lp-hightpu-1t | US$1,38 / 1 hour |
ct5lp-hightpu-4t | US$5,52 / 1 hour |
ct5lp-hightpu-8t | US$5,52 / 1 hour |
Setiap jenis mesin dikenai biaya sebagai SKU berikut pada tagihan Google Cloud Anda:
Harga untuk jenis mesin digunakan untuk memperkirakan total biaya per jam untuk setiap node prediksi dari versi model yang menggunakan jenis mesin tersebut.
Misalnya, jenis mesin n1-highcpu-32 mencakup 32 vCPU dan RAM 32 GB. Oleh karena itu, harga per jam sama dengan 32 jam vCPU + 32 jam GB.
Seri E2
Item | Harga (USD) |
|---|---|
vCPU | US$0,0250826 / 1 hour |
RAM | US$0,0033614 / 1 gibibyte hour |
Seri N1
Item | Harga (USD) |
|---|---|
vCPU | US$0,036 / 1 hour |
RAM | US$0,005 / 1 gibibyte hour |
Seri N2
Item | Harga (USD) |
|---|---|
vCPU | US$0,0363527 / 1 hour |
RAM | US$0,0048725 / 1 gibibyte hour |
Seri N2D
Item | Harga (USD) |
|---|---|
vCPU | US$0,0316273 / 1 hour |
RAM | US$0,0042389 / 1 gibibyte hour |
Seri C2
Item | Harga (USD) |
|---|---|
vCPU | US$0,039077 / 1 hour |
RAM | US$0,0052325 / 1 gibibyte hour |
Seri C2D
Item | Harga (USD) |
|---|---|
vCPU | US$0,0339974 / 1 hour |
RAM | US$0,0045528 / 1 gibibyte hour |
Seri C3
Item | Harga (USD) |
|---|---|
vCPU | US$0,03908 / 1 hour |
RAM | US$0,00524 / 1 gibibyte hour |
Seri A2
Item | Harga (USD) |
|---|---|
vCPU | US$0,0363527 / 1 hour |
RAM | US$0,0048725 / 1 gibibyte hour |
GPU (A100 40 GB) | US$3,3741 / 1 hour |
GPU (A100 80 GB) | US$4,51729 / 1 hour |
Seri A3
Item | Harga (USD) |
|---|---|
vCPU | US$0,0293227 / 1 hour |
RAM | US$0,0025534 / 1 gibibyte hour |
GPU (H100 80 GB) | US$11,2660332 / 1 hour |
GPU (H200) | US$10,708501 / 1 hour |
Seri G2
Item | Harga (USD) |
|---|---|
vCPU | US$0,02874 / 1 hour |
RAM | US$0,00337 / 1 gibibyte hour |
GPU (L4) | US$0,64405 / 1 hour |
Beberapa jenis mesin memungkinkan Anda menambahkan akselerator GPU opsional untuk prediksi. GPU opsional dikenai biaya tambahan, terpisah dari biaya yang dijelaskan dalam tabel sebelumnya. Lihat setiap tabel harga, yang menjelaskan harga untuk setiap jenis GPU opsional.
Akselerator - harga per jam
Jenis GPU | Harga (USD) |
|---|---|
NVIDIA_TESLA_P4 | US$0,69 / 1 hour |
NVIDIA_TESLA_P100 | US$1,679 / 1 hour |
NVIDIA_TESLA_T4 | US$0,402 / 1 hour |
NVIDIA_TESLA_V100 | US$2,852 / 1 hour |
Harga dihitung per GPU. Jika Anda menggunakan beberapa GPU per node prediksi (atau jika versi Anda diskalakan untuk menggunakan beberapa node),biaya akan diskalakan sebagaimana mestinya.
AI Platform Prediction menyajikan prediksi dari model Anda dengan menjalankan sejumlah virtual machine ("node"). Secara default, Vertex AI otomatis menskalakan jumlah node yang berjalan kapan saja. Untuk prediksi online, jumlah node diskalakan untuk memenuhi permintaan. Setiap node dapat merespons beberapa permintaan prediksi. Untuk prediksi batch, jumlah node diskalakan untuk mengurangi total waktu yang diperlukan untuk menjalankan tugas. Anda dapat menyesuaikan cara node prediksi diskalakan.
Anda akan dikenai biaya untuk waktu setiap node berjalan untuk model Anda, termasuk:
Biaya satu node yang berjalan selama satu jam adalah jam kerja node. Tabel harga prediksi menjelaskan harga jam kerja node, yang bervariasi antar-region serta antara prediksi online dan prediksi batch.
Anda dapat menggunakan jam kerja node dalam kelipatan pecahan. Misalnya, satu node yang berjalan selama 30 menit memerlukan 0,5 jam kerja node.
Penghitungan biaya untuk jenis mesin Compute Engine (N1)
Selengkapnya tentang penskalaan otomatis node prediksi
Prediksi online | Prediksi batch |
|---|---|
Prioritas penskalaan adalah mengurangi latensi permintaan tertentu. Layanan mempertahankan model dalam kondisi siap selama beberapa menit tanpa aktivitas setelah menayangkan permintaan. | Prioritas penskalaan adalah mengurangi total waktu berlalu tugas. |
Penskalaan memengaruhi total biaya setiap bulan: semakin banyak dan sering permintaan, semakin banyak node yang digunakan. | Penskalaan tidak berpengaruh besar pada harga tugas, meskipun ada overhead yang terkait dengan memunculkan node baru. |
Anda dapat membiarkan layanan melakukan penyesuaian sebagai respons atas traffic (penskalaan otomatis) atau menentukan jumlah node yang akan terus berjalan untuk menghindari latensi (penskalaan manual).
| Penskalaan dapat dipengaruhi dengan menetapkan jumlah maksimum node yang digunakan untuk tugas prediksi batch, dan dengan menetapkan jumlah node yang akan terus berjalan untuk suatu model saat Anda menerapkannya. |
Tugas prediksi batch dikenai biaya setelah tugas selesai
Tugas prediksi batch dikenai biaya setelah tugas selesai, bukan secara bertahap selama tugas tersebut. Semua pemberitahuan anggaran Penagihan Cloud yang telah dikonfigurasi tidak akan dipicu saat tugas berjalan. Sebelum memulai tugas besar, pertimbangkan untuk menjalankan beberapa tugas benchmark biaya dengan data input kecil terlebih dahulu.
Contoh penghitungan prediksi
Sebuah perusahaan real estat di wilayah Amerika menjalankan prediksi mingguan untuk nilai perumahan di area yang dilayaninya. Dalam satu bulan, platform ini menjalankan prediksi selama empat minggu dalam batch 3920, 4277, 3849, dan 3961. Tugas dibatasi pada satu node dan setiap instance memerlukan rata-rata 0,72 detik pemrosesan.
Pertama, hitung durasi waktu setiap tugas dijalankan:
Setiap tugas berjalan selama lebih dari sepuluh menit, sehingga dikenai biaya untuk setiap menit pemrosesan:
Total tagihan untuk bulan tersebut adalah $0,26.
Contoh ini mengasumsikan tugas berjalan pada satu node dan mengambil jumlah waktu yang konsisten per instance input. Dalam penggunaan sebenarnya, pastikan untuk memperhitungkan beberapa node dan gunakan jumlah waktu sebenarnya yang dihabiskan setiap node untuk menjalankan kalkulasi Anda.
Biaya untuk Vertex Explainable AI
Penjelasan berbasis fitur
Penjelasan berbasis fitur tidak dikenai biaya tambahan untuk harga prediksi. Namun, penjelasan memerlukan waktu pemrosesan yang lebih lama daripada prediksi normal sehingga penggunaan Vertex Explainable AI yang besar beserta penskalaan otomatis dapat mengakibatkan lebih banyak node dimulai, yang akan meningkatkan biaya prediksi.
Penjelasan berbasis contoh
Harga untuk penjelasan berbasis contoh terdiri dari hal berikut:
Tabel berikut meringkas harga di setiap region tempat Neural Architecture Search tersedia.
Harga
Tabel berikut memberikan harga per jam untuk berbagai konfigurasi.
Anda dapat memilih tingkat skala bawaan atau konfigurasi kustom dari jenis mesin yang dipilih. Jika Anda memilih konfigurasi kustom, jumlahkan biaya virtual machine yang Anda gunakan.
Jenis mesin lama yang mengaktifkan akselerator mencakup biaya akselerator dalam harganya. Jika Anda menggunakan jenis mesin Compute Engine dan menambahkan akselerator, biaya akselerator akan dihitung terpisah. Untuk menghitung biaya ini, kalikan harga dalam tabel akselerator berikut dengan jumlah setiap jenis akselerator yang Anda gunakan.
Jenis mesin
Jenis mesin | Harga (USD) |
|---|---|
n1-standard-4 | US$0,2849985 / 1 hour |
n1-standard-8 | US$0,569997 / 1 hour |
n1-standard-16 | US$1,139994 / 1 hour |
n1-standard-32 | US$2,279988 / 1 hour |
n1-standard-64 | US$4,559976 / 1 hour |
n1-standard-96 | US$6,839964 / 1 hour |
n1-highmem-2 | US$0,1774545 / 1 hour |
n1-highmem-4 | US$0,1774545 / 1 hour |
n1-highmem-8 | US$0,709818 / 1 hour |
n1-highmem-16 | US$1,419636 / 1 hour |
n1-highmem-32 | US$2,839272 / 1 hour |
n1-highmem-64 | US$5,678544 / 1 hour |
n1-highmem-96 | US$8,517816 / 1 hour |
n1-highcpu-16 | US$0,8501832 / 1 hour |
n1-highcpu-32 | US$1,7003664 / 1 hour |
n1-highcpu-64 | US$3,4007328 / 1 hour |
n1-highcpu-96 | US$5,1010992 / 1 hour |
a2-highgpu-1g | US$5,641070651 / 1 hour |
a2-highgpu-2g | US$11,282141301 / 1 hour |
a2-highgpu-4g | US$22,564282603 / 1 hour |
a2-highgpu-8g | US$45,128565205 / 1 hour |
a2-highgpu-16g | US$90,257130411 / 1 hour |
e2-standard-4 | US$0,20103426 / 1 hour |
e2-standard-8 | US$0,40206852 / 1 hour |
e2-standard-16 | US$0,80413704 / 1 hour |
e2-standard-32 | US$1,60827408 / 1 hour |
e2-highmem-2 | US$0,13559949 / 1 hour |
e2-highmem-4 | US$0,27119898 / 1 hour |
e2-highmem-8 | US$0,54239796 / 1 hour |
e2-highmem-16 | US$1,08479592 / 1 hour |
e2-highcpu-16 | US$0,59364288 / 1 hour |
e2-highcpu-32 | US$1,18728576 / 1 hour |
n2-standard-4 | US$0,291354 / 1 hour |
n2-standard-8 | US$0,582708 / 1 hour |
n2-standard-16 | US$1,165416 / 1 hour |
n2-standard-32 | US$2,330832 / 1 hour |
n2-standard-48 | US$3,496248 / 1 hour |
n2-standard-64 | US$4,661664 / 1 hour |
n2-standard-80 | US$5,82708 / 1 hour |
n2-highmem-2 | US$0,196521 / 1 hour |
n2-highmem-4 | US$0,393042 / 1 hour |
n2-highmem-8 | US$0,786084 / 1 hour |
n2-highmem-16 | US$1,572168 / 1 hour |
n2-highmem-32 | US$3,144336 / 1 hour |
n2-highmem-48 | US$4,716504 / 1 hour |
n2-highmem-64 | US$6,288672 / 1 hour |
n2-highmem-80 | US$7,86084 / 1 hour |
n2-highcpu-16 | US$0,860352 / 1 hour |
n2-highcpu-32 | US$1,720704 / 1 hour |
n2-highcpu-64 | US$3,441408 / 1 hour |
n2-highcpu-80 | US$4,30176 / 1 hour |
c2-standard-4 | US$0,313212 / 1 hour |
c2-standard-8 | US$0,626424 / 1 hour |
c2-standard-16 | US$1,252848 / 1 hour |
c2-standard-30 | US$2,34909 / 1 hour |
c2-standard-60 | US$4,69818 / 1 hour |
Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.
Harga untuk instance a2-highgpu mencakup biaya untuk Akselerator NVIDIA_TESLA_A100 yang terlampir.
Akselerator
Jenis GPU | Harga (USD) |
|---|---|
NVIDIA_TESLA_A100 | US$4,400862 / 1 hour |
NVIDIA_TESLA_P4 | US$0,90 / 1 hour |
NVIDIA_TESLA_P100 | US$2,19 / 1 hour |
NVIDIA_TESLA_T4 | US$0,525 / 1 hour |
NVIDIA_TESLA_V100 | US$3,72 / 1 hour |
Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.
Disk
Jenis disk | Harga (USD) |
|---|---|
pd-standard | US$0,000082192 / 1 gibibyte hour |
pd-ssd | US$0,000349315 / 1 gibibyte hour |
Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.
Catatan:
Penggunaan Cloud Storage yang diwajibkan
Selain biaya yang dijelaskan dalam dokumen ini, Anda juga diwajibkan menyimpan file data dan program dalam bucket Cloud Storage selama siklus proses Neural Architecture Search. Penyimpanan ini tunduk pada kebijakan harga Cloud Storage.
Penggunaan Cloud Storage yang diwajibkan meliputi:
Catatan: Anda dapat menggunakan layanan Google Cloud lain untuk menyimpan data input, seperti BigQuery, yang memiliki harga tersendiri.
Operasi gratis untuk mengelola resource Anda
Operasi pengelolaan resource yang disediakan oleh Neural Architecture Search tersedia tanpa biaya. Kebijakan kuota Neural Architecture Search membatasi beberapa operasi ini.
Resource | Operasi gratis |
|---|---|
tugas | get, list, cancel |
operasi | get, list, cancel, delete |
Vertex AI Pipelines mengenakan biaya eksekusi operasi sebesar $0,03 per Pipeline Run. Anda tidak akan ditagih biaya eksekusi selama rilis Pratinjau. Anda juga membayar resource Google Cloud yang digunakan dengan Vertex AI Pipelines, seperti resource Compute Engine yang digunakan oleh komponen pipeline (dikenai biaya yang sama seperti untuk pelatihan Vertex AI). Terakhir, Anda bertanggung jawab atas biaya layanan (seperti Dataflow) yang dipanggil oleh pipeline Anda.
Vertex AI Feature Store Tersedia Secara Umum (GA) sejak November 2023. Untuk mengetahui informasi tentang versi produk sebelumnya, buka Vertex AI Feature Store (Lama).
Vertex AI Feature Store Baru
Vertex AI Feature Store baru mendukung fungsi di 2 jenis operasi:
Harga Operasi Offline
Karena BigQuery digunakan untuk operasi offline, lihat harga BigQuery untuk fungsi seperti penyerapan ke toko offline, mengkueri toko offline, dan penyimpanan offline.
Harga Operasi Online
Untuk operasi online, Vertex AI Feature Store mengenakan biaya atas semua fitur GA untuk mentransfer data ke toko online, menyajikan data, atau menyimpan data. Jam kerja node mewakili waktu yang dihabiskan mesin virtual untuk menyelesaikan operasi, yang ditagih per menit.
Operasi | Harga (USD) |
|---|---|
Node pemrosesan data Pemrosesan data (misalnya, penyerapan ke penyimpanan, pemantauan, dll.) | US$0,08 / 1 hour |
Node penyaluran online yang dioptimalkan Penayangan latensi rendah dan penayangan embedding Setiap node mencakup penyimpanan sebesar 200 GB | US$0,30 / 1 hour |
Node penyaluran online Bigtable Menyajikan dengan Cloud Bigtable | US$0,94 / 1 hour |
Penyimpanan penyaluran online Bigtable Penyimpanan untuk penyajian dengan Cloud Bigtable | US$0,000342466 / 1 gibibyte hour |
Penyaluran online yang dioptimalkan dan penyaluran online Bigtable menggunakan arsitektur yang berbeda, sehingga node-nya tidak sebanding.
Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.
Estimasi Workload Operasi Online
Pertimbangkan panduan berikut saat memperkirakan workload Anda. Jumlah node yang diperlukan untuk workload tertentu dapat berbeda di setiap pendekatan inferensi.
Anda dapat melihat jumlah node (dengan replika) di Metric Explorer:

Contoh Skenario Bulanan (dengan asumsi us-central1)
Workload streaming data - Penyaluran online Bigtable dengan data 2,5 TB (1 GB dimuat ulang setiap hari) dan 1.200 QPS
Operasi | Penggunaan Bulanan | Biaya Bulanan |
|---|---|---|
Node pemrosesan data | (1 GB/hari) * (30 hari/bulan) * (1.000 MB/GB) * (1 node-jam / 100 MB) = 300 node-jam | 300 jam node * ($0,08 per node-jam) = $24 |
Node penyaluran online yang dioptimalkan | T/A | T/A |
Node penyaluran online Bigtable | (1 node) * (24 jam/hari) * (30 hari/bulan) = 720 node-jam | 720 node-jam * ($0,94 per node-jam) = $677 |
Penyimpanan penyaluran online Bigtable | (2,5 TB-bulan) * (1000 GB/TB) = 2.500 GB-bulan | 2.500 GB-bulan * ($0,25 per GB-bulan) = $625 |
Total | $1.326 |
Workload QPS tinggi - Penyaluran online yang dioptimalkan dengan data non-embedding 10 GB (5 GB dimuat ulang setiap hari) dan 2.000 QPS
Operasi | Penggunaan Bulanan | Biaya Bulanan |
|---|---|---|
Node pemrosesan data | (5 GB/hari) * (30 hari/bulan) * (1.000 MB/GB) * (1 node-jam / 100 MB) = 1.500 node-jam | 1.500 jam node * ($0,08 per node-jam) = $120 |
Node penyaluran online yang dioptimalkan | Roundup(10 GB * (1 node / 200 GB)) = 1 * max(2 replika default, 2.000 QPS * (1 replika / 500 QPS)) = 4 total node * (24 jam/hari) * (30 hari/bulan) =2.880 node-jam | 2.880 node-jam * (0,30 per node-jam) = $864 |
Node penyaluran online Bigtable | T/A | T/A |
Penyimpanan penyaluran online Bigtable | T/A | T/A |
Total | $984 |
Workload penyaluran embedding - Penyaluran online yang dioptimalkan dengan data embedding 20 GB (2 GB dimuat ulang setiap hari) dan 800 QPS
Operasi | Penggunaan Bulanan | Biaya Bulanan |
|---|---|---|
Node pemrosesan data | (2 GB/hari) * (30 hari/bulan) * (1.000 MB/GB) * (1 node-jam / 100 MB) = 600 node-jam | 600 node-jam * ($0,08 per node-jam) = $48 |
Node penyaluran online yang dioptimalkan | Roundup(20 GB* (1 node / 4 GB) = 5 * max(2 replika default, 800 QPS * (1 replika / 500 QPS)) = 10 total node * (24 jam/hari) * (30 hari/bulan) = 7.200 node-jam | 7.200 node-jam * (0,30 per node-jam) = $2.160 |
Node penyaluran online Bigtable | T/A | T/A |
Penyimpanan penyaluran online Bigtable | T/A | T/A |
Total | $2.208 |
Vertex AI Feature Store (Lama)
Harga untuk Vertex AI Feature Store (Lama) didasarkan pada jumlah data fitur di penyimpanan online dan offline, serta ketersediaan penyaluran online. Node per jam menunjukkan waktu yang dihabiskan virtual machine untuk menyajikan data fitur atau menunggu dalam status siap untuk menangani permintaan data fitur.
Operasi | Harga (USD) |
|---|---|
Penyimpanan online | $0,25 per GB-bulan |
Penyimpanan offline | $0,023 per GB-bulan |
Penyaluran online | $0,94 per node per jam |
Ekspor batch | $0,005 per GB |
Penyerapan streaming | $0,10 per GB penyerapan |
Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.
Saat Anda mengaktifkan pemantauan nilai fitur, penagihan mencakup biaya yang berlaku di atas selain biaya yang berlaku sebagai berikut:
Contoh Analisis Snapshot
Seorang data scientist mengaktifkan pemantauan nilai fitur untuk Vertex AI Feature Store (Lama) dan mengaktifkan pemantauan untuk analisis snapshot harian. Pipeline berjalan setiap hari untuk pemantauan jenis entity. Pipeline memindai data sebesar 2 GB di Vertex AI Feature Store (Lama) dan mengekspor snapshot yang berisi data sebesar 0,1 GB. Total biaya untuk analisis satu hari adalah:
(0,1 GB * $3,50) + (2 GB * $0,005) = $0,36
Contoh Analisis Penyerapan
Seorang data scientist mengaktifkan pemantauan nilai fitur untuk Vertex AI Feature Store (Lama) dan mengaktifkan pemantauan untuk operasi penyerapan. Operasi penyerapan mengimpor data 1 GB ke Vertex AI Feature Store (Lama). Total biaya untuk pemantauan nilai fitur adalah:
(1 GB * $3,50) = $3,50
Penyimpanan metadata diukur dalam gigabyte biner (GiB), dengan 1 GiB sama dengan 1.073.741.824 byte. Satuan pengukuran ini juga disebut sebagai gibibyte.
Vertex ML Metadata mengenakan biaya $10 per gibibyte (GiB) per bulan untuk penyimpanan metadata. Harga dihitung secara prorata per megabyte (MB). Misalnya, jika Anda menyimpan 10 MB metadata, Anda akan dikenai biaya $0,10 per bulan untuk 10 MB metadata tersebut.
Harga sama di semua region tempat Vertex ML Metadata didukung.
Untuk menggunakan Vertex AI TensorBoard, minta agar administrator IAM project menetapkan Anda ke peran "Vertex AI TensorBoard Web App User". Peran Administrator Vertex AI juga memiliki akses.
Mulai Agustus 2023, harga Vertex AI TensorBoard akan diubah dari lisensi bulanan per pengguna sebesar $300/bulan menjadi $10 GiB/bulan untuk penyimpanan data log dan metrik. Artinya, tidak ada lagi biaya langganan. Anda hanya perlu membayar untuk penyimpanan yang telah Anda gunakan. Lihat tutorial Vertex AI TensorBoard: Menghapus Eksperimen TensorBoard yang Sudah Usang untuk mengetahui cara mengelola penyimpanan.
Vertex AI Vizier adalah layanan pengoptimalan black-box di dalam Vertex AI. Model penetapan harga Vertex AI Vizier terdiri dari:
Harga untuk layanan Approximate Nearest Neighbor oleh Vector Search terdiri dari:
Data yang diproses selama proses build dan pembaruan indeks diukur dalam gigabyte biner (GiB), dengan 1 GiB sama dengan 1.073.741.824 byte. Satuan pengukuran ini juga disebut sebagai gibibyte.
Vector Search mengenakan biaya $3,00 per gibibyte (GiB) data yang diproses di semua region. Vector Search mengenakan biaya $0,45/GiB yang diserap untuk penyisipan Update Streaming.
Tabel berikut meringkas harga penyajian indeks di setiap region tempat Vector Search tersedia. Harganya sesuai dengan jenis mesin, berdasarkan region, dan dikenakan per jam kerja node.
Jenis mesin | Harga (USD) |
|---|---|
e2-standard-2 | US$0,0938084 / 1 hour |
e2-standard-16 | US$0,7504672 / 1 hour |
e2-highmem-16 | US$1,012368 / 1 hour |
n2d-standard-32 | US$1,8926208 / 1 hour |
n1-standard-16 | US$1,0639944 / 1 hour |
n1-standard-32 | US$2,1279888 / 1 hour |
Contoh penetapan harga Vector Search
Harga Vector Search ditentukan oleh ukuran data, jumlah kueri per detik (QPS) yang ingin dijalankan, dan jumlah node yang Anda gunakan. Untuk mendapatkan estimasi biaya penayangan, Anda perlu menghitung total ukuran data. Ukuran data adalah jumlah embedding/vektor* jumlah dimensi yang Anda miliki* 4 byte per dimensi. Setelah memiliki ukuran data, Anda dapat menghitung biaya penayangan dan biaya pembuatan. Biaya penayangan ditambah biaya pembuatan sama dengan total biaya bulanan.
Streaming update: Penelusuran Vektor menggunakan metrik berbasis heuristik untuk menentukan kapan harus memicu pemadatan. Jika data yang tidak dikompresi terlama sudah berusia lima hari, pemadatan akan selalu dipicu. Anda akan dikenai biaya pembuatan ulang indeks dengan tingkat update batch yang sama, selain biaya update streaming.
Jumlah embedding/vektor | Jumlah dimensi | Kueri per detik (QPS) | Jenis Mesin | Node | Estimasi biaya penayangan bulanan (USD) |
|---|---|---|---|---|---|
2 juta | 128 | 100 | e2-standard-2 | 1 | $68 |
20 juta | 256 | 1.000 | e2-standard-16 | 1 | $547 |
20 juta | 256 | 3.000 | e2-standard-16 | 3 | $1.642 |
100 juta | 256 | 500 | e2-highmem-16 | 2 | $1.477 |
1 miliar | 100 | 500 | e2-highmem-16 | 8 | $5.910 |
Semua contoh didasarkan pada jenis mesin di us-central1. Biaya yang Anda keluarkan akan bervariasi sesuai dengan persyaratan latensi dan tingkat perolehan. Estimasi biaya penayangan bulanan terkait langsung dengan jumlah node yang digunakan di konsol. Untuk mempelajari lebih lanjut parameter konfigurasi yang memengaruhi biaya, lihat Parameter konfigurasi yang memengaruhi perolehan dan latensi.
Jika Anda memiliki kueri per detik (QPS) yang tinggi, pengelompokan kueri ini dapat mengurangi total biaya hingga 30%-40%.
Tingkat Penelusuran Vektor yang dioptimalkan untuk penyimpanan
Alih-alih mengelola dan membayar VM individual dan tugas pemadatan terpisah, terdapat dua SKU:
Unit | Harga |
|---|---|
Unit Kapasitas yang Dioptimalkan untuk Penyimpanan | US$2,30 / 1 hour |
Unit Tulis | US$0,45 / 1 gibibyte |
Vertex AI Model Registry adalah repositori pusat yang melacak dan mencantumkan model dan versi model Anda. Anda dapat mengimpor model ke Vertex AI dan model tersebut akan muncul di Vertex AI Model Registry. Anda tidak akan dikenai biaya jika memiliki model di Registry Model. Biaya hanya timbul jika Anda men-deploy model ke endpoint atau melakukan prediksi batch pada model. Biaya ini ditentukan oleh jenis model yang Anda deploy.
Untuk mempelajari lebih lanjut harga men-deploy model kustom dari Vertex AI Model Registry, lihat Model yang dilatih khusus. Untuk mempelajari lebih lanjut harga deployment model AutoML, baca artikel Harga untuk model AutoML.
Vertex AI memungkinkan Anda memantau efektivitas model yang berkelanjutan setelah di-deploy ke produksi. Untuk mengetahui informasi selengkapnya, lihat Pengantar Pemantauan Model Vertex AI.
Saat menggunakan Pemantauan Model Vertex AI, Anda akan dikenai biaya untuk hal-hal berikut:
Pemantauan Model Vertex AI didukung di region berikut: us-central1, europe-west4, asia-east1, dan asia-southeast1. Harga sama untuk semua region.
Ukuran data diukur setelah dikonversi ke format TfRecord.
Set data pelatihan dikenai biaya satu kali saat Anda menyiapkan tugas Pemantauan Model Vertex AI.
Set Data Prediksi terdiri dari log yang dikumpulkan dari layanan Prediksi Online. Karena permintaan prediksi ada selama jangka waktu yang berbeda, data untuk setiap periode waktu akan dikumpulkan dan jumlah data yang dianalisis untuk setiap periode prediksi digunakan untuk menghitung biaya.
Contoh: Data scientist menjalankan pemantauan model pada traffic prediksi yang termasuk dalam modelnya.
Pilih instance, notebook terkelola, atau notebook yang dikelola pengguna untuk mendapatkan informasi tentang harga.
Instance
Tabel di bawah memberikan perkiraan harga per jam untuk berbagai konfigurasi VM. Anda dapat memilih konfigurasi kustom dari jenis mesin yang dipilih. Untuk menghitung harga, jumlahkan biaya mesin virtual yang Anda gunakan.
Jika Anda menggunakan jenis mesin Compute Engine dan menambahkan akselerator, biaya akselerator akan dihitung terpisah. Untuk menghitung biaya ini, kalikan harga dalam tabel akselerator di bawah ini dengan jumlah jam mesin setiap jenis akselerator yang Anda gunakan.
CPU
Jenis mesin | Harga per vCPU (USD) |
|---|---|
N1 | US$0,0379332 / 1 hour |
N2 | US$0,0379332 / 1 hour |
E2 | US$0,026173908 / 1 hour |
A2 | US$0,0379332 / 1 hour |
Memori
Jenis mesin | Harga (USD) |
|---|---|
N1 | US$0,0050844 / 1 gibibyte hour |
N2 | US$0,0050844 / 1 gibibyte hour |
E2 | US$0,003508236 / 1 gibibyte hour |
A2 | US$0,0050844 / 1 gibibyte hour |
Akselerator
Jenis mesin | Harga (USD) |
|---|---|
Nvidia Tesla A100 | US$4,400862 / 1 hour |
Nvidia Tesla A100 80GB | US$4,51729 / 1 hour |
Nvidia Tesla T4 | US$0,525 / 1 hour |
Nvidia Tesla V100 | US$3,72 / 1 hour |
Nvidia Tesla P100 | US$2,19 / 1 hour |
Disk
Jenis mesin | Harga (USD) |
|---|---|
Ruang yang disediakan Hyperdisk Extreme | US$0,000205479 / 1 gibibyte hour |
Ruang yang disediakan Balanced | US$0,000164384 / 1 gibibyte hour |
Ruang yang disediakan Extreme | US$0,000205479 / 1 gibibyte hour |
Ruang yang disediakan SSD | US$0,000279452 / 1 gibibyte hour |
Ruang yang disediakan standar | US$0,000065753 / 1 gibibyte hour |
Instance Vertex AI Workbench Anda dikenai biaya sebagai berikut:
Notebook terkelola
Harga terdiri dari resource komputasi dan penyimpanan yang Anda gunakan, biaya pengelolaan untuk instance Vertex AI Workbench, dan resource cloud tambahan apa pun yang Anda gunakan. Lihat bagian berikut untuk mengetahui detail selengkapnya.
Resource komputasi dan penyimpanan
Resource komputasi dan penyimpanan dikenai biaya dengan tarif yang sama dengan yang Anda bayar saat ini untuk Compute Engine dan Cloud Storage.
Biaya pengelolaan
Terdapat biaya pengelolaan Vertex AI Workbench selain penggunaan infrastruktur Anda, yang ditunjukkan pada tabel di bawah.
SKU | Harga (USD) |
|---|---|
vCPU | $0,05 per vCPU |
T4 dan P4 (GPU Standar) | $0,35 per GPU |
GPU P100, V100, L4, dan A100 (GPU Premium) | $2,48 per GPU |
Notebook yang dikelola pengguna
Harga terdiri dari resource komputasi dan penyimpanan yang Anda gunakan, biaya pengelolaan untuk instance Vertex AI Workbench, dan resource cloud tambahan apa pun yang Anda gunakan. Lihat bagian berikut untuk mengetahui detail selengkapnya.
Resource komputasi dan penyimpanan
Resource komputasi dan penyimpanan dikenai biaya dengan tarif yang sama dengan yang Anda bayar saat ini untuk Compute Engine dan Cloud Storage.
Biaya pengelolaan
Terdapat biaya pengelolaan Vertex AI Workbench selain penggunaan infrastruktur Anda, yang ditunjukkan pada tabel di bawah.
SKU | Harga (USD) |
|---|---|
vCPU | $0,005 per vCPU |
T4 dan P4 (GPU Standar) | $0,035 per GPU |
GPU P100, V100, dan A100 (GPU Premium) | $0,25 per GPU |
Referensi Google Cloud tambahan
Selain biaya yang disebutkan sebelumnya, Anda juga membayar untuk setiap resource Google Cloud yang digunakan. Contoh:
Untuk informasi harga Colab Enterprise, lihat Harga Colab Enterprise.
Untuk Deep Learning Containers, Deep Learning VM Image, dan AI Platform Pipelines, harga dihitung berdasarkan resource komputasi dan penyimpanan yang Anda gunakan. Resource ini ditagih dengan tarif yang sama dengan yang Anda bayar saat ini untuk Compute Engine dan Cloud Storage.
Selain biaya komputasi dan penyimpanan, Anda juga membayar untuk setiap resource Google Cloud yang digunakan. Contoh:
Dengan Vertex AI, Anda dapat meminta pelabelan manusia untuk kumpulan data yang akan digunakan untuk melatih model machine learning kustom. Harga untuk layanan dihitung berdasarkan jenis tugas pelabelan.
Tabel di bawah memberikan harga per 1.000 unit per pemberi label manual, berdasarkan unit yang tercantum untuk setiap tujuan. Harga Paket 1 berlaku untuk 50.000 unit pertama per bulan di setiap project Google Cloud. Harga Paket 2 berlaku untuk 950.000 unit berikutnya per bulan dalam project, hingga 1.000.000 unit. Hubungi kami untuk mengetahui harga di atas 1.000.000 unit per bulan.
Jenis data | Tujuan | Unit | Harga Paket 1 (USD) | Harga Paket 2 (USD) |
|---|---|---|---|---|
Gambar | Klasifikasi | Gambar | $35 | $25 |
Kotak pembatas | Kotak pembatas | $63 | $49 | |
Segmentation | Segmen | $870 | $850 | |
Kotak yang diputar | Kotak pembatas | $86 | $60 | |
Poligon/polyline | Poligon/Polyline | $257 | $180 | |
Video | Klasifikasi | Video 5 detik | $86 | $60 |
Pelacakan objek | Kotak pembatas | $86 | $60 | |
Pengenalan tindakan | Peristiwa dalam video 30 detik | $214 | $150 | |
Teks | Klasifikasi | 50 kata | $129 | $90 |
Sentimen | 50 kata | $200 | $140 | |
Ekstraksi entity | Entity | $86 | $60 | |
Pembelajaran aktif | Semua | Item data | $80 | $56 |
Pemberi label kustom | Semua | Item data | $80 | $56 |
Selain biaya yang dijelaskan dalam dokumen ini, Anda juga harus menyimpan file data dan program dalam bucket Cloud Storage selama siklus proses Vertex AI. Penyimpanan ini tunduk pada kebijakan harga Cloud Storage.
Penggunaan Cloud Storage yang diwajibkan meliputi:
Operasi pengelolaan resource yang disediakan oleh AI Platform tersedia tanpa biaya. Kebijakan kuota AI Platform membatasi beberapa operasi ini.
Resource | Operasi gratis |
|---|---|
yang paling canggih | create, get, list, delete |
versi | create, get, list, delete, setDefault |
tugas | get, list, cancel |
operasi | get, list, cancel, delete |
Jika Anda menyimpan gambar yang akan dianalisis di Cloud Storage atau menggunakan resource Google Cloud lain bersama dengan Vertex AI, Anda juga akan dikenai biaya atas penggunaan layanan tersebut.
Untuk melihat status penagihan saat ini di Konsol Google Cloud, beserta penggunaan dan tagihan Anda saat ini, lihat halaman Penagihan. Untuk detail selengkapnya tentang cara mengelola akun, lihat Dokumentasi Penagihan Cloud atau Dukungan Penagihan dan Pembayaran.