Harga Vertex AI
Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.
Halaman ini membahas harga untuk AI Generatif di Vertex AI. Untuk semua harga Vertex AI lainnya termasuk layanan ML Platform dan MLOps, lihat halaman harga Vertex AI.
Model dasar Google
Multimodal
Dengan model Multimodal di Vertex AI, Anda dapat memasukkan teks atau media (gambar, video). Input teks dikenai biaya berdasarkan setiap 1.000 karakter input (perintah) dan setiap 1.000 karakter output (respons). Karakter dihitung dengan poin kode UTF-8 dan spasi putih dikecualikan dari jumlah, sehingga menghasilkan sekitar 4 karakter per token. Permintaan prediksi yang menghasilkan respons yang difilter hanya akan dikenai biaya untuk input tersebut. Pada akhir setiap siklus penagihan, pecahan dari satu sen ($0,01) dibulatkan menjadi satu sen. Input media dikenai biaya per gambar atau per detik (video).
Model | Fitur | Jenis | Harga ( =< jendela konteks 128K) |
Harga ( > jendela konteks 128 ribu) |
---|---|---|---|---|
Flash Gemini 1.5 | Multimodal | Input Gambar Input Video Input Teks Input Audio |
$0,0001315 / gambar $0,0001315 / detik $0,000125 / 1.000 karakter $0,0000125 / detik |
$0,000263 / gambar $0,000263 / detik $0,00025 / 1.000 karakter $0,000025 / detik |
Output Teks | $0,000375 / 1 ribu karakter | $0,00075 / 1.000 karakter | ||
Gemini 1.5 Pro | Multimodal | Input Gambar Input Video Input Teks Input Audio |
$0,001315 / gambar $0,001315 / detik $0,00125 / 1.000 karakter $0,000125 / detik |
$0,00263 / gambar $0,00263 / detik $0,0025 / 1.000 karakter $0,00025 / detik |
Output Teks | $0,00375 / 1 ribu karakter | $0,0075 / 1 ribu karakter | ||
Gemini 1.0 Pro | Multimodal | Input Gambar Input Video Input Teks |
$0,0025 / gambar $0,002 / detik $0,000125 / 1.000 karakter |
|
Output Teks | $0,000375 / 1 ribu karakter | |||
Permukaan rujukan dengan Google Penelusuran | Teks | Permintaan grounding | $35 / 1.000 permintaan (untuk hingga 1 juta permintaan per hari). Hubungi tim akun Anda jika memerlukan lebih dari 1 juta permintaan per hari. |
* Harga dicantumkan dalam Dolar AS (USD).
Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.
* Jika konteks kueri lebih dari 128 ribu, semua token akan dikenai biaya pada kecepatan konteks yang panjang.
* Model Gemini tersedia dalam mode batch dengan diskon 50%.
* Gemini 1.0 Pro hanya mendukung hingga 32K jendela konteks.
* PDF ditagih sebagai input gambar, dengan satu halaman PDF yang setara dengan satu gambar
Model | Fitur | Jenis | Harga |
---|---|---|---|
Gemini 1.5 Pro | Multimodal | Input Gambar Input Video Input Teks Input Audio |
$0,00265 / gambar $0,00265 / detik $0,0025 / 1.000 karakter $0,00025 / detik |
Output Teks | $0,0075 / 1 ribu karakter |
Menyimpan ke Cache Konteks
Dengan caching konteks, Anda dapat mengurangi biaya dan latensi pembuatan konten dengan meng-cache bagian konteks dari teks atau media input Anda ke model Gemini. Jumlah waktu data disimpan dalam cache, yang dapat dikontrol oleh pengguna, menentukan biaya "Penyimpanan Cache Konteks". Cache yang ditemukan pada data input dikenai tarif yang lebih rendah, yaitu “Cached Input”, bukan biaya input normal. Ukuran data untuk penyimpanan dan input dihitung dengan cara yang sama seperti harga input Gemini.
Model | Fitur | Jenis | Harga ( =< jendela konteks 128K) |
Harga untuk konteks panjang ( > jendela konteks 128 ribu) |
---|---|---|---|---|
Gemini 1.5 Pro | Input Cache |
Input Gambar Input Video Input Teks Input Audio |
0,0006575 / gambar 0,0006575 / detik 0,000625 / 1.000 karakter 0,0000625 / detik |
0,001315 / gambar 0,001315 / detik 0,00125 / 1.000 karakter 0,000125 / detik |
Konteks Cache Penyimpanan |
Input Gambar Input Video Input Teks Input Audio |
0,0011835 / gambar / jam 0,0011835 / detik / jam 0,001125 / 1 ribu karakter / jam 0,0001125 / detik / jam |
* Harga dicantumkan dalam Dolar AS (USD).
Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.
* Jika konteks kueri lebih dari 128 ribu, semua token akan dikenai biaya pada kecepatan konteks yang panjang.
* Output model ditagih dengan tarif non-cache.
* PDF ditagih sebagai input gambar, dengan satu halaman PDF yang setara dengan satu gambar
Pembuatan gambar
Dengan fitur Pembuatan Gambar di Vertex AI, Anda dapat menghasilkan gambar baru dan mengedit gambar berdasarkan perintah teks yang Anda sediakan, atau hanya mengedit bagian dari gambar menggunakan area mask yang Anda tentukan bersama dengan sejumlah kemampuan lainnya.
Model | Fitur | Deskripsi | Input | Output | Harga |
---|---|---|---|---|---|
Imagen | Pembuatan gambar | Buat gambar | Perintah teks | Gambar | $0,020 per gambar |
Pengeditan gambar | Edit gambar menggunakan pendekatan bebas mask atau mask | Perintah Gambar/Teks | Gambar | $0,020 per gambar | |
Peningkatan resolusi | Meningkatkan resolusi gambar yang dihasilkan menjadi 2k dan 4k | Gambar | Gambar | $0,003 per gambar | |
Fine tuning | Aktifkan "subjek" yang disediakan oleh pengguna untuk digunakan dalam perintah Imagen (beberapa pelatihan gambar) | Subjek dengan ID teks dan 4-8 gambar per subjek | Model yang telah melalui fine tuning (setelah pelatihan dengan subjek yang disediakan pengguna) | $ per jam kerja node (harga pelatihan kustom Vertex AI) | |
Teks Keterangan Visual | Membuat teks singkat atau panjang untuk gambar | Gambar | Teks keterangan | $0,0015/gambar | |
Tanya Jawab Visual | Memberikan jawaban berdasarkan pertanyaan yang merujuk ke gambar | Perintah Gambar/Teks | Jawaban teks | $0,0015/gambar |
Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda di SKU Cloud Platform.
API Embeddings Multimodal
Model | Fitur | Deskripsi | Input | Output | Price |
---|---|---|---|---|---|
multimodalembedding | Embedding untuk Multimodal: Teks | Membuat embedding menggunakan teks sebagai input | Teks | Embedding | $0,0002 / 1.000 input karakter |
Embedding untuk Multimodal: Gambar | Membuat embedding menggunakan gambar sebagai input | Gambar | Embedding | $0,0001 / input gambar | |
Embeddings untuk Multimodal: Video | Video Plus | Video | Embeddings (hingga 15 embedding per menit untuk video) | $0,0020 per detik untuk video | |
Embeddings untuk Multimodal: Video | Standar Video | Video | Embeddings (hingga 8 embedding per menit video) | $0,0010 per detik video | |
Embeddings untuk Multimodal: Video | Video Penting | Video | Embeddings (hingga 4 embedding per menit video) | $0,0005 per detik video |
Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda di SKU Cloud Platform.
Pembuatan teks
AI Generatif di Vertex AI mengenakan biaya per 1.000 karakter input (perintah) dan per 1.000 karakter output (respons). Karakter dihitung berdasarkan poin kode UTF-8 dan spasi dikecualikan dari hitungan. Selama tahap Pratinjau, tagihan didiskon 100%. Permintaan prediksi yang menghasilkan respons yang difilter hanya dikenakan biaya untuk input. Pada akhir setiap siklus penagihan, pecahan dari satu sen ($0,01) dibulatkan menjadi satu sen.
Model | Jenis | Region | Harga per 1.000 karakter |
---|---|---|---|
PaLM 2 untuk Teks (Text Bison) | Input | Global |
|
Output | Global |
|
|
Penyesuaian yang Diawasi | us-central1 europe-west4 |
$ per jam kerja node harga pelatihan kustom Vertex AI | |
Reinforcement Learning from Human Feedback | us-central1 europe-west4 |
$ per jam kerja node harga pelatihan kustom Vertex AI | |
PaLM 2 untuk Teks 32k (Text Bison 32k) | Input | Global |
|
Output | Global |
|
|
Penyesuaian yang Diawasi | us-central1 europe-west4 |
$ per jam kerja node harga pelatihan kustom Vertex AI | |
PaLM 2 untuk Teks (Teks Unicorn) |
Input | Global |
|
Output | Global |
|
|
PaLM 2 untuk Chat (Chat Bison) | Input | Global |
|
Output | Global |
|
|
Penyesuaian yang Diawasi | us-central1 europe-west4 |
$ per jam kerja node harga pelatihan kustom Vertex AI | |
Reinforcement Learning from Human Feedback | us-central1 europe-west4 |
$ per jam kerja node harga pelatihan kustom Vertex AI | |
PaLM 2 untuk Chat 32k (Chat Bison 32k) | Input | Global |
|
Output | Global |
|
|
Penyesuaian yang Diawasi | us-central1 europe-west4 |
$ per jam kerja node harga pelatihan kustom Vertex AI | |
Embedding untuk Teks | Input | Global |
|
Output | Global |
|
|
Codey untuk Pembuatan Kode | Input | Global |
|
Output | Global |
|
|
Penyesuaian yang Diawasi | us-central1 europe-west4 |
$ per jam kerja node harga pelatihan kustom Vertex AI | |
Codey untuk Pembuatan Kode 32k | Input | Global |
|
Output | Global |
|
|
Penyesuaian yang Diawasi | us-central1 europe-west4 |
$ per jam kerja node harga pelatihan kustom Vertex AI | |
Codey untuk Chat Kode | Input | Global |
|
Output | Global |
|
|
Penyesuaian yang Diawasi | us-central1 europe-west4 |
$ per jam kerja node Harga pelatihan kustom Vertex AI | |
Codey untuk Obrolan Kode 32k | Input | Global |
|
Output | Global |
|
|
Penyesuaian yang Diawasi | us-central1 europe-west4 |
$ per jam kerja node harga pelatihan kustom Vertex AI | |
Codey untuk Penyelesaian kode | Input | Global |
|
Output | Global |
|
Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda di SKU Cloud Platform.
Contoh penghitungan biaya
Jika pengguna mengirim lima permintaan terpisah ke model PaLM Text Bison, dan setiap permintaan memiliki input 200 karakter dan output 400 karakter, total biaya akan dihitung sebagai berikut:
Input cost:
200 input characters x 5 prompts = 1,000 total input characters;
1,000 total input characters x ($0.00025 / 1000) = $0.00025 input cost.
Output cost:
400 output characters x 5 prompts = 2,000 total output characters;
2,000 total output characters x ($0.0005 / 1000) = $0.001 output cost.
Total cost:
$0.00025 input cost + $0.001 output cost = $0.00125 total cost.
Model partner
Model partner adalah daftar model AI generatif pilihan yang dikembangkan oleh partner Google. Model partner ditawarkan sebagai API terkelola. Untuk mengetahui informasi selengkapnya, lihat Ringkasan model partner. Tabel berikut mencantumkan detail harga untuk model partner Google:
Model Claude 3 dari Anthropic
Model | Harga |
---|---|
Opus Claude 3 | Input: $15 / juta token Output: $75 / juta token |
Claude 3 Soneta | Input: $3 / juta token Output: $15 / juta token |
Claude 3 Haiku | Input: $0,25 / juta token Output: $1,25 / juta token |