Harga Vertex AI

Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.

Halaman ini membahas harga untuk AI Generatif di Vertex AI. Untuk semua harga Vertex AI lainnya termasuk layanan ML Platform dan MLOps, lihat halaman harga Vertex AI.

Model Google

Gemini

Dengan model Multimodal di Vertex AI, Anda dapat memasukkan teks atau media (gambar, video). Input Text dikenai biaya oleh setiap 1.000 karakter input (prompt) dan setiap 1.000 karakter output (respons). Karakter dihitung oleh titik kode UTF-8 dan ruang kosong dikecualikan dari jumlah, sehingga menghasilkan sekitar 4 karakter per token. Permintaan prediksi yang mengarah ke respons yang difilter hanya dikenai biaya untuk input tersebut. Di akhir setiap siklus penagihan, pecahan satu sen ($0,01) dibulatkan menjadi satu sen. Input Media dikenai biaya per gambar atau per detik (video).

Model Fitur Jenis Harga
( =< 128 ribu token input)
Harga
( > 128 ribu token input)
Flash Gemini 1.5 Multimodal Input Gambar
Input Video
Input Teks
Input Audio
$0,00002 / gambar
$0,00002 / detik
$0,00001875 / 1.000 karakter
$0,000002 / detik
$0,00004 / gambar
$0,00004 / detik
$0,0000375 / 1.000 karakter
$0,000004 / detik
Output Teks $0,000075 / 1.000 karakter $0,00015 / 1.000 karakter
Penyesuaian* Token Pelatihan $8 / M token
Gemini 1.5 Pro Multimodal Input Gambar
Input Video
Input Teks
Input Audio
$0,00032875 / gambar
$0,00032875 / detik
$0,0003125 / 1.000 karakter
$0,00003125 / detik
$0,0006575 / gambar
$0,0006575 / detik
$0,000625 / 1.000 karakter
$0,0000625 / detik
Output Teks $0,00125 / 1.000 karakter $0,0025 / 1.000 karakter
Penyesuaian* Token Pelatihan $80 / M token
Gemini 1.0 Pro Multimodal Input Gambar
Input Video
Input Teks
$0,0025 / gambar
$0,002 / detik
$0,000125 / 1.000 karakter
Output Teks $0,000375 / 1.000 karakter
Grounding dengan Google Penelusuran Teks Permintaan ground $35 / 1.000 permintaan (untuk hingga 1 juta permintaan per hari).
Hubungi tim akun jika Anda memerlukan lebih dari
1 juta permintaan per hari.

* Harga tercantum dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.
* Jika konteks kueri lebih panjang dari 128 ribu, semua token akan dikenai biaya pada rasio konteks yang panjang.
* Model Gemini tersedia dalam mode batch dengan diskon 50%.
* Gemini 1.0 Pro hanya mendukung maksimum 32 ribu jendela konteks.
* PDF ditagih sebagai input gambar, dengan satu halaman PDF yang setara dengan satu gambar.
* Endpoint model yang disesuaikan memiliki harga prediksi yang sama dengan model dasar.
* Grounding dengan Google Penelusuran: Jika Anda menggunakan pengambilan dinamis untuk mengoptimalkan biaya, hanya permintaan yang berisi setidaknya satu URL dukungan ground dari web dalam responsnya yang dikenai biaya untuk Grounding dengan Google Penelusuran. Biaya untuk Gemini selalu berlaku.

Imagen

Dengan Imagen di Vertex AI, Anda dapat membuat gambar baru dan mengedit gambar berdasarkan perintah teks yang Anda berikan, atau hanya mengedit sebagian gambar menggunakan area mask yang Anda tentukan beserta berbagai kemampuan lainnya.

Model Fitur Deskripsi Input Output Harga
Gambar 3 Pembuatan gambar Buat gambar Perintah teks Gambar $0,04 per gambar
Imagen 3 Cepat Pembuatan gambar Buat gambar Perintah teks Gambar $0,02 per gambar
Gambar 2, Gambar Pembuatan gambar Buat gambar Perintah teks Gambar $0,020 per gambar
Pengeditan gambar Edit gambar menggunakan pendekatan tanpa mask atau mask Perintah Gambar/Teks Gambar $0,020 per gambar
Peningkatan resolusi Meningkatkan resolusi gambar yang dihasilkan menjadi 2k dan 4k Gambar Gambar $0,003 per gambar
Fine tuning Aktifkan "subjek" yang disediakan pengguna untuk digunakan dalam perintah Imagen (beberapa pelatihan foto) Subjek dengan ID teks dan 4-8 gambar per subjek Model yang telah melalui fine tuning (setelah pelatihan dengan subjek yang disediakan pengguna) $ per jam kerja node (harga pelatihan kustom Vertex AI)
Teks Keterangan Visual Membuat teks singkat atau panjang untuk gambar Gambar Teks keterangan $0,0015/gambar
Tanya Jawab Visual Memberikan jawaban berdasarkan pertanyaan yang merujuk ke gambar Perintah Gambar/Teks Jawaban teks $0,0015/gambar

Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda di SKU Cloud Platform.

Embedding

Model Fitur Deskripsi Input Output Harga
{i>multimodalembedding<i} Embedding untuk Multimodal: Teks Membuat embedding menggunakan teks sebagai input Teks Embedding $0,0002 / 1.000 input karakter
Embedding untuk Multimodal: Gambar Membuat embedding menggunakan gambar sebagai input Gambar Embedding $0,0001 / input gambar
Embedding untuk Multimodal: Video Plus Video Plus Video Embeddings (hingga 15 embedding per menit video) $0,0020 per detik video
Embedding untuk Multimodal: Standar Video Standar Video Video Embeddings (hingga 8 embedding per menit video) $0,0010 per detik video
Embedding untuk Multimodal: Video Penting Video Penting Video Embeddings (hingga 4 embedding per menit video) $0,0005 per detik video
Model Jenis Region Harga per 1.000 karakter
Embeddings for Text Input Global
  • Permintaan online: $0,000025
  • Permintaan batch: $0,00002
Output Global
  • Permintaan online: Tanpa biaya
  • Permintaan banyak: Tanpa biaya

Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda di SKU Cloud Platform.

Penyelesaian kode yang didukung AI

AI Generatif di Vertex AI mengenakan biaya per 1.000 karakter input (perintah) dan per 1.000 karakter output (respons). Karakter dihitung berdasarkan poin kode UTF-8 dan spasi dikecualikan dari hitungan. Selama tahap Pratinjau, tagihan didiskon 100%. Permintaan prediksi yang menyebabkan respons yang difilter hanya dikenai biaya untuk input tersebut. Pada akhir setiap siklus penagihan, pecahan satu sen ($0,01) dibulatkan menjadi satu sen.

Model Jenis Region Harga per 1.000 karakter
Codey untuk Penyelesaian kode Input Global
  • Permintaan online: $0,00025
Output Global
  • Permintaan online: $0,0005

Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda di SKU Cloud Platform.

Terjemahan (Teks)

Gunakan Vertex AI API dan LLM terjemahan untuk menerjemahkan teks. Terjemahan LLM cenderung lebih fasih dan terdengar manusia daripada model terjemahan klasik, tetapi memiliki dukungan bahasa yang lebih terbatas (Pelajari Lebih Lanjut).

Model Metode Penggunaan Harga per satu juta karakter
LLM Terjemahan teks (Pratinjau)* Jumlah karakter input per bulan

$10 per satu juta karakter*

Jumlah karakter output per bulan

$10 per satu juta karakter*

Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.
*Harga per karakter yang diproses oleh model. Untuk mengetahui detail tentang karakter yang dihitung, lihat Karakter yang ditagih

Menyimpan ke Cache Konteks

Dengan penyimpanan cache konteks, Anda dapat mengurangi biaya pemrosesan token input Gemini hingga 75% dan latensi pembuatan konten dengan menyimpan bagian konteks teks atau media input Anda ke model Gemini dalam cache. Lamanya waktu data disimpan dalam cache, yang dapat dikontrol oleh pengguna, menentukan biaya "Penyimpanan Cache Konteks". Saat membuat konteks yang di-cache, pengguna akan ditagih biaya token input standar. Hit cache pada data input akan ditagih dengan tarif yang lebih rendah, yaitu "Input yang Di-Cache", bukan biaya input normal. Ukuran data untuk penyimpanan dan input dihitung dengan cara yang sama seperti harga input Gemini.

Model Fitur Jenis Harga ( =< token input 128 ribu) Harga ( > token input 128 ribu)
Flash Gemini 1.5 Input dalam Cache Input Gambar
Input Video
Input Teks
Input Audio
0,000005 / gambar
0,000005 / detik
0,0000046875 / 1 ribu karakter
0,0000005 / detik
0,00001 / gambar
0,00001 / detik
0,000009375 / 1 ribu karakter
0,000001 / detik
Penyimpanan Cache Konteks Input Gambar
Input Video
Input Teks
Input Audio
0,000263 / gambar / jam
0,000263/ detik / jam
0,00025 / 1 ribu karakter / jam
0,000025 / detik / jam
Gemini 1.5 Pro Input dalam Cache Input Gambar
Input Video
Input Teks
Input Audio
0,0000821875 / gambar
0,0000821875 / detik
0,000078125 / 1 ribu karakter
0,0000078125 / detik
0,000164375 / gambar
0,000164375 / detik
0,00015625 / 1 ribu karakter
0,000015625 / detik
Penyimpanan Cache Konteks Input Gambar
Input Video
Input Teks
Input Audio
0,0011835 / gambar / jam
0,0011835/ detik / jam
0,001125 / 1 ribu karakter / jam
0,0001125 / detik / jam

Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda di SKU Cloud Platform.

Contoh penghitungan biaya yang di-cache

Jika pengguna membuat konteks yang di-cache sebanyak 250.000 karakter dengan TTL selama 2 jam,lalu mengirimkan dua puluh permintaan terpisah ke model Gemini 1.5 Pro selama 2 jam tersebut, dan setiap permintaan memiliki kueri 200 karakter yang ditambahkan ke konteks yang di-cache dan output 400 karakter, total biayanya dihitung sebagai berikut:

Cache Creation cost:
250,000 input characters x ($0.0003125 / 1000) = $0.078125 cached input cost.

Cache Storage cost:
250,000 characters x 2 hours = 500,000 total character hours;
500,000 total character hours x ($0.001125 / 1000) = $0.5625 storage cost.

Requests using cache cost:
200 characters x 20 requests = 4,000 total character inputs
250,000 cached characters * 20 requests = 5,000,000 total cached character inputs
4,000 total character inputs * ($0.0003125 / 1000) = $0.00125 character input cost
5,000,000 total cached character inputs * ($0.000078125 / 1000) = $0.390625 cached input cost
$0.00125 character input cost + $0.390625 cached input cost = $0.391875 total input cost

Output cost:
400 output characters x 20 prompts = 8,000 total output characters;
8,000 total output characters x ($0.00375 / 1000) = $0.03 output cost.

Total cost:
$0.078125 cached input cost + $0.5625 cached storage cost + $0.391875 input cost + $0.03 output cost = $1.0625 total cost.

Contoh penghitungan biaya

Jika pengguna mengirim lima permintaan terpisah ke model PaLM Text Bison, dan setiap permintaan memiliki input 200 karakter dan output 400 karakter, total biaya akan dihitung sebagai berikut:

Input cost:
200 input characters x 5 prompts = 1,000 total input characters;
1,000 total input characters x ($0.00025 / 1000) = $0.00025 input cost.

Output cost:
400 output characters x 5 prompts = 2,000 total output characters;
2,000 total output characters x ($0.0005 / 1000) = $0.001 output cost.

Total cost:
$0.00025 input cost + $0.001 output cost = $0.00125 total cost.

Model partner

Model partner adalah daftar pilihan model AI generatif yang dikembangkan oleh partner Google. Model partner ditawarkan sebagai API terkelola. Untuk mengetahui informasi selengkapnya, lihat Ringkasan model partner. Bagian berikut mencantumkan detail harga untuk model partner Google.

Model AI21 Lab

Model Harga
Jamba 1,5 Besar Input: $2 / juta token
Output: $8 / juta token
Jamba 1.5 Mini Input: $0,20 / juta token
Output: $0,40 / juta token

Model Claude dari Anthropic

Model Harga
Claude 3.5 Haiku Input: $1,00 / juta token
Output: $5,00 / juta token
Claude 3.5 Sonet v2 Input: $3 / juta token
Output: $15 / juta token
Claude 3.5 Sonnet Input: $3 / juta token
Output: $15 / juta token
Claude 3 Haiku Input: $0,25 / juta token
Output: $1,25 / juta token
Claude 3 Sonnet Input: $3 / juta token
Output: $15 / juta token
Claude 3 Opus Input: $15 / juta token
Output: $75 / juta token

Model Llama dari Meta

Model Harga
Llama 3.1 405B Input: $5 / juta token
Output: $16 / juta token

Model Mistral AI

Model Harga
Mistral Besar (2407) Input: $2 / juta token
Output: $6 / juta token
Nemo Mistral Input: $0,15 / juta token
Output: $0,15 / juta token
Codestral Input: $0,20 / juta token
Output: $0,60 / juta token

Meminta penawaran harga khusus

Dengan model harga bayar sesuai penggunaan Google Cloud, Anda hanya membayar untuk layanan yang Anda gunakan. Hubungi tim penjualan kami untuk mendapatkan penawaran harga khusus bagi organisasi Anda.
Hubungi bagian penjualan