Halaman ini memberikan detail yang perlu dipertimbangkan sebelum berlangganan Provisioned Throughput, izin yang harus Anda miliki untuk membuat atau melihat pesanan Provisioned Throughput, dan petunjuk untuk membuat dan melihat pesanan.
Hal yang perlu dipertimbangkan sebelum membeli
Untuk membantu Anda memutuskan apakah ingin membeli Throughput yang Disediakan, pertimbangkan hal berikut:
Anda tidak dapat membatalkan pesanan di tengah masa berlakunya.
Pembelian Throughput yang Disediakan adalah komitmen, yang berarti Anda tidak dapat membatalkan pesanan di tengah masa berlaku. Namun, Anda dapat meningkatkan jumlah GSU yang dibeli. Jika Anda tidak sengaja membeli komitmen atau ada masalah dengan konfigurasi, hubungi Google Cloud perwakilan akun untuk mendapatkan bantuan.
Anda dapat memperpanjang langganan secara otomatis.
Saat mengirimkan pesanan, Anda dapat memilih untuk memperpanjang langganan secara otomatis di akhir masa berlakunya, atau membiarkan langganan berakhir masa berlakunya. Anda dapat membatalkan proses perpanjangan otomatis. Untuk membatalkan langganan sebelum diperpanjang otomatis, batalkan perpanjangan otomatis 30 hari sebelum awal periode berikutnya.
Anda dapat mengonfigurasi langganan bulanan untuk diperpanjang secara otomatis setiap bulan. Periode mingguan tidak mendukung perpanjangan otomatis.
Untuk mengetahui informasi selengkapnya, lihat Mengubah urutan Provisioned Throughput. Anda juga dapat menghubungi Google Cloud perwakilan akun untuk mendapatkan bantuan.
Anda dapat mengubah versi model atau wilayah dengan pemberitahuan.
Setelah Anda memilih project, region, model, dan versi, serta pesanan Anda disetujui dan diaktifkan, Provisioned Throughput akan diaktifkan. Anda dapat mengubah model Google atau versi model menjadi model Google atau versi model baru menggunakan Konsol Google Cloud.
Untuk mengetahui informasi selengkapnya, lihat Mengubah urutan Provisioned Throughput. Anda juga dapat menghubungi Google Cloud perwakilan akun untuk mendapatkan bantuan.
Perubahan diproses berdasarkan upaya terbaik dan biasanya dipenuhi dalam waktu 10 hari kerja sejak permintaan awal. Untuk mengubah region atau project, Anda harus mengaktifkan urutan baru sebelum membatalkan urutan sebelumnya.
Anda hanya dapat beralih antarmodel dari vendor yang sama. Misalnya, Anda dapat beralih antara model Google atau antara model partner A. Namun, Anda tidak dapat beralih antara model Google dan model partner A.
Secara default, kelebihan kuota akan ditagih sebagai bayar sesuai pemakaian.
Jika throughput Anda melebihi jumlah pesanan Throughput yang Disediakan, kelebihan penggunaan akan diproses dan ditagih sebagai pembayaran sesuai penggunaan standar. Anda dapat mengontrol kelebihan penggunaan berdasarkan per permintaan. Untuk mengetahui informasi selengkapnya, lihat Menggunakan Throughput yang Disediakan.
Untuk mengetahui informasi tentang harga, lihat Throughput yang Disediakan.
Izin
Peran berikut harus diberikan untuk menggunakan Throughput yang Disediakan:
roles/aiplatform.provisionedThroughputAdmin
: Anda dapat mengakses resource Throughput yang Disediakan Vertex AI.
Izin berikut diberikan kepada Anda oleh peran ini:
aiplatform.provisionedThroughputs.create
: Anda dapat mengirimkan pesanan Throughput yang Disediakan dalam project.aiplatform.provisionedThroughputs.list
: Anda dapat melihat semua pesanan Throughput yang Disediakan dalam project.
Memesan Throughput yang Disediakan
Sebelum Anda melakukan pemesanan untuk menggunakan model Imagen, kirimkan Permintaan untuk memberikan izin agar Anda diberi izin.
Sebelum Anda melakukan pemesanan untuk menggunakan MedLM-large-1.5, hubungi Google Cloud perwakilan akun untuk meminta akses. Jika Anda memperkirakan QPM akan melebihi 30.000, untuk memaksimalkan pesanan Throughput yang Disediakan, minta peningkatan pada kuota sistem Vertex AI default menggunakan informasi berikut:
- Service: Vertex AI API.
- Nama:
Online prediction requests per minute per region
- Jenis layanan: Kuota.
- Dimensi: Region tempat Anda memesan Provisioned Throughput.
- Nilai: Ini adalah batas traffic prediksi online yang Anda pilih.
Ikuti langkah-langkah berikut untuk membeli Provisioned Throughput:
Konsol
- Di konsol Google Cloud, buka halaman Provisioned Throughput.
- Untuk memulai pesanan baru, klik Buat.
- Masukkan Nama pesanan.
- Pilih Model.
- Pilih Region.
- Masukkan Jumlah unit skala AI generatif (GSU) yang harus Anda
beli. Jika Anda harus memperkirakan jumlah GSU, klik
Alat estimasi.
- Pilih Model Anda.
- Masukkan jumlah Kueri per detik.
- Masukkan jumlah Karakter input per kueri.
- Masukkan jumlah Gambar input per kueri.
- Masukkan jumlah Detik video per kueri.
- Masukkan jumlah Detik audio per kueri.
- Masukkan jumlah Karakter output per kueri.
- Jika Anda ingin menggunakan nilai yang dimasukkan ke dalam alat estimasi, klik Gunakan yang dihitung.
- Pilih Persyaratan.
Jika memilih satu minggu, Anda memiliki opsi untuk memberikan tanggal dan waktu mulai dalam dua minggu ke depan setelah melakukan pemesanan. Jika Anda tidak memberikan tanggal dan waktu mulai, kami akan memproses pesanan segera setelah kami dapat memastikan bahwa kapasitas tersedia. Tanggal dan waktu mulai yang diminta akan diproses berdasarkan upaya terbaik, dan pesanan tidak dijamin akan dipenuhi pada tanggal ini hingga status pesanan ditetapkan ke Disetujui.
Jika tanggal mulai yang diminta terlalu dekat dengan tanggal saat ini, pesanan Anda mungkin disetujui dan diaktifkan setelah tanggal mulai yang diminta, yang berarti tanggal akhir Anda tetap tujuh hari sejak tanggal aktivasi.
- Pilih opsi Perpanjangan.
- Klik Lanjutkan.
- Di bagian Ringkasan, tinjau estimasi harga dan throughput untuk pesanan Anda. Baca persyaratan yang tercantum dan ditautkan dalam formulir.
- Untuk menyelesaikan pesanan, klik Konfirmasi.
Mengubah urutan Throughput yang Disediakan
Tabel ini menjelaskan cara mengubah pesanan Provisioned Throughput melalui konsol Google Cloud berdasarkan status pesanan dan kondisi yang ada. Untuk meminta akses ke fitur pratinjau ini, isi dan kirimkan formulir kontrol akses Throughput Disediakan.
Status pesanan | Tindakan | Catatan | Langkah-langkah di konsol Google Cloud |
---|---|---|---|
Menunggu peninjauan | Anda dapat membatalkan pesanan. |
Jika Anda memiliki perubahan tambahan pada pesanan, batalkan pesanan yang tertunda, lalu lakukan pesanan baru. Jika Anda memiliki beberapa model, setiap model hanya dapat memiliki satu revisi pesanan tertunda atau pesanan tertunda dalam satu waktu. |
Untuk membatalkan pesanan yang tertunda di konsol Google Cloud, lakukan hal berikut:
|
Aktif |
Anda dapat meningkatkan GSU pada pesanan yang ada. Anda dapat mengaktifkan atau menonaktifkan perpanjangan otomatis. Anda dapat mengubah model atau versi model. |
Jika kedua kondisi ini terpenuhi, Anda tidak dapat mengubah pesanan:
|
Untuk mengubah pesanan aktif di konsol Google Cloud, gunakan salah satu metode berikut:
|
Periksa status pesanan
Setelah Anda mengirimkan pesanan Provisioned Throughput, status pesanan mungkin muncul sebagai salah satu dari berikut:
- Menunggu peninjauan: Anda telah melakukan pemesanan. Karena persetujuan bergantung pada kapasitas yang tersedia untuk menyediakan pesanan Anda, pesanan Anda sedang menunggu peninjauan dan persetujuan. Untuk informasi selengkapnya tentang status pesanan yang tertunda, hubungi Google Cloud perwakilan akun Anda.
- Disetujui: Google telah menyetujui pesanan Anda.
- Aktif: Google telah mengaktifkan pesanan Anda, lalu penagihan dimulai.
- Berakhir: Masa berlaku pesanan Anda telah berakhir.
Melihat pesanan Throughput yang Disediakan
Ikuti langkah-langkah berikut untuk melihat pesanan Throughput yang Disediakan:
Konsol
- Di konsol Google Cloud, buka halaman Provisioned Throughput.
- Pilih Region. Daftar pesanan Anda akan muncul.