Il throughput di cui è stato eseguito il provisioning per una singola zona ti consente di prenotare il throughput in regioni specifiche in cui è disponibile una sola zona. Questa opzione offre prestazioni prevedibili per i modelli Gemini nei casi d'uso in cui è richiesto l'elaborazione ML.
Per visualizzare l'elenco dei modelli e delle regioni supportati, consulta Deployment ed endpoint. Per l'elenco delle regioni e dei modelli che supportano l'elaborazione ML, consulta Elaborazione ML.
Funzionalità del throughput riservato a zona singola
Questa sezione descrive le funzionalità chiave di Single Zone Provisioned Throughput:
Prezzi e unità sono coerenti con il throughput con provisioning standard: il throughput con provisioning a zona singola utilizza la stessa misura di throughput (GSU), prezzi e termini del throughput con provisioning standard.
Il throughput di cui è stato eseguito il provisioning per una singola zona supporta l'elaborazione ML nella regione: tutte le richieste vengono elaborate nella regione acquistata, incluso il traffico che supera la quantità di throughput acquistata. Questo traffico viene fatturato alla tariffa pay-as-you-go utilizzando la capacità buffer nella regione.
Tu controlli gli eccessi: puoi controllare il traffico di overflow utilizzando le stesse intestazioni del throughput con provisioning standard.
Puoi monitorare il tuo ordine: puoi monitorare l'ordine di portata sottoposta a provisioning a zona singola utilizzando le funzionalità di monitoraggio della portata sottoposta a provisioning esistenti.
Limitazioni
Il throughput di cui è stato eseguito il provisioning in una singola zona presenta le seguenti limitazioni:
Il Throughput riservato a zona singola non è un Servizio coperto ed è escluso dall'accordo sul livello del servizio di Gemini Online Inference su Vertex AI.
Il throughput di cui è stato eseguito il provisioning per una singola zona non si integra con o non supporta le richieste batch o il fine tuning.
Nelle regioni senza elaborazione ML, la latenza per il throughput di cui è stato eseguito il provisioning di una singola zona potrebbe essere superiore a quella del throughput di cui è stato eseguito il provisioning standard o del pagamento a consumo.
Acquistare la velocità effettiva sottoposta a provisioning per una singola zona
Per assistenza con l'acquisto di Single Zone Provisioned Throughput, contatta il tuo rappresentante dell'account. Google Cloud