La Capacidad de procesamiento reservada de una sola zona te permite reservar capacidad de procesamiento en regiones específicas en las que solo hay disponible una zona. Esta opción ofrece un rendimiento predecible para los modelos de Gemini en los casos prácticos en los que se requiere el procesamiento de aprendizaje automático.
Para ver la lista de modelos y regiones admitidos, consulta Implementaciones y endpoints. Para ver la lista de regiones y modelos que admiten el procesamiento de aprendizaje automático, consulta Procesamiento de aprendizaje automático.
Características de la capacidad de procesamiento reservada de una sola zona
En esta sección se describen las principales características de la Capacidad de procesamiento reservada de una sola zona:
Los precios y las unidades son los mismos que los de la capacidad de procesamiento reservada estándar: La capacidad de procesamiento reservada de una sola zona usa la misma medida de capacidad de procesamiento (GSUs), los mismos precios y los mismos términos que la capacidad de procesamiento reservada estándar.
El procesamiento de aprendizaje automático en la región es compatible con el rendimiento aprovisionado de una sola zona: todas las solicitudes se procesan en la región comprada, incluido el tráfico que supera la cantidad de rendimiento que has comprado. Este tráfico se factura a la tarifa de pago por uso mediante la capacidad de búfer de la región.
Tú controlas los excesos: puedes controlar el tráfico de desbordamiento con los mismos encabezados que con el throughput aprovisionado estándar.
Puedes monitorizar tu pedido: puedes monitorizar tu pedido de Single Zone Provisioned Throughput mediante las funciones de monitorización de Provisioned Throughput.
Limitaciones
La Capacidad de procesamiento reservada de una sola zona tiene las siguientes limitaciones:
El rendimiento aprovisionado de una sola zona no es un Servicio Cubierto y está excluido del Acuerdo de Nivel de Servicio de la Inferencias Online de Gemini en Vertex AI.
El rendimiento aprovisionado de una sola zona no se integra ni es compatible con las solicitudes por lotes ni con el ajuste preciso.
En las regiones sin procesamiento de aprendizaje automático, la latencia de Single Zone Provisioned Throughput puede ser superior a la de Provisioned Throughput estándar o a la de pago por uso.
Comprar Capacidad de procesamiento reservada de una sola zona
Si necesitas ayuda para comprar Single Zone Provisioned Throughput, ponte en contacto con tu Google Cloud representante de cuenta.