Classe DedicatedResources.Builder (1.2.0)

public static final class DedicatedResources.Builder extends GeneratedMessageV3.Builder<DedicatedResources.Builder> implements DedicatedResourcesOrBuilder

Una descrizione delle risorse dedicate a un modello implementato e che richiedono un livello maggiore di configurazione manuale.

Tipo di protobuf google.cloud.vertexai.v1.DedicatedResources

Metodi statici

getDescriptor()

public static final Descriptors.Descriptor getDescriptor()
Restituisce
Tipo Description
Descriptor

Metodi

addAllAutoscalingMetricSpecs(Iterable<? extends AutoscalingMetricSpec> values)

public DedicatedResources.Builder addAllAutoscalingMetricSpecs(Iterable<? extends AutoscalingMetricSpec> values)

Immutabile. Le specifiche della metrica che eseguono l'override di una metrica di utilizzo delle risorse (utilizzo CPU, ciclo di servizio dell'acceleratore e così via) sul valore di destinazione (il valore predefinito è 60 se non impostato). È consentita al massimo una voce per metrica.

Se machine_spec.accelerator_count è superiore a 0, la scalabilità automatica si baserà sulle metriche di utilizzo della CPU e del ciclo di lavoro dell'acceleratore e verrà scalata quando una delle due metriche supererà il valore target e fare lo scale down se entrambe le metriche sono al di sotto del valore target. Il valore target predefinito è 60 per entrambe le metriche.

Se machine_spec.accelerator_count è pari a 0, la scalabilità automatica si baserà sulla metrica di utilizzo della CPU solo con valore di destinazione predefinito 60 se non impostato in modo esplicito.

Ad esempio, nel caso della previsione online, se vuoi eseguire l'override dell'utilizzo della CPU target su 80, devi impostare autoscaling_metric_specs.metric_name su aiplatform.googleapis.com/prediction/online/cpu/utilization e autoscaling_metric_specs.target su 80.

repeated .google.cloud.vertexai.v1.AutoscalingMetricSpec autoscaling_metric_specs = 4 [(.google.api.field_behavior) = IMMUTABLE];

Parametro
Nome Description
values Iterable<? extends com.google.cloud.vertexai.api.AutoscalingMetricSpec>
Restituisce
Tipo Description
DedicatedResources.Builder

addAutoscalingMetricSpecs(AutoscalingMetricSpec value)

public DedicatedResources.Builder addAutoscalingMetricSpecs(AutoscalingMetricSpec value)

Immutabile. Le specifiche della metrica che eseguono l'override di una metrica di utilizzo delle risorse (utilizzo CPU, ciclo di servizio dell'acceleratore e così via) sul valore di destinazione (il valore predefinito è 60 se non impostato). È consentita al massimo una voce per metrica.

Se machine_spec.accelerator_count è superiore a 0, la scalabilità automatica si baserà sulle metriche di utilizzo della CPU e del ciclo di lavoro dell'acceleratore e verrà scalata quando una delle due metriche supererà il valore target e fare lo scale down se entrambe le metriche sono al di sotto del valore target. Il valore target predefinito è 60 per entrambe le metriche.

Se machine_spec.accelerator_count è pari a 0, la scalabilità automatica si baserà sulla metrica di utilizzo della CPU solo con valore di destinazione predefinito 60 se non impostato in modo esplicito.

Ad esempio, nel caso della previsione online, se vuoi eseguire l'override dell'utilizzo della CPU target su 80, devi impostare autoscaling_metric_specs.metric_name su aiplatform.googleapis.com/prediction/online/cpu/utilization e autoscaling_metric_specs.target su 80.

repeated .google.cloud.vertexai.v1.AutoscalingMetricSpec autoscaling_metric_specs = 4 [(.google.api.field_behavior) = IMMUTABLE];

Parametro
Nome Description
value AutoscalingMetricSpec
Restituisce
Tipo Description
DedicatedResources.Builder

addAutoscalingMetricSpecs(AutoscalingMetricSpec.Builder builderForValue)

public DedicatedResources.Builder addAutoscalingMetricSpecs(AutoscalingMetricSpec.Builder builderForValue)

Immutabile. Le specifiche della metrica che eseguono l'override di una metrica di utilizzo delle risorse (utilizzo CPU, ciclo di servizio dell'acceleratore e così via) sul valore di destinazione (il valore predefinito è 60 se non impostato). È consentita al massimo una voce per metrica.

Se machine_spec.accelerator_count è superiore a 0, la scalabilità automatica si baserà sulle metriche di utilizzo della CPU e del ciclo di lavoro dell'acceleratore e verrà scalata quando una delle due metriche supererà il valore target e fare lo scale down se entrambe le metriche sono al di sotto del valore target. Il valore target predefinito è 60 per entrambe le metriche.

Se machine_spec.accelerator_count è pari a 0, la scalabilità automatica si baserà sulla metrica di utilizzo della CPU solo con valore di destinazione predefinito 60 se non impostato in modo esplicito.

Ad esempio, nel caso della previsione online, se vuoi eseguire l'override dell'utilizzo della CPU target su 80, devi impostare autoscaling_metric_specs.metric_name su aiplatform.googleapis.com/prediction/online/cpu/utilization e autoscaling_metric_specs.target su 80.

repeated .google.cloud.vertexai.v1.AutoscalingMetricSpec autoscaling_metric_specs = 4 [(.google.api.field_behavior) = IMMUTABLE];

Parametro
Nome Description
builderForValue AutoscalingMetricSpec.Builder
Restituisce
Tipo Description
DedicatedResources.Builder

addAutoscalingMetricSpecs(int index, AutoscalingMetricSpec value)

public DedicatedResources.Builder addAutoscalingMetricSpecs(int index, AutoscalingMetricSpec value)

Immutabile. Le specifiche della metrica che eseguono l'override di una metrica di utilizzo delle risorse (utilizzo CPU, ciclo di servizio dell'acceleratore e così via) sul valore di destinazione (il valore predefinito è 60 se non impostato). È consentita al massimo una voce per metrica.

Se machine_spec.accelerator_count è superiore a 0, la scalabilità automatica si baserà sulle metriche di utilizzo della CPU e del ciclo di lavoro dell'acceleratore e verrà scalata quando una delle due metriche supererà il valore target e fare lo scale down se entrambe le metriche sono al di sotto del valore target. Il valore target predefinito è 60 per entrambe le metriche.

Se machine_spec.accelerator_count è pari a 0, la scalabilità automatica si baserà sulla metrica di utilizzo della CPU solo con valore di destinazione predefinito 60 se non impostato in modo esplicito.

Ad esempio, nel caso della previsione online, se vuoi eseguire l'override dell'utilizzo della CPU target su 80, devi impostare autoscaling_metric_specs.metric_name su aiplatform.googleapis.com/prediction/online/cpu/utilization e autoscaling_metric_specs.target su 80.

repeated .google.cloud.vertexai.v1.AutoscalingMetricSpec autoscaling_metric_specs = 4 [(.google.api.field_behavior) = IMMUTABLE];

Parametri
Nome Description
index int
value AutoscalingMetricSpec
Restituisce
Tipo Description
DedicatedResources.Builder

addAutoscalingMetricSpecs(int index, AutoscalingMetricSpec.Builder builderForValue)

public DedicatedResources.Builder addAutoscalingMetricSpecs(int index, AutoscalingMetricSpec.Builder builderForValue)

Immutabile. Le specifiche della metrica che eseguono l'override di una metrica di utilizzo delle risorse (utilizzo CPU, ciclo di servizio dell'acceleratore e così via) sul valore di destinazione (il valore predefinito è 60 se non impostato). È consentita al massimo una voce per metrica.

Se machine_spec.accelerator_count è superiore a 0, la scalabilità automatica si baserà sulle metriche di utilizzo della CPU e del ciclo di lavoro dell'acceleratore e verrà scalata quando una delle due metriche supererà il valore target e fare lo scale down se entrambe le metriche sono al di sotto del valore target. Il valore target predefinito è 60 per entrambe le metriche.

Se machine_spec.accelerator_count è pari a 0, la scalabilità automatica si baserà sulla metrica di utilizzo della CPU solo con valore di destinazione predefinito 60 se non impostato in modo esplicito.

Ad esempio, nel caso della previsione online, se vuoi eseguire l'override dell'utilizzo della CPU target su 80, devi impostare autoscaling_metric_specs.metric_name su aiplatform.googleapis.com/prediction/online/cpu/utilization e autoscaling_metric_specs.target su 80.

repeated .google.cloud.vertexai.v1.AutoscalingMetricSpec autoscaling_metric_specs = 4 [(.google.api.field_behavior) = IMMUTABLE];

Parametri
Nome Description
index int
builderForValue AutoscalingMetricSpec.Builder
Restituisce
Tipo Description
DedicatedResources.Builder

addAutoscalingMetricSpecsBuilder()

public AutoscalingMetricSpec.Builder addAutoscalingMetricSpecsBuilder()

Immutabile. Le specifiche della metrica che eseguono l'override di una metrica di utilizzo delle risorse (utilizzo CPU, ciclo di servizio dell'acceleratore e così via) sul valore di destinazione (il valore predefinito è 60 se non impostato). È consentita al massimo una voce per metrica.

Se machine_spec.accelerator_count è superiore a 0, la scalabilità automatica si baserà sulle metriche di utilizzo della CPU e del ciclo di lavoro dell'acceleratore e verrà scalata quando una delle due metriche supererà il valore target e fare lo scale down se entrambe le metriche sono al di sotto del valore target. Il valore target predefinito è 60 per entrambe le metriche.

Se machine_spec.accelerator_count è pari a 0, la scalabilità automatica si baserà sulla metrica di utilizzo della CPU solo con valore di destinazione predefinito 60 se non impostato in modo esplicito.

Ad esempio, nel caso della previsione online, se vuoi eseguire l'override dell'utilizzo della CPU target su 80, devi impostare autoscaling_metric_specs.metric_name su aiplatform.googleapis.com/prediction/online/cpu/utilization e autoscaling_metric_specs.target su 80.

repeated .google.cloud.vertexai.v1.AutoscalingMetricSpec autoscaling_metric_specs = 4 [(.google.api.field_behavior) = IMMUTABLE];

Restituisce
Tipo Description
AutoscalingMetricSpec.Builder

addAutoscalingMetricSpecsBuilder(int index)

public AutoscalingMetricSpec.Builder addAutoscalingMetricSpecsBuilder(int index)

Immutabile. Le specifiche della metrica che eseguono l'override di una metrica di utilizzo delle risorse (utilizzo CPU, ciclo di servizio dell'acceleratore e così via) sul valore di destinazione (il valore predefinito è 60 se non impostato). È consentita al massimo una voce per metrica.

Se machine_spec.accelerator_count è superiore a 0, la scalabilità automatica si baserà sulle metriche di utilizzo della CPU e del ciclo di lavoro dell'acceleratore e verrà scalata quando una delle due metriche supererà il valore target e fare lo scale down se entrambe le metriche sono al di sotto del valore target. Il valore target predefinito è 60 per entrambe le metriche.

Se machine_spec.accelerator_count è pari a 0, la scalabilità automatica si baserà sulla metrica di utilizzo della CPU solo con valore di destinazione predefinito 60 se non impostato in modo esplicito.

Ad esempio, nel caso della previsione online, se vuoi eseguire l'override dell'utilizzo della CPU target su 80, devi impostare autoscaling_metric_specs.metric_name su aiplatform.googleapis.com/prediction/online/cpu/utilization e autoscaling_metric_specs.target su 80.

repeated .google.cloud.vertexai.v1.AutoscalingMetricSpec autoscaling_metric_specs = 4 [(.google.api.field_behavior) = IMMUTABLE];

Parametro
Nome Description
index int
Restituisce
Tipo Description
AutoscalingMetricSpec.Builder

addRepeatedField(Descriptors.FieldDescriptor field, Object value)

public DedicatedResources.Builder addRepeatedField(Descriptors.FieldDescriptor field, Object value)
Parametri
Nome Description
field FieldDescriptor
value Object
Restituisce
Tipo Description
DedicatedResources.Builder
Sostituzioni

build()

public DedicatedResources build()
Restituisce
Tipo Description
DedicatedResources

buildPartial()

public DedicatedResources buildPartial()
Restituisce
Tipo Description
DedicatedResources

Clear()

public DedicatedResources.Builder clear()
Restituisce
Tipo Description
DedicatedResources.Builder
Sostituzioni

clearAutoscalingMetricSpecs()

public DedicatedResources.Builder clearAutoscalingMetricSpecs()

Immutabile. Le specifiche della metrica che eseguono l'override di una metrica di utilizzo delle risorse (utilizzo CPU, ciclo di servizio dell'acceleratore e così via) sul valore di destinazione (il valore predefinito è 60 se non impostato). È consentita al massimo una voce per metrica.

Se machine_spec.accelerator_count è superiore a 0, la scalabilità automatica si baserà sulle metriche di utilizzo della CPU e del ciclo di lavoro dell'acceleratore e verrà scalata quando una delle due metriche supererà il valore target e fare lo scale down se entrambe le metriche sono al di sotto del valore target. Il valore target predefinito è 60 per entrambe le metriche.

Se machine_spec.accelerator_count è pari a 0, la scalabilità automatica si baserà sulla metrica di utilizzo della CPU solo con valore di destinazione predefinito 60 se non impostato in modo esplicito.

Ad esempio, nel caso della previsione online, se vuoi eseguire l'override dell'utilizzo della CPU target su 80, devi impostare autoscaling_metric_specs.metric_name su aiplatform.googleapis.com/prediction/online/cpu/utilization e autoscaling_metric_specs.target su 80.

repeated .google.cloud.vertexai.v1.AutoscalingMetricSpec autoscaling_metric_specs = 4 [(.google.api.field_behavior) = IMMUTABLE];

Restituisce
Tipo Description
DedicatedResources.Builder

clearField(Descriptors.FieldDescriptor field)

public DedicatedResources.Builder clearField(Descriptors.FieldDescriptor field)
Parametro
Nome Description
field FieldDescriptor
Restituisce
Tipo Description
DedicatedResources.Builder
Sostituzioni

clearMachineSpec()

public DedicatedResources.Builder clearMachineSpec()

Obbligatorio. Immutabile. La specifica di una singola macchina utilizzata dalla previsione.

.google.cloud.vertexai.v1.MachineSpec machine_spec = 1 [(.google.api.field_behavior) = REQUIRED, (.google.api.field_behavior) = IMMUTABLE];

Restituisce
Tipo Description
DedicatedResources.Builder

clearMaxReplicaCount()

public DedicatedResources.Builder clearMaxReplicaCount()

Immutabile. Il numero massimo di repliche in cui può essere eseguito il deployment di questo modello implementato quando il traffico verso il modello aumenta. Se il valore richiesto è troppo elevato, il deployment commette un errore, ma se il deployment ha esito positivo viene garantita la capacità di scalare il modello fino a un numero di repliche elevato (salvo interruzioni del servizio). Se il traffico verso il modello DeployedModel aumenta oltre il limite massimo consentito dalle sue repliche, verrà eliminata una parte del traffico. Se questo valore non viene fornito, utilizzerà min_replica_count come valore predefinito.

Il valore di questo campo influisce sull'addebito relativo alle quote di CPU e GPU di Vertex. In particolare, ti verranno addebitati i costi relativi a (max_replica_count * numero di core nel tipo di macchina selezionato) e (max_replica_count * numero di GPU per replica nel tipo di macchina selezionato).

int32 max_replica_count = 3 [(.google.api.field_behavior) = IMMUTABLE];

Restituisce
Tipo Description
DedicatedResources.Builder

Questo strumento per il concatenamento.

clearMinReplicaCount()

public DedicatedResources.Builder clearMinReplicaCount()

Obbligatorio. Immutabile. Il numero minimo di repliche della macchina in cui verrà sempre eseguito il deployment di questo modello. Questo valore deve essere maggiore o uguale a 1.

Se il traffico verso DeployedModel aumenta, può essere eseguito dinamicamente il deployment su più repliche e, con la diminuzione del traffico, alcune di queste repliche aggiuntive potrebbero essere liberate.

int32 min_replica_count = 2 [(.google.api.field_behavior) = REQUIRED, (.google.api.field_behavior) = IMMUTABLE];

Restituisce
Tipo Description
DedicatedResources.Builder

Questo strumento per il concatenamento.

clearOneof(Descriptors.OneofDescriptor oneof)

public DedicatedResources.Builder clearOneof(Descriptors.OneofDescriptor oneof)
Parametro
Nome Description
oneof OneofDescriptor
Restituisce
Tipo Description
DedicatedResources.Builder
Sostituzioni

clone()

public DedicatedResources.Builder clone()
Restituisce
Tipo Description
DedicatedResources.Builder
Sostituzioni

getAutoscalingMetricSpecs(int index)

public AutoscalingMetricSpec getAutoscalingMetricSpecs(int index)

Immutabile. Le specifiche della metrica che eseguono l'override di una metrica di utilizzo delle risorse (utilizzo CPU, ciclo di servizio dell'acceleratore e così via) sul valore di destinazione (il valore predefinito è 60 se non impostato). È consentita al massimo una voce per metrica.

Se machine_spec.accelerator_count è superiore a 0, la scalabilità automatica si baserà sulle metriche di utilizzo della CPU e del ciclo di lavoro dell'acceleratore e verrà scalata quando una delle due metriche supererà il valore target e fare lo scale down se entrambe le metriche sono al di sotto del valore target. Il valore target predefinito è 60 per entrambe le metriche.

Se machine_spec.accelerator_count è pari a 0, la scalabilità automatica si baserà sulla metrica di utilizzo della CPU solo con valore di destinazione predefinito 60 se non impostato in modo esplicito.

Ad esempio, nel caso della previsione online, se vuoi eseguire l'override dell'utilizzo della CPU target su 80, devi impostare autoscaling_metric_specs.metric_name su aiplatform.googleapis.com/prediction/online/cpu/utilization e autoscaling_metric_specs.target su 80.

repeated .google.cloud.vertexai.v1.AutoscalingMetricSpec autoscaling_metric_specs = 4 [(.google.api.field_behavior) = IMMUTABLE];

Parametro
Nome Description
index int
Restituisce
Tipo Description
AutoscalingMetricSpec

getAutoscalingMetricSpecsBuilder(int index)

public AutoscalingMetricSpec.Builder getAutoscalingMetricSpecsBuilder(int index)

Immutabile. Le specifiche della metrica che eseguono l'override di una metrica di utilizzo delle risorse (utilizzo CPU, ciclo di servizio dell'acceleratore e così via) sul valore di destinazione (il valore predefinito è 60 se non impostato). È consentita al massimo una voce per metrica.

Se machine_spec.accelerator_count è superiore a 0, la scalabilità automatica si baserà sulle metriche di utilizzo della CPU e del ciclo di lavoro dell'acceleratore e verrà scalata quando una delle due metriche supererà il valore target e fare lo scale down se entrambe le metriche sono al di sotto del valore target. Il valore target predefinito è 60 per entrambe le metriche.

Se machine_spec.accelerator_count è pari a 0, la scalabilità automatica si baserà sulla metrica di utilizzo della CPU solo con valore di destinazione predefinito 60 se non impostato in modo esplicito.

Ad esempio, nel caso della previsione online, se vuoi eseguire l'override dell'utilizzo della CPU target su 80, devi impostare autoscaling_metric_specs.metric_name su aiplatform.googleapis.com/prediction/online/cpu/utilization e autoscaling_metric_specs.target su 80.

repeated .google.cloud.vertexai.v1.AutoscalingMetricSpec autoscaling_metric_specs = 4 [(.google.api.field_behavior) = IMMUTABLE];

Parametro
Nome Description
index int
Restituisce
Tipo Description
AutoscalingMetricSpec.Builder

getAutoscalingMetricSpecsBuilderList()

public List<AutoscalingMetricSpec.Builder> getAutoscalingMetricSpecsBuilderList()

Immutabile. Le specifiche della metrica che eseguono l'override di una metrica di utilizzo delle risorse (utilizzo CPU, ciclo di servizio dell'acceleratore e così via) sul valore di destinazione (il valore predefinito è 60 se non impostato). È consentita al massimo una voce per metrica.

Se machine_spec.accelerator_count è superiore a 0, la scalabilità automatica si baserà sulle metriche di utilizzo della CPU e del ciclo di lavoro dell'acceleratore e verrà scalata quando una delle due metriche supererà il valore target e fare lo scale down se entrambe le metriche sono al di sotto del valore target. Il valore target predefinito è 60 per entrambe le metriche.

Se machine_spec.accelerator_count è pari a 0, la scalabilità automatica si baserà sulla metrica di utilizzo della CPU solo con valore di destinazione predefinito 60 se non impostato in modo esplicito.

Ad esempio, nel caso della previsione online, se vuoi eseguire l'override dell'utilizzo della CPU target su 80, devi impostare autoscaling_metric_specs.metric_name su aiplatform.googleapis.com/prediction/online/cpu/utilization e autoscaling_metric_specs.target su 80.

repeated .google.cloud.vertexai.v1.AutoscalingMetricSpec autoscaling_metric_specs = 4 [(.google.api.field_behavior) = IMMUTABLE];

Restituisce
Tipo Description
List<Builder>

getAutoscalingMetricSpecsCount()

public int getAutoscalingMetricSpecsCount()

Immutabile. Le specifiche della metrica che eseguono l'override di una metrica di utilizzo delle risorse (utilizzo CPU, ciclo di servizio dell'acceleratore e così via) sul valore di destinazione (il valore predefinito è 60 se non impostato). È consentita al massimo una voce per metrica.

Se machine_spec.accelerator_count è superiore a 0, la scalabilità automatica si baserà sulle metriche di utilizzo della CPU e del ciclo di lavoro dell'acceleratore e verrà scalata quando una delle due metriche supererà il valore target e fare lo scale down se entrambe le metriche sono al di sotto del valore target. Il valore target predefinito è 60 per entrambe le metriche.

Se machine_spec.accelerator_count è pari a 0, la scalabilità automatica si baserà sulla metrica di utilizzo della CPU solo con valore di destinazione predefinito 60 se non impostato in modo esplicito.

Ad esempio, nel caso della previsione online, se vuoi eseguire l'override dell'utilizzo della CPU target su 80, devi impostare autoscaling_metric_specs.metric_name su aiplatform.googleapis.com/prediction/online/cpu/utilization e autoscaling_metric_specs.target su 80.

repeated .google.cloud.vertexai.v1.AutoscalingMetricSpec autoscaling_metric_specs = 4 [(.google.api.field_behavior) = IMMUTABLE];

Restituisce
Tipo Description
int

getAutoscalingMetricSpecsList()

public List<AutoscalingMetricSpec> getAutoscalingMetricSpecsList()

Immutabile. Le specifiche della metrica che eseguono l'override di una metrica di utilizzo delle risorse (utilizzo CPU, ciclo di servizio dell'acceleratore e così via) sul valore di destinazione (il valore predefinito è 60 se non impostato). È consentita al massimo una voce per metrica.

Se machine_spec.accelerator_count è superiore a 0, la scalabilità automatica si baserà sulle metriche di utilizzo della CPU e del ciclo di lavoro dell'acceleratore e verrà scalata quando una delle due metriche supererà il valore target e fare lo scale down se entrambe le metriche sono al di sotto del valore target. Il valore target predefinito è 60 per entrambe le metriche.

Se machine_spec.accelerator_count è pari a 0, la scalabilità automatica si baserà sulla metrica di utilizzo della CPU solo con valore di destinazione predefinito 60 se non impostato in modo esplicito.

Ad esempio, nel caso della previsione online, se vuoi eseguire l'override dell'utilizzo della CPU target su 80, devi impostare autoscaling_metric_specs.metric_name su aiplatform.googleapis.com/prediction/online/cpu/utilization e autoscaling_metric_specs.target su 80.

repeated .google.cloud.vertexai.v1.AutoscalingMetricSpec autoscaling_metric_specs = 4 [(.google.api.field_behavior) = IMMUTABLE];

Restituisce
Tipo Description
List<AutoscalingMetricSpec>

getAutoscalingMetricSpecsOrBuilder(int index)

public AutoscalingMetricSpecOrBuilder getAutoscalingMetricSpecsOrBuilder(int index)

Immutabile. Le specifiche della metrica che eseguono l'override di una metrica di utilizzo delle risorse (utilizzo CPU, ciclo di servizio dell'acceleratore e così via) sul valore di destinazione (il valore predefinito è 60 se non impostato). È consentita al massimo una voce per metrica.

Se machine_spec.accelerator_count è superiore a 0, la scalabilità automatica si baserà sulle metriche di utilizzo della CPU e del ciclo di lavoro dell'acceleratore e verrà scalata quando una delle due metriche supererà il valore target e fare lo scale down se entrambe le metriche sono al di sotto del valore target. Il valore target predefinito è 60 per entrambe le metriche.

Se machine_spec.accelerator_count è pari a 0, la scalabilità automatica si baserà sulla metrica di utilizzo della CPU solo con valore di destinazione predefinito 60 se non impostato in modo esplicito.

Ad esempio, nel caso della previsione online, se vuoi eseguire l'override dell'utilizzo della CPU target su 80, devi impostare autoscaling_metric_specs.metric_name su aiplatform.googleapis.com/prediction/online/cpu/utilization e autoscaling_metric_specs.target su 80.

repeated .google.cloud.vertexai.v1.AutoscalingMetricSpec autoscaling_metric_specs = 4 [(.google.api.field_behavior) = IMMUTABLE];

Parametro
Nome Description
index int
Restituisce
Tipo Description
AutoscalingMetricSpecOrBuilder

getAutoscalingMetricSpecsOrBuilderList()

public List<? extends AutoscalingMetricSpecOrBuilder> getAutoscalingMetricSpecsOrBuilderList()

Immutabile. Le specifiche della metrica che eseguono l'override di una metrica di utilizzo delle risorse (utilizzo CPU, ciclo di servizio dell'acceleratore e così via) sul valore di destinazione (il valore predefinito è 60 se non impostato). È consentita al massimo una voce per metrica.

Se machine_spec.accelerator_count è superiore a 0, la scalabilità automatica si baserà sulle metriche di utilizzo della CPU e del ciclo di lavoro dell'acceleratore e verrà scalata quando una delle due metriche supererà il valore target e fare lo scale down se entrambe le metriche sono al di sotto del valore target. Il valore target predefinito è 60 per entrambe le metriche.

Se machine_spec.accelerator_count è pari a 0, la scalabilità automatica si baserà sulla metrica di utilizzo della CPU solo con valore di destinazione predefinito 60 se non impostato in modo esplicito.

Ad esempio, nel caso della previsione online, se vuoi eseguire l'override dell'utilizzo della CPU target su 80, devi impostare autoscaling_metric_specs.metric_name su aiplatform.googleapis.com/prediction/online/cpu/utilization e autoscaling_metric_specs.target su 80.

repeated .google.cloud.vertexai.v1.AutoscalingMetricSpec autoscaling_metric_specs = 4 [(.google.api.field_behavior) = IMMUTABLE];

Restituisce
Tipo Description
List<? extends com.google.cloud.vertexai.api.AutoscalingMetricSpecOrBuilder>

getDefaultInstanceForType()

public DedicatedResources getDefaultInstanceForType()
Restituisce
Tipo Description
DedicatedResources

getDescriptorForType()

public Descriptors.Descriptor getDescriptorForType()
Restituisce
Tipo Description
Descriptor
Sostituzioni

getMachineSpec()

public MachineSpec getMachineSpec()

Obbligatorio. Immutabile. La specifica di una singola macchina utilizzata dalla previsione.

.google.cloud.vertexai.v1.MachineSpec machine_spec = 1 [(.google.api.field_behavior) = REQUIRED, (.google.api.field_behavior) = IMMUTABLE];

Restituisce
Tipo Description
MachineSpec

Il parametro machineSpec.

getMachineSpecBuilder()

public MachineSpec.Builder getMachineSpecBuilder()

Obbligatorio. Immutabile. La specifica di una singola macchina utilizzata dalla previsione.

.google.cloud.vertexai.v1.MachineSpec machine_spec = 1 [(.google.api.field_behavior) = REQUIRED, (.google.api.field_behavior) = IMMUTABLE];

Restituisce
Tipo Description
MachineSpec.Builder

getMachineSpecOrBuilder()

public MachineSpecOrBuilder getMachineSpecOrBuilder()

Obbligatorio. Immutabile. La specifica di una singola macchina utilizzata dalla previsione.

.google.cloud.vertexai.v1.MachineSpec machine_spec = 1 [(.google.api.field_behavior) = REQUIRED, (.google.api.field_behavior) = IMMUTABLE];

Restituisce
Tipo Description
MachineSpecOrBuilder

getMaxReplicaCount()

public int getMaxReplicaCount()

Immutabile. Il numero massimo di repliche in cui può essere eseguito il deployment di questo modello implementato quando il traffico verso il modello aumenta. Se il valore richiesto è troppo elevato, il deployment commette un errore, ma se il deployment ha esito positivo viene garantita la capacità di scalare il modello fino a un numero di repliche elevato (salvo interruzioni del servizio). Se il traffico verso il modello DeployedModel aumenta oltre il limite massimo consentito dalle sue repliche, verrà eliminata una parte del traffico. Se questo valore non viene fornito, utilizzerà min_replica_count come valore predefinito.

Il valore di questo campo influisce sull'addebito relativo alle quote di CPU e GPU di Vertex. In particolare, ti verranno addebitati i costi relativi a (max_replica_count * numero di core nel tipo di macchina selezionato) e (max_replica_count * numero di GPU per replica nel tipo di macchina selezionato).

int32 max_replica_count = 3 [(.google.api.field_behavior) = IMMUTABLE];

Restituisce
Tipo Description
int

Il valore maxReplicaCount.

getMinReplicaCount()

public int getMinReplicaCount()

Obbligatorio. Immutabile. Il numero minimo di repliche della macchina in cui verrà sempre eseguito il deployment di questo modello. Questo valore deve essere maggiore o uguale a 1.

Se il traffico verso DeployedModel aumenta, può essere eseguito dinamicamente il deployment su più repliche e, con la diminuzione del traffico, alcune di queste repliche aggiuntive potrebbero essere liberate.

int32 min_replica_count = 2 [(.google.api.field_behavior) = REQUIRED, (.google.api.field_behavior) = IMMUTABLE];

Restituisce
Tipo Description
int

Il valore minReplicaCount.

hasMachineSpec()

public boolean hasMachineSpec()

Obbligatorio. Immutabile. La specifica di una singola macchina utilizzata dalla previsione.

.google.cloud.vertexai.v1.MachineSpec machine_spec = 1 [(.google.api.field_behavior) = REQUIRED, (.google.api.field_behavior) = IMMUTABLE];

Restituisce
Tipo Description
boolean

Indica se il campo machineSpec è impostato.

internalGetFieldAccessorTable()

protected GeneratedMessageV3.FieldAccessorTable internalGetFieldAccessorTable()
Restituisce
Tipo Description
FieldAccessorTable
Sostituzioni

isInitialized()

public final boolean isInitialized()
Restituisce
Tipo Description
boolean
Sostituzioni

mergeFrom(DedicatedResources other)

public DedicatedResources.Builder mergeFrom(DedicatedResources other)
Parametro
Nome Description
other DedicatedResources
Restituisce
Tipo Description
DedicatedResources.Builder

mergeFrom(CodedInputStream input, ExtensionRegistryLite extensionRegistry)

public DedicatedResources.Builder mergeFrom(CodedInputStream input, ExtensionRegistryLite extensionRegistry)
Parametri
Nome Description
input CodedInputStream
extensionRegistry ExtensionRegistryLite
Restituisce
Tipo Description
DedicatedResources.Builder
Sostituzioni
Eccezioni
Tipo Description
IOException

mergeFrom(Message other)

public DedicatedResources.Builder mergeFrom(Message other)
Parametro
Nome Description
other Message
Restituisce
Tipo Description
DedicatedResources.Builder
Sostituzioni

mergeMachineSpec(MachineSpec value)

public DedicatedResources.Builder mergeMachineSpec(MachineSpec value)

Obbligatorio. Immutabile. La specifica di una singola macchina utilizzata dalla previsione.

.google.cloud.vertexai.v1.MachineSpec machine_spec = 1 [(.google.api.field_behavior) = REQUIRED, (.google.api.field_behavior) = IMMUTABLE];

Parametro
Nome Description
value MachineSpec
Restituisce
Tipo Description
DedicatedResources.Builder

mergeUnknownFields(UnknownFieldSet unknownFields)

public final DedicatedResources.Builder mergeUnknownFields(UnknownFieldSet unknownFields)
Parametro
Nome Description
unknownFields UnknownFieldSet
Restituisce
Tipo Description
DedicatedResources.Builder
Sostituzioni

removeAutoscalingMetricSpecs(int index)

public DedicatedResources.Builder removeAutoscalingMetricSpecs(int index)

Immutabile. Le specifiche della metrica che eseguono l'override di una metrica di utilizzo delle risorse (utilizzo CPU, ciclo di servizio dell'acceleratore e così via) sul valore di destinazione (il valore predefinito è 60 se non impostato). È consentita al massimo una voce per metrica.

Se machine_spec.accelerator_count è superiore a 0, la scalabilità automatica si baserà sulle metriche di utilizzo della CPU e del ciclo di lavoro dell'acceleratore e verrà scalata quando una delle due metriche supererà il valore target e fare lo scale down se entrambe le metriche sono al di sotto del valore target. Il valore target predefinito è 60 per entrambe le metriche.

Se machine_spec.accelerator_count è pari a 0, la scalabilità automatica si baserà sulla metrica di utilizzo della CPU solo con valore di destinazione predefinito 60 se non impostato in modo esplicito.

Ad esempio, nel caso della previsione online, se vuoi eseguire l'override dell'utilizzo della CPU target su 80, devi impostare autoscaling_metric_specs.metric_name su aiplatform.googleapis.com/prediction/online/cpu/utilization e autoscaling_metric_specs.target su 80.

repeated .google.cloud.vertexai.v1.AutoscalingMetricSpec autoscaling_metric_specs = 4 [(.google.api.field_behavior) = IMMUTABLE];

Parametro
Nome Description
index int
Restituisce
Tipo Description
DedicatedResources.Builder

setAutoscalingMetricSpecs(int index, AutoscalingMetricSpec value)

public DedicatedResources.Builder setAutoscalingMetricSpecs(int index, AutoscalingMetricSpec value)

Immutabile. Le specifiche della metrica che eseguono l'override di una metrica di utilizzo delle risorse (utilizzo CPU, ciclo di servizio dell'acceleratore e così via) sul valore di destinazione (il valore predefinito è 60 se non impostato). È consentita al massimo una voce per metrica.

Se machine_spec.accelerator_count è superiore a 0, la scalabilità automatica si baserà sulle metriche di utilizzo della CPU e del ciclo di lavoro dell'acceleratore e verrà scalata quando una delle due metriche supererà il valore target e fare lo scale down se entrambe le metriche sono al di sotto del valore target. Il valore target predefinito è 60 per entrambe le metriche.

Se machine_spec.accelerator_count è pari a 0, la scalabilità automatica si baserà sulla metrica di utilizzo della CPU solo con valore di destinazione predefinito 60 se non impostato in modo esplicito.

Ad esempio, nel caso della previsione online, se vuoi eseguire l'override dell'utilizzo della CPU target su 80, devi impostare autoscaling_metric_specs.metric_name su aiplatform.googleapis.com/prediction/online/cpu/utilization e autoscaling_metric_specs.target su 80.

repeated .google.cloud.vertexai.v1.AutoscalingMetricSpec autoscaling_metric_specs = 4 [(.google.api.field_behavior) = IMMUTABLE];

Parametri
Nome Description
index int
value AutoscalingMetricSpec
Restituisce
Tipo Description
DedicatedResources.Builder

setAutoscalingMetricSpecs(int index, AutoscalingMetricSpec.Builder builderForValue)

public DedicatedResources.Builder setAutoscalingMetricSpecs(int index, AutoscalingMetricSpec.Builder builderForValue)

Immutabile. Le specifiche della metrica che eseguono l'override di una metrica di utilizzo delle risorse (utilizzo CPU, ciclo di servizio dell'acceleratore e così via) sul valore di destinazione (il valore predefinito è 60 se non impostato). È consentita al massimo una voce per metrica.

Se machine_spec.accelerator_count è superiore a 0, la scalabilità automatica si baserà sulle metriche di utilizzo della CPU e del ciclo di lavoro dell'acceleratore e verrà scalata quando una delle due metriche supererà il valore target e fare lo scale down se entrambe le metriche sono al di sotto del valore target. Il valore target predefinito è 60 per entrambe le metriche.

Se machine_spec.accelerator_count è pari a 0, la scalabilità automatica si baserà sulla metrica di utilizzo della CPU solo con valore di destinazione predefinito 60 se non impostato in modo esplicito.

Ad esempio, nel caso della previsione online, se vuoi eseguire l'override dell'utilizzo della CPU target su 80, devi impostare autoscaling_metric_specs.metric_name su aiplatform.googleapis.com/prediction/online/cpu/utilization e autoscaling_metric_specs.target su 80.

repeated .google.cloud.vertexai.v1.AutoscalingMetricSpec autoscaling_metric_specs = 4 [(.google.api.field_behavior) = IMMUTABLE];

Parametri
Nome Description
index int
builderForValue AutoscalingMetricSpec.Builder
Restituisce
Tipo Description
DedicatedResources.Builder

setField(Descriptors.FieldDescriptor field, Object value)

public DedicatedResources.Builder setField(Descriptors.FieldDescriptor field, Object value)
Parametri
Nome Description
field FieldDescriptor
value Object
Restituisce
Tipo Description
DedicatedResources.Builder
Sostituzioni

setMachineSpec(MachineSpec value)

public DedicatedResources.Builder setMachineSpec(MachineSpec value)

Obbligatorio. Immutabile. La specifica di una singola macchina utilizzata dalla previsione.

.google.cloud.vertexai.v1.MachineSpec machine_spec = 1 [(.google.api.field_behavior) = REQUIRED, (.google.api.field_behavior) = IMMUTABLE];

Parametro
Nome Description
value MachineSpec
Restituisce
Tipo Description
DedicatedResources.Builder

setMachineSpec(MachineSpec.Builder builderForValue)

public DedicatedResources.Builder setMachineSpec(MachineSpec.Builder builderForValue)

Obbligatorio. Immutabile. La specifica di una singola macchina utilizzata dalla previsione.

.google.cloud.vertexai.v1.MachineSpec machine_spec = 1 [(.google.api.field_behavior) = REQUIRED, (.google.api.field_behavior) = IMMUTABLE];

Parametro
Nome Description
builderForValue MachineSpec.Builder
Restituisce
Tipo Description
DedicatedResources.Builder

setMaxReplicaCount(int value)

public DedicatedResources.Builder setMaxReplicaCount(int value)

Immutabile. Il numero massimo di repliche in cui può essere eseguito il deployment di questo modello implementato quando il traffico verso il modello aumenta. Se il valore richiesto è troppo elevato, il deployment commette un errore, ma se il deployment ha esito positivo viene garantita la capacità di scalare il modello fino a un numero di repliche elevato (salvo interruzioni del servizio). Se il traffico verso il modello DeployedModel aumenta oltre il limite massimo consentito dalle sue repliche, verrà eliminata una parte del traffico. Se questo valore non viene fornito, utilizzerà min_replica_count come valore predefinito.

Il valore di questo campo influisce sull'addebito relativo alle quote di CPU e GPU di Vertex. In particolare, ti verranno addebitati i costi relativi a (max_replica_count * numero di core nel tipo di macchina selezionato) e (max_replica_count * numero di GPU per replica nel tipo di macchina selezionato).

int32 max_replica_count = 3 [(.google.api.field_behavior) = IMMUTABLE];

Parametro
Nome Description
value int

Il valore maxReplicaCount da impostare.

Restituisce
Tipo Description
DedicatedResources.Builder

Questo strumento per il concatenamento.

setMinReplicaCount(int value)

public DedicatedResources.Builder setMinReplicaCount(int value)

Obbligatorio. Immutabile. Il numero minimo di repliche della macchina in cui verrà sempre eseguito il deployment di questo modello. Questo valore deve essere maggiore o uguale a 1.

Se il traffico verso DeployedModel aumenta, può essere eseguito dinamicamente il deployment su più repliche e, con la diminuzione del traffico, alcune di queste repliche aggiuntive potrebbero essere liberate.

int32 min_replica_count = 2 [(.google.api.field_behavior) = REQUIRED, (.google.api.field_behavior) = IMMUTABLE];

Parametro
Nome Description
value int

Il valore minReplicaCount da impostare.

Restituisce
Tipo Description
DedicatedResources.Builder

Questo strumento per il concatenamento.

setRepeatedField(Descriptors.FieldDescriptor field, int index, Object value)

public DedicatedResources.Builder setRepeatedField(Descriptors.FieldDescriptor field, int index, Object value)
Parametri
Nome Description
field FieldDescriptor
index int
value Object
Restituisce
Tipo Description
DedicatedResources.Builder
Sostituzioni

setUnknownFields(UnknownFieldSet unknownFields)

public final DedicatedResources.Builder setUnknownFields(UnknownFieldSet unknownFields)
Parametro
Nome Description
unknownFields UnknownFieldSet
Restituisce
Tipo Description
DedicatedResources.Builder
Sostituzioni