public final class DedicatedResources extends GeneratedMessageV3 implements DedicatedResourcesOrBuilder
Una descrizione delle risorse dedicate a un modello implementato e che richiedono un livello maggiore di configurazione manuale.
Tipo di protobuf google.cloud.vertexai.v1.DedicatedResources
Membri ereditati
com.google.protobuf.GeneratedMessageV3.<ListT>makeMutableCopy(ListT)
com.google.protobuf.GeneratedMessageV3.<ListT>makeMutableCopy(ListT,int)
com.google.protobuf.GeneratedMessageV3.<T>emptyList(java.lang.Class<T>)
com.google.protobuf.GeneratedMessageV3.internalGetMapFieldReflection(int)
Campi statici
AUTOSCALING_METRIC_SPECS_FIELD_NUMBER
public static final int AUTOSCALING_METRIC_SPECS_FIELD_NUMBER
Valore campo |
Tipo |
Description |
int |
|
MACHINE_SPEC_FIELD_NUMBER
public static final int MACHINE_SPEC_FIELD_NUMBER
Valore campo |
Tipo |
Description |
int |
|
MAX_REPLICA_COUNT_FIELD_NUMBER
public static final int MAX_REPLICA_COUNT_FIELD_NUMBER
Valore campo |
Tipo |
Description |
int |
|
MIN_REPLICA_COUNT_FIELD_NUMBER
public static final int MIN_REPLICA_COUNT_FIELD_NUMBER
Valore campo |
Tipo |
Description |
int |
|
Metodi statici
getDefaultInstance()
public static DedicatedResources getDefaultInstance()
getDescriptor()
public static final Descriptors.Descriptor getDescriptor()
newBuilder()
public static DedicatedResources.Builder newBuilder()
newBuilder(DedicatedResources prototype)
public static DedicatedResources.Builder newBuilder(DedicatedResources prototype)
public static DedicatedResources parseDelimitedFrom(InputStream input)
public static DedicatedResources parseDelimitedFrom(InputStream input, ExtensionRegistryLite extensionRegistry)
parseFrom(byte[] data)
public static DedicatedResources parseFrom(byte[] data)
Parametro |
Nome |
Description |
data |
byte[]
|
parseFrom(byte[] data, ExtensionRegistryLite extensionRegistry)
public static DedicatedResources parseFrom(byte[] data, ExtensionRegistryLite extensionRegistry)
parseFrom(ByteString data)
public static DedicatedResources parseFrom(ByteString data)
parseFrom(ByteString data, ExtensionRegistryLite extensionRegistry)
public static DedicatedResources parseFrom(ByteString data, ExtensionRegistryLite extensionRegistry)
public static DedicatedResources parseFrom(CodedInputStream input)
public static DedicatedResources parseFrom(CodedInputStream input, ExtensionRegistryLite extensionRegistry)
public static DedicatedResources parseFrom(InputStream input)
public static DedicatedResources parseFrom(InputStream input, ExtensionRegistryLite extensionRegistry)
parseFrom(ByteBuffer data)
public static DedicatedResources parseFrom(ByteBuffer data)
parseFrom(ByteBuffer data, ExtensionRegistryLite extensionRegistry)
public static DedicatedResources parseFrom(ByteBuffer data, ExtensionRegistryLite extensionRegistry)
parser()
public static Parser<DedicatedResources> parser()
Metodi
è uguale a(obj oggetto)
public boolean equals(Object obj)
Parametro |
Nome |
Description |
obj |
Object
|
Restituisce |
Tipo |
Description |
boolean |
|
Sostituzioni
getAutoscalingMetricSpecs(int index)
public AutoscalingMetricSpec getAutoscalingMetricSpecs(int index)
Immutabile. Le specifiche della metrica che eseguono l'override di una metrica di utilizzo delle risorse (utilizzo CPU, ciclo di servizio dell'acceleratore e così via) sul valore di destinazione (il valore predefinito è 60 se non impostato). È consentita al massimo una voce per metrica.
Se machine_spec.accelerator_count è superiore a 0, la scalabilità automatica si baserà sulle metriche di utilizzo della CPU e del ciclo di lavoro dell'acceleratore e verrà scalata quando una delle due metriche supererà il valore target e fare lo scale down se entrambe le metriche sono al di sotto del valore target. Il valore target predefinito è 60 per entrambe le metriche.
Se machine_spec.accelerator_count è pari a 0, la scalabilità automatica si baserà sulla metrica di utilizzo della CPU solo con valore di destinazione predefinito 60 se non impostato in modo esplicito.
Ad esempio, nel caso della previsione online, se vuoi eseguire l'override dell'utilizzo della CPU target su 80, devi impostare autoscaling_metric_specs.metric_name su aiplatform.googleapis.com/prediction/online/cpu/utilization
e autoscaling_metric_specs.target su 80
.
repeated .google.cloud.vertexai.v1.AutoscalingMetricSpec autoscaling_metric_specs = 4 [(.google.api.field_behavior) = IMMUTABLE];
Parametro |
Nome |
Description |
index |
int
|
getAutoscalingMetricSpecsCount()
public int getAutoscalingMetricSpecsCount()
Immutabile. Le specifiche della metrica che eseguono l'override di una metrica di utilizzo delle risorse (utilizzo CPU, ciclo di servizio dell'acceleratore e così via) sul valore di destinazione (il valore predefinito è 60 se non impostato). È consentita al massimo una voce per metrica.
Se machine_spec.accelerator_count è superiore a 0, la scalabilità automatica si baserà sulle metriche di utilizzo della CPU e del ciclo di lavoro dell'acceleratore e verrà scalata quando una delle due metriche supererà il valore target e fare lo scale down se entrambe le metriche sono al di sotto del valore target. Il valore target predefinito è 60 per entrambe le metriche.
Se machine_spec.accelerator_count è pari a 0, la scalabilità automatica si baserà sulla metrica di utilizzo della CPU solo con valore di destinazione predefinito 60 se non impostato in modo esplicito.
Ad esempio, nel caso della previsione online, se vuoi eseguire l'override dell'utilizzo della CPU target su 80, devi impostare autoscaling_metric_specs.metric_name su aiplatform.googleapis.com/prediction/online/cpu/utilization
e autoscaling_metric_specs.target su 80
.
repeated .google.cloud.vertexai.v1.AutoscalingMetricSpec autoscaling_metric_specs = 4 [(.google.api.field_behavior) = IMMUTABLE];
Restituisce |
Tipo |
Description |
int |
|
getAutoscalingMetricSpecsList()
public List<AutoscalingMetricSpec> getAutoscalingMetricSpecsList()
Immutabile. Le specifiche della metrica che eseguono l'override di una metrica di utilizzo delle risorse (utilizzo CPU, ciclo di servizio dell'acceleratore e così via) sul valore di destinazione (il valore predefinito è 60 se non impostato). È consentita al massimo una voce per metrica.
Se machine_spec.accelerator_count è superiore a 0, la scalabilità automatica si baserà sulle metriche di utilizzo della CPU e del ciclo di lavoro dell'acceleratore e verrà scalata quando una delle due metriche supererà il valore target e fare lo scale down se entrambe le metriche sono al di sotto del valore target. Il valore target predefinito è 60 per entrambe le metriche.
Se machine_spec.accelerator_count è pari a 0, la scalabilità automatica si baserà sulla metrica di utilizzo della CPU solo con valore di destinazione predefinito 60 se non impostato in modo esplicito.
Ad esempio, nel caso della previsione online, se vuoi eseguire l'override dell'utilizzo della CPU target su 80, devi impostare autoscaling_metric_specs.metric_name su aiplatform.googleapis.com/prediction/online/cpu/utilization
e autoscaling_metric_specs.target su 80
.
repeated .google.cloud.vertexai.v1.AutoscalingMetricSpec autoscaling_metric_specs = 4 [(.google.api.field_behavior) = IMMUTABLE];
getAutoscalingMetricSpecsOrBuilder(int index)
public AutoscalingMetricSpecOrBuilder getAutoscalingMetricSpecsOrBuilder(int index)
Immutabile. Le specifiche della metrica che eseguono l'override di una metrica di utilizzo delle risorse (utilizzo CPU, ciclo di servizio dell'acceleratore e così via) sul valore di destinazione (il valore predefinito è 60 se non impostato). È consentita al massimo una voce per metrica.
Se machine_spec.accelerator_count è superiore a 0, la scalabilità automatica si baserà sulle metriche di utilizzo della CPU e del ciclo di lavoro dell'acceleratore e verrà scalata quando una delle due metriche supererà il valore target e fare lo scale down se entrambe le metriche sono al di sotto del valore target. Il valore target predefinito è 60 per entrambe le metriche.
Se machine_spec.accelerator_count è pari a 0, la scalabilità automatica si baserà sulla metrica di utilizzo della CPU solo con valore di destinazione predefinito 60 se non impostato in modo esplicito.
Ad esempio, nel caso della previsione online, se vuoi eseguire l'override dell'utilizzo della CPU target su 80, devi impostare autoscaling_metric_specs.metric_name su aiplatform.googleapis.com/prediction/online/cpu/utilization
e autoscaling_metric_specs.target su 80
.
repeated .google.cloud.vertexai.v1.AutoscalingMetricSpec autoscaling_metric_specs = 4 [(.google.api.field_behavior) = IMMUTABLE];
Parametro |
Nome |
Description |
index |
int
|
getAutoscalingMetricSpecsOrBuilderList()
public List<? extends AutoscalingMetricSpecOrBuilder> getAutoscalingMetricSpecsOrBuilderList()
Immutabile. Le specifiche della metrica che eseguono l'override di una metrica di utilizzo delle risorse (utilizzo CPU, ciclo di servizio dell'acceleratore e così via) sul valore di destinazione (il valore predefinito è 60 se non impostato). È consentita al massimo una voce per metrica.
Se machine_spec.accelerator_count è superiore a 0, la scalabilità automatica si baserà sulle metriche di utilizzo della CPU e del ciclo di lavoro dell'acceleratore e verrà scalata quando una delle due metriche supererà il valore target e fare lo scale down se entrambe le metriche sono al di sotto del valore target. Il valore target predefinito è 60 per entrambe le metriche.
Se machine_spec.accelerator_count è pari a 0, la scalabilità automatica si baserà sulla metrica di utilizzo della CPU solo con valore di destinazione predefinito 60 se non impostato in modo esplicito.
Ad esempio, nel caso della previsione online, se vuoi eseguire l'override dell'utilizzo della CPU target su 80, devi impostare autoscaling_metric_specs.metric_name su aiplatform.googleapis.com/prediction/online/cpu/utilization
e autoscaling_metric_specs.target su 80
.
repeated .google.cloud.vertexai.v1.AutoscalingMetricSpec autoscaling_metric_specs = 4 [(.google.api.field_behavior) = IMMUTABLE];
Restituisce |
Tipo |
Description |
List<? extends com.google.cloud.vertexai.api.AutoscalingMetricSpecOrBuilder> |
|
getDefaultInstanceForType()
public DedicatedResources getDefaultInstanceForType()
getMachineSpec()
public MachineSpec getMachineSpec()
Obbligatorio. Immutabile. La specifica di una singola macchina utilizzata dalla previsione.
.google.cloud.vertexai.v1.MachineSpec machine_spec = 1 [(.google.api.field_behavior) = REQUIRED, (.google.api.field_behavior) = IMMUTABLE];
Restituisce |
Tipo |
Description |
MachineSpec |
Il parametro machineSpec.
|
getMachineSpecOrBuilder()
public MachineSpecOrBuilder getMachineSpecOrBuilder()
Obbligatorio. Immutabile. La specifica di una singola macchina utilizzata dalla previsione.
.google.cloud.vertexai.v1.MachineSpec machine_spec = 1 [(.google.api.field_behavior) = REQUIRED, (.google.api.field_behavior) = IMMUTABLE];
getMaxReplicaCount()
public int getMaxReplicaCount()
Immutabile. Il numero massimo di repliche in cui può essere eseguito il deployment di questo modello implementato
quando il traffico verso il modello aumenta. Se il valore richiesto è troppo elevato, il deployment commette un errore, ma se il deployment ha esito positivo viene garantita la capacità di scalare il modello fino a un numero di repliche elevato (salvo interruzioni del servizio). Se il traffico verso il modello DeployedModel aumenta oltre il limite massimo consentito dalle sue repliche, verrà eliminata una parte del traffico. Se questo valore non viene fornito, utilizzerà min_replica_count come valore predefinito.
Il valore di questo campo influisce sull'addebito relativo alle quote di CPU e GPU di Vertex. In particolare, ti verranno addebitati i costi relativi a (max_replica_count *
numero di core nel tipo di macchina selezionato) e (max_replica_count *
numero di GPU per replica nel tipo di macchina selezionato).
int32 max_replica_count = 3 [(.google.api.field_behavior) = IMMUTABLE];
Restituisce |
Tipo |
Description |
int |
Il valore maxReplicaCount.
|
getMinReplicaCount()
public int getMinReplicaCount()
Obbligatorio. Immutabile. Il numero minimo di repliche della macchina in cui verrà sempre eseguito il deployment di questo modello. Questo valore deve essere maggiore o uguale a 1.
Se il traffico verso DeployedModel aumenta, può essere eseguito dinamicamente il deployment su più repliche e, con la diminuzione del traffico, alcune di queste repliche aggiuntive potrebbero essere liberate.
int32 min_replica_count = 2 [(.google.api.field_behavior) = REQUIRED, (.google.api.field_behavior) = IMMUTABLE];
Restituisce |
Tipo |
Description |
int |
Il valore minReplicaCount.
|
getParserForType()
public Parser<DedicatedResources> getParserForType()
Sostituzioni
getSerializedSize()
public int getSerializedSize()
Restituisce |
Tipo |
Description |
int |
|
Sostituzioni
hasMachineSpec()
public boolean hasMachineSpec()
Obbligatorio. Immutabile. La specifica di una singola macchina utilizzata dalla previsione.
.google.cloud.vertexai.v1.MachineSpec machine_spec = 1 [(.google.api.field_behavior) = REQUIRED, (.google.api.field_behavior) = IMMUTABLE];
Restituisce |
Tipo |
Description |
boolean |
Indica se il campo machineSpec è impostato.
|
hashCode()
Restituisce |
Tipo |
Description |
int |
|
Sostituzioni
internalGetFieldAccessorTable()
protected GeneratedMessageV3.FieldAccessorTable internalGetFieldAccessorTable()
Sostituzioni
isInitialized()
public final boolean isInitialized()
Restituisce |
Tipo |
Description |
boolean |
|
Sostituzioni
newBuilderForType()
public DedicatedResources.Builder newBuilderForType()
newBuilderForType(GeneratedMessageV3.BuilderParent parent)
protected DedicatedResources.Builder newBuilderForType(GeneratedMessageV3.BuilderParent parent)
Sostituzioni
newInstance(GeneratedMessageV3.UnusedPrivateParameter unused)
protected Object newInstance(GeneratedMessageV3.UnusedPrivateParameter unused)
Restituisce |
Tipo |
Description |
Object |
|
Sostituzioni
toBuilder()
public DedicatedResources.Builder toBuilder()
writeTo(output di CodedOutputStream)
public void writeTo(CodedOutputStream output)
Sostituzioni