Risorse DedicatedResources (0.4.0)

public final class DedicatedResources extends GeneratedMessageV3 implements DedicatedResourcesOrBuilder

Una descrizione delle risorse dedicate a un modello implementato e che richiedono un livello maggiore di configurazione manuale.

Tipo di protobuf google.cloud.vertexai.v1.DedicatedResources

Campi statici

AUTOSCALING_METRIC_SPECS_FIELD_NUMBER

public static final int AUTOSCALING_METRIC_SPECS_FIELD_NUMBER
Valore campo
Tipo Description
int

MACHINE_SPEC_FIELD_NUMBER

public static final int MACHINE_SPEC_FIELD_NUMBER
Valore campo
Tipo Description
int

MAX_REPLICA_COUNT_FIELD_NUMBER

public static final int MAX_REPLICA_COUNT_FIELD_NUMBER
Valore campo
Tipo Description
int

MIN_REPLICA_COUNT_FIELD_NUMBER

public static final int MIN_REPLICA_COUNT_FIELD_NUMBER
Valore campo
Tipo Description
int

Metodi statici

getDefaultInstance()

public static DedicatedResources getDefaultInstance()
Restituisce
Tipo Description
DedicatedResources

getDescriptor()

public static final Descriptors.Descriptor getDescriptor()
Restituisce
Tipo Description
Descriptor

newBuilder()

public static DedicatedResources.Builder newBuilder()
Restituisce
Tipo Description
DedicatedResources.Builder

newBuilder(DedicatedResources prototype)

public static DedicatedResources.Builder newBuilder(DedicatedResources prototype)
Parametro
Nome Description
prototype DedicatedResources
Restituisce
Tipo Description
DedicatedResources.Builder

parseDelimitedFrom(InputStream input)

public static DedicatedResources parseDelimitedFrom(InputStream input)
Parametro
Nome Description
input InputStream
Restituisce
Tipo Description
DedicatedResources
Eccezioni
Tipo Description
IOException

parseDelimitedFrom(InputStream input, ExtensionRegistryLite extensionRegistry)

public static DedicatedResources parseDelimitedFrom(InputStream input, ExtensionRegistryLite extensionRegistry)
Parametri
Nome Description
input InputStream
extensionRegistry ExtensionRegistryLite
Restituisce
Tipo Description
DedicatedResources
Eccezioni
Tipo Description
IOException

parseFrom(byte[] data)

public static DedicatedResources parseFrom(byte[] data)
Parametro
Nome Description
data byte[]
Restituisce
Tipo Description
DedicatedResources
Eccezioni
Tipo Description
InvalidProtocolBufferException

parseFrom(byte[] data, ExtensionRegistryLite extensionRegistry)

public static DedicatedResources parseFrom(byte[] data, ExtensionRegistryLite extensionRegistry)
Parametri
Nome Description
data byte[]
extensionRegistry ExtensionRegistryLite
Restituisce
Tipo Description
DedicatedResources
Eccezioni
Tipo Description
InvalidProtocolBufferException

parseFrom(ByteString data)

public static DedicatedResources parseFrom(ByteString data)
Parametro
Nome Description
data ByteString
Restituisce
Tipo Description
DedicatedResources
Eccezioni
Tipo Description
InvalidProtocolBufferException

parseFrom(ByteString data, ExtensionRegistryLite extensionRegistry)

public static DedicatedResources parseFrom(ByteString data, ExtensionRegistryLite extensionRegistry)
Parametri
Nome Description
data ByteString
extensionRegistry ExtensionRegistryLite
Restituisce
Tipo Description
DedicatedResources
Eccezioni
Tipo Description
InvalidProtocolBufferException

parseFrom(CodedInputStream input)

public static DedicatedResources parseFrom(CodedInputStream input)
Parametro
Nome Description
input CodedInputStream
Restituisce
Tipo Description
DedicatedResources
Eccezioni
Tipo Description
IOException

parseFrom(CodedInputStream input, ExtensionRegistryLite extensionRegistry)

public static DedicatedResources parseFrom(CodedInputStream input, ExtensionRegistryLite extensionRegistry)
Parametri
Nome Description
input CodedInputStream
extensionRegistry ExtensionRegistryLite
Restituisce
Tipo Description
DedicatedResources
Eccezioni
Tipo Description
IOException

parseFrom(InputStream input)

public static DedicatedResources parseFrom(InputStream input)
Parametro
Nome Description
input InputStream
Restituisce
Tipo Description
DedicatedResources
Eccezioni
Tipo Description
IOException

parseFrom(InputStream input, ExtensionRegistryLite extensionRegistry)

public static DedicatedResources parseFrom(InputStream input, ExtensionRegistryLite extensionRegistry)
Parametri
Nome Description
input InputStream
extensionRegistry ExtensionRegistryLite
Restituisce
Tipo Description
DedicatedResources
Eccezioni
Tipo Description
IOException

parseFrom(ByteBuffer data)

public static DedicatedResources parseFrom(ByteBuffer data)
Parametro
Nome Description
data ByteBuffer
Restituisce
Tipo Description
DedicatedResources
Eccezioni
Tipo Description
InvalidProtocolBufferException

parseFrom(ByteBuffer data, ExtensionRegistryLite extensionRegistry)

public static DedicatedResources parseFrom(ByteBuffer data, ExtensionRegistryLite extensionRegistry)
Parametri
Nome Description
data ByteBuffer
extensionRegistry ExtensionRegistryLite
Restituisce
Tipo Description
DedicatedResources
Eccezioni
Tipo Description
InvalidProtocolBufferException

parser()

public static Parser<DedicatedResources> parser()
Restituisce
Tipo Description
Parser<DedicatedResources>

Metodi

è uguale a(obj oggetto)

public boolean equals(Object obj)
Parametro
Nome Description
obj Object
Restituisce
Tipo Description
boolean
Sostituzioni

getAutoscalingMetricSpecs(int index)

public AutoscalingMetricSpec getAutoscalingMetricSpecs(int index)

Immutabile. Le specifiche della metrica che eseguono l'override di una metrica di utilizzo delle risorse (utilizzo CPU, ciclo di servizio dell'acceleratore e così via) sul valore di destinazione (il valore predefinito è 60 se non impostato). È consentita al massimo una voce per metrica.

Se machine_spec.accelerator_count è superiore a 0, la scalabilità automatica si baserà sulle metriche di utilizzo della CPU e del ciclo di lavoro dell'acceleratore e verrà scalata quando una delle due metriche supererà il valore target e fare lo scale down se entrambe le metriche sono al di sotto del valore target. Il valore target predefinito è 60 per entrambe le metriche.

Se machine_spec.accelerator_count è pari a 0, la scalabilità automatica si baserà sulla metrica di utilizzo della CPU solo con valore di destinazione predefinito 60 se non impostato in modo esplicito.

Ad esempio, nel caso della previsione online, se vuoi eseguire l'override dell'utilizzo della CPU target su 80, devi impostare autoscaling_metric_specs.metric_name su aiplatform.googleapis.com/prediction/online/cpu/utilization e autoscaling_metric_specs.target su 80.

repeated .google.cloud.vertexai.v1.AutoscalingMetricSpec autoscaling_metric_specs = 4 [(.google.api.field_behavior) = IMMUTABLE];

Parametro
Nome Description
index int
Restituisce
Tipo Description
AutoscalingMetricSpec

getAutoscalingMetricSpecsCount()

public int getAutoscalingMetricSpecsCount()

Immutabile. Le specifiche della metrica che eseguono l'override di una metrica di utilizzo delle risorse (utilizzo CPU, ciclo di servizio dell'acceleratore e così via) sul valore di destinazione (il valore predefinito è 60 se non impostato). È consentita al massimo una voce per metrica.

Se machine_spec.accelerator_count è superiore a 0, la scalabilità automatica si baserà sulle metriche di utilizzo della CPU e del ciclo di lavoro dell'acceleratore e verrà scalata quando una delle due metriche supererà il valore target e fare lo scale down se entrambe le metriche sono al di sotto del valore target. Il valore target predefinito è 60 per entrambe le metriche.

Se machine_spec.accelerator_count è pari a 0, la scalabilità automatica si baserà sulla metrica di utilizzo della CPU solo con valore di destinazione predefinito 60 se non impostato in modo esplicito.

Ad esempio, nel caso della previsione online, se vuoi eseguire l'override dell'utilizzo della CPU target su 80, devi impostare autoscaling_metric_specs.metric_name su aiplatform.googleapis.com/prediction/online/cpu/utilization e autoscaling_metric_specs.target su 80.

repeated .google.cloud.vertexai.v1.AutoscalingMetricSpec autoscaling_metric_specs = 4 [(.google.api.field_behavior) = IMMUTABLE];

Restituisce
Tipo Description
int

getAutoscalingMetricSpecsList()

public List<AutoscalingMetricSpec> getAutoscalingMetricSpecsList()

Immutabile. Le specifiche della metrica che eseguono l'override di una metrica di utilizzo delle risorse (utilizzo CPU, ciclo di servizio dell'acceleratore e così via) sul valore di destinazione (il valore predefinito è 60 se non impostato). È consentita al massimo una voce per metrica.

Se machine_spec.accelerator_count è superiore a 0, la scalabilità automatica si baserà sulle metriche di utilizzo della CPU e del ciclo di lavoro dell'acceleratore e verrà scalata quando una delle due metriche supererà il valore target e fare lo scale down se entrambe le metriche sono al di sotto del valore target. Il valore target predefinito è 60 per entrambe le metriche.

Se machine_spec.accelerator_count è pari a 0, la scalabilità automatica si baserà sulla metrica di utilizzo della CPU solo con valore di destinazione predefinito 60 se non impostato in modo esplicito.

Ad esempio, nel caso della previsione online, se vuoi eseguire l'override dell'utilizzo della CPU target su 80, devi impostare autoscaling_metric_specs.metric_name su aiplatform.googleapis.com/prediction/online/cpu/utilization e autoscaling_metric_specs.target su 80.

repeated .google.cloud.vertexai.v1.AutoscalingMetricSpec autoscaling_metric_specs = 4 [(.google.api.field_behavior) = IMMUTABLE];

Restituisce
Tipo Description
List<AutoscalingMetricSpec>

getAutoscalingMetricSpecsOrBuilder(int index)

public AutoscalingMetricSpecOrBuilder getAutoscalingMetricSpecsOrBuilder(int index)

Immutabile. Le specifiche della metrica che eseguono l'override di una metrica di utilizzo delle risorse (utilizzo CPU, ciclo di servizio dell'acceleratore e così via) sul valore di destinazione (il valore predefinito è 60 se non impostato). È consentita al massimo una voce per metrica.

Se machine_spec.accelerator_count è superiore a 0, la scalabilità automatica si baserà sulle metriche di utilizzo della CPU e del ciclo di lavoro dell'acceleratore e verrà scalata quando una delle due metriche supererà il valore target e fare lo scale down se entrambe le metriche sono al di sotto del valore target. Il valore target predefinito è 60 per entrambe le metriche.

Se machine_spec.accelerator_count è pari a 0, la scalabilità automatica si baserà sulla metrica di utilizzo della CPU solo con valore di destinazione predefinito 60 se non impostato in modo esplicito.

Ad esempio, nel caso della previsione online, se vuoi eseguire l'override dell'utilizzo della CPU target su 80, devi impostare autoscaling_metric_specs.metric_name su aiplatform.googleapis.com/prediction/online/cpu/utilization e autoscaling_metric_specs.target su 80.

repeated .google.cloud.vertexai.v1.AutoscalingMetricSpec autoscaling_metric_specs = 4 [(.google.api.field_behavior) = IMMUTABLE];

Parametro
Nome Description
index int
Restituisce
Tipo Description
AutoscalingMetricSpecOrBuilder

getAutoscalingMetricSpecsOrBuilderList()

public List<? extends AutoscalingMetricSpecOrBuilder> getAutoscalingMetricSpecsOrBuilderList()

Immutabile. Le specifiche della metrica che eseguono l'override di una metrica di utilizzo delle risorse (utilizzo CPU, ciclo di servizio dell'acceleratore e così via) sul valore di destinazione (il valore predefinito è 60 se non impostato). È consentita al massimo una voce per metrica.

Se machine_spec.accelerator_count è superiore a 0, la scalabilità automatica si baserà sulle metriche di utilizzo della CPU e del ciclo di lavoro dell'acceleratore e verrà scalata quando una delle due metriche supererà il valore target e fare lo scale down se entrambe le metriche sono al di sotto del valore target. Il valore target predefinito è 60 per entrambe le metriche.

Se machine_spec.accelerator_count è pari a 0, la scalabilità automatica si baserà sulla metrica di utilizzo della CPU solo con valore di destinazione predefinito 60 se non impostato in modo esplicito.

Ad esempio, nel caso della previsione online, se vuoi eseguire l'override dell'utilizzo della CPU target su 80, devi impostare autoscaling_metric_specs.metric_name su aiplatform.googleapis.com/prediction/online/cpu/utilization e autoscaling_metric_specs.target su 80.

repeated .google.cloud.vertexai.v1.AutoscalingMetricSpec autoscaling_metric_specs = 4 [(.google.api.field_behavior) = IMMUTABLE];

Restituisce
Tipo Description
List<? extends com.google.cloud.vertexai.api.AutoscalingMetricSpecOrBuilder>

getDefaultInstanceForType()

public DedicatedResources getDefaultInstanceForType()
Restituisce
Tipo Description
DedicatedResources

getMachineSpec()

public MachineSpec getMachineSpec()

Obbligatorio. Immutabile. La specifica di una singola macchina utilizzata dalla previsione.

.google.cloud.vertexai.v1.MachineSpec machine_spec = 1 [(.google.api.field_behavior) = REQUIRED, (.google.api.field_behavior) = IMMUTABLE];

Restituisce
Tipo Description
MachineSpec

Il parametro machineSpec.

getMachineSpecOrBuilder()

public MachineSpecOrBuilder getMachineSpecOrBuilder()

Obbligatorio. Immutabile. La specifica di una singola macchina utilizzata dalla previsione.

.google.cloud.vertexai.v1.MachineSpec machine_spec = 1 [(.google.api.field_behavior) = REQUIRED, (.google.api.field_behavior) = IMMUTABLE];

Restituisce
Tipo Description
MachineSpecOrBuilder

getMaxReplicaCount()

public int getMaxReplicaCount()

Immutabile. Il numero massimo di repliche in cui può essere eseguito il deployment di questo modello implementato quando il traffico verso il modello aumenta. Se il valore richiesto è troppo elevato, il deployment commette un errore, ma se il deployment ha esito positivo viene garantita la capacità di scalare il modello fino a un numero di repliche elevato (salvo interruzioni del servizio). Se il traffico verso il modello DeployedModel aumenta oltre il limite massimo consentito dalle sue repliche, verrà eliminata una parte del traffico. Se questo valore non viene fornito, utilizzerà min_replica_count come valore predefinito.

Il valore di questo campo influisce sull'addebito relativo alle quote di CPU e GPU di Vertex. In particolare, ti verranno addebitati i costi relativi a (max_replica_count * numero di core nel tipo di macchina selezionato) e (max_replica_count * numero di GPU per replica nel tipo di macchina selezionato).

int32 max_replica_count = 3 [(.google.api.field_behavior) = IMMUTABLE];

Restituisce
Tipo Description
int

Il valore maxReplicaCount.

getMinReplicaCount()

public int getMinReplicaCount()

Obbligatorio. Immutabile. Il numero minimo di repliche della macchina in cui verrà sempre eseguito il deployment di questo modello. Questo valore deve essere maggiore o uguale a 1.

Se il traffico verso DeployedModel aumenta, può essere eseguito dinamicamente il deployment su più repliche e, con la diminuzione del traffico, alcune di queste repliche aggiuntive potrebbero essere liberate.

int32 min_replica_count = 2 [(.google.api.field_behavior) = REQUIRED, (.google.api.field_behavior) = IMMUTABLE];

Restituisce
Tipo Description
int

Il valore minReplicaCount.

getParserForType()

public Parser<DedicatedResources> getParserForType()
Restituisce
Tipo Description
Parser<DedicatedResources>
Sostituzioni

getSerializedSize()

public int getSerializedSize()
Restituisce
Tipo Description
int
Sostituzioni

hasMachineSpec()

public boolean hasMachineSpec()

Obbligatorio. Immutabile. La specifica di una singola macchina utilizzata dalla previsione.

.google.cloud.vertexai.v1.MachineSpec machine_spec = 1 [(.google.api.field_behavior) = REQUIRED, (.google.api.field_behavior) = IMMUTABLE];

Restituisce
Tipo Description
boolean

Indica se il campo machineSpec è impostato.

hashCode()

public int hashCode()
Restituisce
Tipo Description
int
Sostituzioni

internalGetFieldAccessorTable()

protected GeneratedMessageV3.FieldAccessorTable internalGetFieldAccessorTable()
Restituisce
Tipo Description
FieldAccessorTable
Sostituzioni

isInitialized()

public final boolean isInitialized()
Restituisce
Tipo Description
boolean
Sostituzioni

newBuilderForType()

public DedicatedResources.Builder newBuilderForType()
Restituisce
Tipo Description
DedicatedResources.Builder

newBuilderForType(GeneratedMessageV3.BuilderParent parent)

protected DedicatedResources.Builder newBuilderForType(GeneratedMessageV3.BuilderParent parent)
Parametro
Nome Description
parent BuilderParent
Restituisce
Tipo Description
DedicatedResources.Builder
Sostituzioni

newInstance(GeneratedMessageV3.UnusedPrivateParameter unused)

protected Object newInstance(GeneratedMessageV3.UnusedPrivateParameter unused)
Parametro
Nome Description
unused UnusedPrivateParameter
Restituisce
Tipo Description
Object
Sostituzioni

toBuilder()

public DedicatedResources.Builder toBuilder()
Restituisce
Tipo Description
DedicatedResources.Builder

writeTo(output di CodedOutputStream)

public void writeTo(CodedOutputStream output)
Parametro
Nome Description
output CodedOutputStream
Sostituzioni
Eccezioni
Tipo Description
IOException