public final class AutomaticResources extends GeneratedMessageV3 implements AutomaticResourcesOrBuilder
Una descrizione delle risorse decise in larga misura da Vertex AI e che richiedono solo una modesta configurazione aggiuntiva.
Ogni modello a supporto di queste risorse documenta le sue linee guida specifiche.
Tipo di protobuf google.cloud.vertexai.v1beta1.AutomaticResources
Membri ereditati
com.google.protobuf.GeneratedMessageV3.<ListT>makeMutableCopy(ListT)
com.google.protobuf.GeneratedMessageV3.<ListT>makeMutableCopy(ListT,int)
com.google.protobuf.GeneratedMessageV3.<T>emptyList(java.lang.Class<T>)
com.google.protobuf.GeneratedMessageV3.internalGetMapFieldReflection(int)
Campi statici
MAX_REPLICA_COUNT_FIELD_NUMBER
public static final int MAX_REPLICA_COUNT_FIELD_NUMBER
Valore campo |
Tipo |
Description |
int |
|
MIN_REPLICA_COUNT_FIELD_NUMBER
public static final int MIN_REPLICA_COUNT_FIELD_NUMBER
Valore campo |
Tipo |
Description |
int |
|
Metodi statici
getDefaultInstance()
public static AutomaticResources getDefaultInstance()
getDescriptor()
public static final Descriptors.Descriptor getDescriptor()
newBuilder()
public static AutomaticResources.Builder newBuilder()
newBuilder(AutomaticResources prototype)
public static AutomaticResources.Builder newBuilder(AutomaticResources prototype)
public static AutomaticResources parseDelimitedFrom(InputStream input)
public static AutomaticResources parseDelimitedFrom(InputStream input, ExtensionRegistryLite extensionRegistry)
parseFrom(byte[] data)
public static AutomaticResources parseFrom(byte[] data)
Parametro |
Nome |
Description |
data |
byte[]
|
parseFrom(byte[] data, ExtensionRegistryLite extensionRegistry)
public static AutomaticResources parseFrom(byte[] data, ExtensionRegistryLite extensionRegistry)
parseFrom(ByteString data)
public static AutomaticResources parseFrom(ByteString data)
parseFrom(ByteString data, ExtensionRegistryLite extensionRegistry)
public static AutomaticResources parseFrom(ByteString data, ExtensionRegistryLite extensionRegistry)
public static AutomaticResources parseFrom(CodedInputStream input)
public static AutomaticResources parseFrom(CodedInputStream input, ExtensionRegistryLite extensionRegistry)
public static AutomaticResources parseFrom(InputStream input)
public static AutomaticResources parseFrom(InputStream input, ExtensionRegistryLite extensionRegistry)
parseFrom(ByteBuffer data)
public static AutomaticResources parseFrom(ByteBuffer data)
parseFrom(ByteBuffer data, ExtensionRegistryLite extensionRegistry)
public static AutomaticResources parseFrom(ByteBuffer data, ExtensionRegistryLite extensionRegistry)
parser()
public static Parser<AutomaticResources> parser()
Metodi
è uguale a(obj oggetto)
public boolean equals(Object obj)
Parametro |
Nome |
Description |
obj |
Object
|
Restituisce |
Tipo |
Description |
boolean |
|
Sostituzioni
getDefaultInstanceForType()
public AutomaticResources getDefaultInstanceForType()
getMaxReplicaCount()
public int getMaxReplicaCount()
Immutabile. Il numero massimo di repliche in cui può essere eseguito il deployment di questo modello implementato
quando il traffico verso il modello aumenta. Se il valore richiesto è troppo elevato, il deployment commette un errore, ma se il deployment ha esito positivo viene garantita la capacità di scalare il modello fino a un numero di repliche elevato (salvo interruzioni del servizio). Se il traffico verso il modello DeployedModel aumenta oltre il limite massimo consentito dalle sue repliche, verrà eliminata una parte del traffico. Se questo valore non viene fornito, non si suppone un limite superiore per la scalabilità in caso di traffico intenso, anche se Vertex AI potrebbe non essere in grado di scalare oltre un determinato numero di replica.
int32 max_replica_count = 2 [(.google.api.field_behavior) = IMMUTABLE];
Restituisce |
Tipo |
Description |
int |
Il valore maxReplicaCount.
|
getMinReplicaCount()
public int getMinReplicaCount()
Immutabile. Il numero minimo di repliche in cui verrà sempre eseguito il deployment di questo modello. Se il traffico aumenta, è possibile che venga eseguito dinamicamente il deployment su più repliche, fino a max_replica_count. Man mano che il traffico diminuisce, alcune di queste repliche aggiuntive potrebbero essere liberate. Se il valore richiesto è troppo grande, il deployment restituirà un errore.
int32 min_replica_count = 1 [(.google.api.field_behavior) = IMMUTABLE];
Restituisce |
Tipo |
Description |
int |
Il valore minReplicaCount.
|
getParserForType()
public Parser<AutomaticResources> getParserForType()
Sostituzioni
getSerializedSize()
public int getSerializedSize()
Restituisce |
Tipo |
Description |
int |
|
Sostituzioni
hashCode()
Restituisce |
Tipo |
Description |
int |
|
Sostituzioni
internalGetFieldAccessorTable()
protected GeneratedMessageV3.FieldAccessorTable internalGetFieldAccessorTable()
Sostituzioni
isInitialized()
public final boolean isInitialized()
Restituisce |
Tipo |
Description |
boolean |
|
Sostituzioni
newBuilderForType()
public AutomaticResources.Builder newBuilderForType()
newBuilderForType(GeneratedMessageV3.BuilderParent parent)
protected AutomaticResources.Builder newBuilderForType(GeneratedMessageV3.BuilderParent parent)
Sostituzioni
newInstance(GeneratedMessageV3.UnusedPrivateParameter unused)
protected Object newInstance(GeneratedMessageV3.UnusedPrivateParameter unused)
Restituisce |
Tipo |
Description |
Object |
|
Sostituzioni
toBuilder()
public AutomaticResources.Builder toBuilder()
writeTo(output di CodedOutputStream)
public void writeTo(CodedOutputStream output)
Sostituzioni