Interfaccia AutomaticResourcesOrBuilder (0.6.0)

public interface AutomaticResourcesOrBuilder extends MessageOrBuilder

Implementa

MessageOrBuilder

Metodi

getMaxReplicaCount()

public abstract int getMaxReplicaCount()

Immutabile. Il numero massimo di repliche in cui può essere eseguito il deployment di questo modello implementato quando il traffico verso il modello aumenta. Se il valore richiesto è troppo elevato, il deployment commette un errore, ma se il deployment ha esito positivo viene garantita la capacità di scalare il modello fino a un numero di repliche elevato (salvo interruzioni del servizio). Se il traffico verso il modello DeployedModel aumenta oltre il limite massimo consentito dalle sue repliche, verrà eliminata una parte del traffico. Se questo valore non viene fornito, non si suppone un limite superiore per la scalabilità in caso di traffico intenso, anche se Vertex AI potrebbe non essere in grado di scalare oltre un determinato numero di replica.

int32 max_replica_count = 2 [(.google.api.field_behavior) = IMMUTABLE];

Restituisce
Tipo Description
int

Il valore maxReplicaCount.

getMinReplicaCount()

public abstract int getMinReplicaCount()

Immutabile. Il numero minimo di repliche in cui verrà sempre eseguito il deployment di questo modello. Se il traffico aumenta, è possibile che venga eseguito dinamicamente il deployment su più repliche, fino a max_replica_count. Man mano che il traffico diminuisce, alcune di queste repliche aggiuntive potrebbero essere liberate. Se il valore richiesto è troppo grande, il deployment restituirà un errore.

int32 min_replica_count = 1 [(.google.api.field_behavior) = IMMUTABLE];

Restituisce
Tipo Description
int

Il valore minReplicaCount.