A partire dal 29 aprile 2025, i modelli Gemini 1.5 Pro e Gemini 1.5 Flash non sono disponibili nei progetti che non li hanno mai utilizzati, inclusi i nuovi progetti. Per maggiori dettagli, vedi Versioni e ciclo di vita dei modelli.
Immutabile. Il numero massimo di repliche in cui può essere eseguito il deployment di questo modello implementato
quando il traffico verso il modello aumenta. Se il valore richiesto è troppo elevato, il deployment commette un errore, ma se il deployment ha esito positivo viene garantita la capacità di scalare il modello fino a un numero di repliche elevato (salvo interruzioni del servizio). Se il traffico verso il modello DeployedModel aumenta oltre il limite massimo consentito dalle sue repliche, verrà eliminata una parte del traffico. Se questo valore non viene fornito, non si suppone un limite superiore per la scalabilità in caso di traffico intenso, anche se Vertex AI potrebbe non essere in grado di scalare oltre un determinato numero di replica.
Immutabile. Il numero minimo di repliche in cui verrà sempre eseguito il deployment di questo modello. Se il traffico aumenta, è possibile che venga eseguito dinamicamente il deployment su più repliche, fino a max_replica_count. Man mano che il traffico diminuisce, alcune di queste repliche aggiuntive potrebbero essere liberate. Se il valore richiesto è troppo grande, il deployment restituirà un errore.
[[["Facile da capire","easyToUnderstand","thumb-up"],["Il problema è stato risolto","solvedMyProblem","thumb-up"],["Altra","otherUp","thumb-up"]],[["Difficile da capire","hardToUnderstand","thumb-down"],["Informazioni o codice di esempio errati","incorrectInformationOrSampleCode","thumb-down"],["Mancano le informazioni o gli esempi di cui ho bisogno","missingTheInformationSamplesINeed","thumb-down"],["Problema di traduzione","translationIssue","thumb-down"],["Altra","otherDown","thumb-down"]],["Ultimo aggiornamento 2024-05-17 UTC."],[],[],null,["# Interface AutomaticResourcesOrBuilder (1.0.0)\n\n public interface AutomaticResourcesOrBuilder extends MessageOrBuilder\n\nImplements\n----------\n\n[MessageOrBuilder](https://cloud.google.com/java/docs/reference/protobuf/latest/com.google.protobuf.MessageOrBuilder.html)\n\nMethods\n-------\n\n### getMaxReplicaCount()\n\n public abstract int getMaxReplicaCount()\n\nImmutable. The maximum number of replicas this DeployedModel may be\ndeployed on when the traffic against it increases. If the requested value\nis too large, the deployment will error, but if deployment succeeds then\nthe ability to scale the model to that many replicas is guaranteed (barring\nservice outages). If traffic against the DeployedModel increases beyond\nwhat its replicas at maximum may handle, a portion of the traffic will be\ndropped. If this value is not provided, a no upper bound for scaling under\nheavy traffic will be assume, though Vertex AI may be unable to scale\nbeyond certain replica number.\n\n`int32 max_replica_count = 2 [(.google.api.field_behavior) = IMMUTABLE];`\n\n### getMinReplicaCount()\n\n public abstract int getMinReplicaCount()\n\nImmutable. The minimum number of replicas this DeployedModel will be always\ndeployed on. If traffic against it increases, it may dynamically be\ndeployed onto more replicas up to\nmax_replica_count,\nand as traffic decreases, some of these extra replicas may be freed. If the\nrequested value is too large, the deployment will error.\n\n`int32 min_replica_count = 1 [(.google.api.field_behavior) = IMMUTABLE];`"]]