Prova i modelli Gemini 1.5, gli ultimi modelli multimodali di Vertex AI, e scopri cosa puoi creare con una finestra contestuale fino a 2 milioni di token.Prova i modelli Gemini 1.5, i più recenti modelli multimodali di Vertex AI, e scopri cosa puoi creare con una finestra contestuale fino a 2 milioni di token.
L'istanza predefinita ha tutti i valori predefiniti appropriati:
Vengono utilizzati l'indirizzo di servizio predefinito (aiplatform.googleapis.com) e la porta predefinita (443).
Le credenziali vengono acquisite automaticamente tramite Credenziali predefinite dell'applicazione.
I nuovi tentativi sono configurati per metodi idempotenti, ma non per metodi non idempotenti.
Il creatore di questa classe è ricorsivo, quindi le classi limitate sono a loro volta quelle costruttrici. Quando viene chiamato build(), viene chiamato l'albero dei builder per creare l'oggetto impostazioni completo.
Ad esempio, per impostare il timeout totale di countTokens su 30 secondi:
// This snippet has been automatically generated and should be regarded as a code template only.
// It will require modifications to work:
// - It may require correct/in-range values for request initialization.
// - It may require specifying regional endpoints when creating the service client as shown in
// https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
LlmUtilityServiceStubSettings.Builder llmUtilityServiceSettingsBuilder =
LlmUtilityServiceStubSettings.newBuilder();
llmUtilityServiceSettingsBuilder
.countTokensSettings()
.setRetrySettings(
llmUtilityServiceSettingsBuilder
.countTokensSettings()
.getRetrySettings()
.toBuilder()
.setTotalTimeout(Duration.ofSeconds(30))
.build());
LlmUtilityServiceStubSettings llmUtilityServiceSettings =
llmUtilityServiceSettingsBuilder.build();