Classe PredictionServiceClient (1.3.0)

public class PredictionServiceClient implements BackgroundResource

Descrizione del servizio: un servizio per previsioni e spiegazioni online.

Questa classe offre la possibilità di effettuare chiamate remote al servizio di supporto tramite chiamate di metodi mappate ai metodi API. Codice campione per iniziare:


 // This snippet has been automatically generated and should be regarded as a code template only.
 // It will require modifications to work:
 // - It may require correct/in-range values for request initialization.
 // - It may require specifying regional endpoints when creating the service client as shown in
 // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
 try (PredictionServiceClient predictionServiceClient = PredictionServiceClient.create()) {
   EndpointName endpoint =
       EndpointName.ofProjectLocationEndpointName("[PROJECT]", "[LOCATION]", "[ENDPOINT]");
   List<Value> instances = new ArrayList<>();
   Value parameters = Value.newBuilder().setBoolValue(true).build();
   PredictResponse response = predictionServiceClient.predict(endpoint, instances, parameters);
 }
 

Nota: chiudi() deve essere chiamato sull'oggetto PredictionServiceClient per pulire risorse come i thread. Nell'esempio precedente, viene utilizzato provi-with-resources, che chiama automaticamente chiudi().

Metodi
Metodo Descrizione Varianti di metodo

Previsione

Eseguire una previsione online.

Le varianti del metodo dell'oggetto Richiedi ricevono un solo parametro, ovvero un oggetto della richiesta, che deve essere creato prima della chiamata.

  • predicted(richiesta PredictRequest)

Le varianti di metodo "appiattite" hanno convertito i campi dell'oggetto della richiesta in parametri di funzione per consentire più modi di chiamare lo stesso metodo.

  • previsioni(endpoint NomeEndpoint, istanze List<Value>, parametri Value)

  • predicted(Endpoint stringa, istanze List<Value>, parametri value)

Le varianti di metodo richiamabili non accettano parametri e restituiscono un oggetto richiamabile API immutabile, che può essere utilizzato per avviare chiamate al servizio.

  • predictCallable()

RawPredict

Eseguire una previsione online con un payload HTTP arbitrario.

La risposta include le seguenti intestazioni HTTP:

  • X-Vertex-AI-Endpoint-Id: ID dell'endpoint che ha pubblicato questa previsione.
  • X-Vertex-AI-Deployed-Model-Id: ID del modello DeployedModel dell'endpoint che ha fornito questa previsione.

Le varianti del metodo dell'oggetto Richiedi ricevono un solo parametro, ovvero un oggetto della richiesta, che deve essere creato prima della chiamata.

  • rawPredict(RawPredictRequest request)

Le varianti di metodo "appiattite" hanno convertito i campi dell'oggetto della richiesta in parametri di funzione per consentire più modi di chiamare lo stesso metodo.

  • rawPredict(EndpointName endpoint, HttpBody httpBody)

  • rawPredict(String endpoint, HttpBody httpBody)

Le varianti di metodo richiamabili non accettano parametri e restituiscono un oggetto richiamabile API immutabile, che può essere utilizzato per avviare chiamate al servizio.

  • rawPredictCallable()

StreamRawPredict

Eseguire una previsione online in modalità flusso con un payload HTTP arbitrario.

Le varianti di metodo richiamabili non accettano parametri e restituiscono un oggetto richiamabile API immutabile, che può essere utilizzato per avviare chiamate al servizio.

  • streamRawPredictCallable()

DirectPredict

Eseguire una richiesta di previsione online unaria a un server del modello gRPC per i prodotti e i framework proprietari di Vertex.

Le varianti del metodo dell'oggetto Richiedi ricevono un solo parametro, ovvero un oggetto della richiesta, che deve essere creato prima della chiamata.

  • directPredict(DirectPredictRequest request)

Le varianti di metodo richiamabili non accettano parametri e restituiscono un oggetto richiamabile API immutabile, che può essere utilizzato per avviare chiamate al servizio.

  • directPredictCallable()

DirectRawPredict

Eseguire una richiesta di previsione online unaria a un server del modello gRPC per i container personalizzati.

Le varianti del metodo dell'oggetto Richiedi ricevono un solo parametro, ovvero un oggetto della richiesta, che deve essere creato prima della chiamata.

  • directRawPredict(DirectRawPredictRequest request)

Le varianti di metodo richiamabili non accettano parametri e restituiscono un oggetto richiamabile API immutabile, che può essere utilizzato per avviare chiamate al servizio.

  • directRawPredictCallable()

StreamDirectPredict

Eseguire una richiesta di previsione online di flussi di dati a un server del modello gRPC per i prodotti e i framework proprietari di Vertex.

Le varianti di metodo richiamabili non accettano parametri e restituiscono un oggetto richiamabile API immutabile, che può essere utilizzato per avviare chiamate al servizio.

  • streamDirectPredictCallable()

StreamDirectRawPredict

Eseguire una richiesta di previsione online di flussi di dati a un server del modello gRPC per i container personalizzati.

Le varianti di metodo richiamabili non accettano parametri e restituiscono un oggetto richiamabile API immutabile, che può essere utilizzato per avviare chiamate al servizio.

  • streamDirectRawPredictCallable()

StreamingPredict

Esegui una richiesta di previsione online di streaming per prodotti e framework proprietari di Vertex.

Le varianti di metodo richiamabili non accettano parametri e restituiscono un oggetto richiamabile API immutabile, che può essere utilizzato per avviare chiamate al servizio.

  • streamingPredictCallable()

ServerStreamingPredict

Esegui una richiesta di previsione online di streaming lato server per i flussi di dati Vertex LLM.

Le varianti di metodo richiamabili non accettano parametri e restituiscono un oggetto richiamabile API immutabile, che può essere utilizzato per avviare chiamate al servizio.

  • serverStreamingPredictCallable()

StreamingRawPredict

Eseguire una richiesta di previsione online di flussi di dati tramite gRPC.

Le varianti di metodo richiamabili non accettano parametri e restituiscono un oggetto richiamabile API immutabile, che può essere utilizzato per avviare chiamate al servizio.

  • streamingRawPredictCallable()

Spiega

Eseguire una spiegazione online.

Se deployed_model_id è specificato, per il DeployModel corrispondente deve essere compilato explanation_spec. Se deployed_model_id non è specificato, per tutti i DeployedModel deve essere compilato explanation_spec.

Le varianti del metodo dell'oggetto Richiedi ricevono un solo parametro, ovvero un oggetto della richiesta, che deve essere creato prima della chiamata.

  • spiegare(richiesta ExplainRequest)

Le varianti di metodo "appiattite" hanno convertito i campi dell'oggetto della richiesta in parametri di funzione per consentire più modi di chiamare lo stesso metodo.

  • spiegare(endpoint NomeEndpoint, istanze List<Value>, parametri Valore, Stringa distribuitaModelId)

  • spiegare(Endpoint stringa, istanze List<Value>, parametri valore, stringa distribuitaModelId)

Le varianti di metodo richiamabili non accettano parametri e restituiscono un oggetto richiamabile API immutabile, che può essere utilizzato per avviare chiamate al servizio.

  • explainCallable()

GenerateContent

Genera contenuti con input multimodali.

Le varianti del metodo dell'oggetto Richiedi ricevono un solo parametro, ovvero un oggetto della richiesta, che deve essere creato prima della chiamata.

  • generateContent(GenerateContentRequest request)

Le varianti di metodo "appiattite" hanno convertito i campi dell'oggetto della richiesta in parametri di funzione per consentire più modi di chiamare lo stesso metodo.

  • generateContent(String model, List<Content> contents)

Le varianti di metodo richiamabili non accettano parametri e restituiscono un oggetto richiamabile API immutabile, che può essere utilizzato per avviare chiamate al servizio.

  • generateContentCallable()

StreamGenerateContent

Genera contenuti con input multimodali con supporto per lo streaming.

Le varianti di metodo richiamabili non accettano parametri e restituiscono un oggetto richiamabile API immutabile, che può essere utilizzato per avviare chiamate al servizio.

  • streamGenerateContentCallable()

ListLocations

Elenca le informazioni sulle località supportate per questo servizio.

Le varianti del metodo dell'oggetto Richiedi ricevono un solo parametro, ovvero un oggetto della richiesta, che deve essere creato prima della chiamata.

  • listLocations(ListLocationsRequest request)

Le varianti di metodo richiamabili non accettano parametri e restituiscono un oggetto richiamabile API immutabile, che può essere utilizzato per avviare chiamate al servizio.

  • listLocationsPagedCallable()

  • listLocationsCallable()

GetLocation

Recupera le informazioni su una posizione.

Le varianti del metodo dell'oggetto Richiedi ricevono un solo parametro, ovvero un oggetto della richiesta, che deve essere creato prima della chiamata.

  • getLocation(GetLocationRequest request)

Le varianti di metodo richiamabili non accettano parametri e restituiscono un oggetto richiamabile API immutabile, che può essere utilizzato per avviare chiamate al servizio.

  • getLocationCallable()

SetIamPolicy

Imposta il criterio di controllo dell'accesso sulla risorsa specificata. Sostituisce qualsiasi criterio esistente.

Può restituire errori NOT_FOUND, INVALID_ARGUMENT e PERMISSION_DENIED.

Le varianti del metodo dell'oggetto Richiedi ricevono un solo parametro, ovvero un oggetto della richiesta, che deve essere creato prima della chiamata.

  • setIamPolicy(SetIamPolicyRequest request)

Le varianti di metodo richiamabili non accettano parametri e restituiscono un oggetto richiamabile API immutabile, che può essere utilizzato per avviare chiamate al servizio.

  • setIamPolicyCallable()

GetIamPolicy

Ottieni il criterio di controllo dell'accesso per una risorsa. Restituisce un criterio vuoto se la risorsa esiste e non è stato impostato un criterio.

Le varianti del metodo dell'oggetto Richiedi ricevono un solo parametro, ovvero un oggetto della richiesta, che deve essere creato prima della chiamata.

  • getIamPolicy(GetIamPolicyRequest request)

Le varianti di metodo richiamabili non accettano parametri e restituiscono un oggetto richiamabile API immutabile, che può essere utilizzato per avviare chiamate al servizio.

  • getIamPolicyCallable()

TestIamPermissions

Restituisce le autorizzazioni di cui un chiamante dispone per la risorsa specificata. Se la risorsa non esiste, verrà restituito un insieme di autorizzazioni vuoto, non un errore NOT_FOUND.

Nota: questa operazione è progettata per essere utilizzata per le UI e gli strumenti a riga di comando che consentono la creazione di autorizzazioni, non per il controllo delle autorizzazioni. Questa operazione potrebbe non riuscire ad aprirsi senza preavviso.

Le varianti del metodo dell'oggetto Richiedi ricevono un solo parametro, ovvero un oggetto della richiesta, che deve essere creato prima della chiamata.

  • testIamPermissions(TestIamPermissionsRequest request)

Le varianti di metodo richiamabili non accettano parametri e restituiscono un oggetto richiamabile API immutabile, che può essere utilizzato per avviare chiamate al servizio.

  • testIamPermissionsCallable()

Consulta i singoli metodi per vedere il codice di esempio.

Molti parametri richiedono che i nomi delle risorse siano formattati in un determinato modo. Per facilitare questi nomi, questa classe include un metodo di formattazione per ogni tipo di nome e un metodo di analisi per estrarre i singoli identificatori contenuti all'interno dei nomi che vengono restituiti.

Questa classe può essere personalizzata passando un'istanza personalizzata di PredictionServiceSettings a create(). Ad esempio:

Per personalizzare le credenziali:


 // This snippet has been automatically generated and should be regarded as a code template only.
 // It will require modifications to work:
 // - It may require correct/in-range values for request initialization.
 // - It may require specifying regional endpoints when creating the service client as shown in
 // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
 PredictionServiceSettings predictionServiceSettings =
     PredictionServiceSettings.newBuilder()
         .setCredentialsProvider(FixedCredentialsProvider.create(myCredentials))
         .build();
 PredictionServiceClient predictionServiceClient =
     PredictionServiceClient.create(predictionServiceSettings);
 

Per personalizzare l'endpoint:


 // This snippet has been automatically generated and should be regarded as a code template only.
 // It will require modifications to work:
 // - It may require correct/in-range values for request initialization.
 // - It may require specifying regional endpoints when creating the service client as shown in
 // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
 PredictionServiceSettings predictionServiceSettings =
     PredictionServiceSettings.newBuilder().setEndpoint(myEndpoint).build();
 PredictionServiceClient predictionServiceClient =
     PredictionServiceClient.create(predictionServiceSettings);
 

Per utilizzare il trasporto REST (HTTP1.1/JSON) (invece di gRPC) per l'invio e la ricezione delle richieste via rete:


 // This snippet has been automatically generated and should be regarded as a code template only.
 // It will require modifications to work:
 // - It may require correct/in-range values for request initialization.
 // - It may require specifying regional endpoints when creating the service client as shown in
 // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
 PredictionServiceSettings predictionServiceSettings =
     PredictionServiceSettings.newHttpJsonBuilder().build();
 PredictionServiceClient predictionServiceClient =
     PredictionServiceClient.create(predictionServiceSettings);
 

Fai riferimento agli esempi del repository GitHub per altri snippet di codice per la guida rapida.

Ereditarietà

java.lang.Object > PredictionServiceClient

Implementa

BackgroundResource

Metodi statici

creare()

public static final PredictionServiceClient create()

Crea un'istanza di PredictionServiceClient con impostazioni predefinite.

Restituisce
Tipo Description
PredictionServiceClient
Eccezioni
Tipo Description
IOException

create(impostazioni diPredictionServiceSettings)

public static final PredictionServiceClient create(PredictionServiceSettings settings)

Crea un'istanza di PredictionServiceClient utilizzando le impostazioni specificate. I canali vengono creati in base alle impostazioni trasmesse o ai valori predefiniti di qualsiasi impostazione non configurata.

Parametro
Nome Description
settings PredictionServiceSettings
Restituisce
Tipo Description
PredictionServiceClient
Eccezioni
Tipo Description
IOException

create(stubPredictionServiceStub)

public static final PredictionServiceClient create(PredictionServiceStub stub)

Crea un'istanza di PredictionServiceClient, utilizzando lo stub specificato per effettuare chiamate. Questa opzione è per un utilizzo avanzato; è preferibile utilizzare create(PredictionServiceSettings).

Parametro
Nome Description
stub PredictionServiceStub
Restituisce
Tipo Description
PredictionServiceClient

Costruttori

PredictionServiceClient(PredictionServiceSettings settings)

protected PredictionServiceClient(PredictionServiceSettings settings)

Crea un'istanza di PredictionServiceClient utilizzando le impostazioni specificate. Questo è protetto in modo da semplificare la creazione di una sottoclasse, ma altrimenti i metodi di fabbrica statici sono preferibili.

Parametro
Nome Description
settings PredictionServiceSettings

PredictionServiceClient(PredictionServiceStub stub)

protected PredictionServiceClient(PredictionServiceStub stub)
Parametro
Nome Description
stub PredictionServiceStub

Metodi

awaitTermination(long duration, TimeUnit unit)

public boolean awaitTermination(long duration, TimeUnit unit)
Parametri
Nome Description
duration long
unit TimeUnit
Restituisce
Tipo Description
boolean
Eccezioni
Tipo Description
InterruptedException

chiudi()

public final void close()

directPredict(DirectPredictRequest request)

public final DirectPredictResponse directPredict(DirectPredictRequest request)

Eseguire una richiesta di previsione online unaria a un server del modello gRPC per i prodotti e i framework proprietari di Vertex.

Codice campione:


 // This snippet has been automatically generated and should be regarded as a code template only.
 // It will require modifications to work:
 // - It may require correct/in-range values for request initialization.
 // - It may require specifying regional endpoints when creating the service client as shown in
 // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
 try (PredictionServiceClient predictionServiceClient = PredictionServiceClient.create()) {
   DirectPredictRequest request =
       DirectPredictRequest.newBuilder()
           .setEndpoint(
               EndpointName.ofProjectLocationEndpointName(
                       "[PROJECT]", "[LOCATION]", "[ENDPOINT]")
                   .toString())
           .addAllInputs(new ArrayList<Tensor>())
           .setParameters(Tensor.newBuilder().build())
           .build();
   DirectPredictResponse response = predictionServiceClient.directPredict(request);
 }
 
Parametro
Nome Description
request DirectPredictRequest

L'oggetto della richiesta contenente tutti i parametri per la chiamata API.

Restituisce
Tipo Description
DirectPredictResponse

directPredictCallable()

public final UnaryCallable<DirectPredictRequest,DirectPredictResponse> directPredictCallable()

Eseguire una richiesta di previsione online unaria a un server del modello gRPC per i prodotti e i framework proprietari di Vertex.

Codice campione:


 // This snippet has been automatically generated and should be regarded as a code template only.
 // It will require modifications to work:
 // - It may require correct/in-range values for request initialization.
 // - It may require specifying regional endpoints when creating the service client as shown in
 // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
 try (PredictionServiceClient predictionServiceClient = PredictionServiceClient.create()) {
   DirectPredictRequest request =
       DirectPredictRequest.newBuilder()
           .setEndpoint(
               EndpointName.ofProjectLocationEndpointName(
                       "[PROJECT]", "[LOCATION]", "[ENDPOINT]")
                   .toString())
           .addAllInputs(new ArrayList<Tensor>())
           .setParameters(Tensor.newBuilder().build())
           .build();
   ApiFuture<DirectPredictResponse> future =
       predictionServiceClient.directPredictCallable().futureCall(request);
   // Do something.
   DirectPredictResponse response = future.get();
 }
 
Restituisce
Tipo Description
UnaryCallable<DirectPredictRequest,DirectPredictResponse>

directRawPredict(DirectRawPredictRequest request)

public final DirectRawPredictResponse directRawPredict(DirectRawPredictRequest request)

Eseguire una richiesta di previsione online unaria a un server del modello gRPC per i container personalizzati.

Codice campione:


 // This snippet has been automatically generated and should be regarded as a code template only.
 // It will require modifications to work:
 // - It may require correct/in-range values for request initialization.
 // - It may require specifying regional endpoints when creating the service client as shown in
 // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
 try (PredictionServiceClient predictionServiceClient = PredictionServiceClient.create()) {
   DirectRawPredictRequest request =
       DirectRawPredictRequest.newBuilder()
           .setEndpoint(
               EndpointName.ofProjectLocationEndpointName(
                       "[PROJECT]", "[LOCATION]", "[ENDPOINT]")
                   .toString())
           .setMethodName("methodName-723163380")
           .setInput(ByteString.EMPTY)
           .build();
   DirectRawPredictResponse response = predictionServiceClient.directRawPredict(request);
 }
 
Parametro
Nome Description
request DirectRawPredictRequest

L'oggetto della richiesta contenente tutti i parametri per la chiamata API.

Restituisce
Tipo Description
DirectRawPredictResponse

directRawPredictCallable()

public final UnaryCallable<DirectRawPredictRequest,DirectRawPredictResponse> directRawPredictCallable()

Eseguire una richiesta di previsione online unaria a un server del modello gRPC per i container personalizzati.

Codice campione:


 // This snippet has been automatically generated and should be regarded as a code template only.
 // It will require modifications to work:
 // - It may require correct/in-range values for request initialization.
 // - It may require specifying regional endpoints when creating the service client as shown in
 // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
 try (PredictionServiceClient predictionServiceClient = PredictionServiceClient.create()) {
   DirectRawPredictRequest request =
       DirectRawPredictRequest.newBuilder()
           .setEndpoint(
               EndpointName.ofProjectLocationEndpointName(
                       "[PROJECT]", "[LOCATION]", "[ENDPOINT]")
                   .toString())
           .setMethodName("methodName-723163380")
           .setInput(ByteString.EMPTY)
           .build();
   ApiFuture<DirectRawPredictResponse> future =
       predictionServiceClient.directRawPredictCallable().futureCall(request);
   // Do something.
   DirectRawPredictResponse response = future.get();
 }
 
Restituisce
Tipo Description
UnaryCallable<DirectRawPredictRequest,DirectRawPredictResponse>

spiegare(endpoint NomeEndpoint, istanze List<Value>, parametri Valore, Stringa distribuitaModelId)

public final ExplainResponse explain(EndpointName endpoint, List<Value> instances, Value parameters, String deployedModelId)

Eseguire una spiegazione online.

Se deployed_model_id è specificato, per il modello DeployModel corrispondente deve essere compilato explanation_spec. Se deployed_model_id non è specificato, per tutti i DeployedModel deve essere compilato explanation_spec.

Codice campione:


 // This snippet has been automatically generated and should be regarded as a code template only.
 // It will require modifications to work:
 // - It may require correct/in-range values for request initialization.
 // - It may require specifying regional endpoints when creating the service client as shown in
 // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
 try (PredictionServiceClient predictionServiceClient = PredictionServiceClient.create()) {
   EndpointName endpoint =
       EndpointName.ofProjectLocationEndpointName("[PROJECT]", "[LOCATION]", "[ENDPOINT]");
   List<Value> instances = new ArrayList<>();
   Value parameters = Value.newBuilder().setBoolValue(true).build();
   String deployedModelId = "deployedModelId-1817547906";
   ExplainResponse response =
       predictionServiceClient.explain(endpoint, instances, parameters, deployedModelId);
 }
 
Parametri
Nome Description
endpoint EndpointName

Obbligatorio. Il nome dell'endpoint di cui è stata richiesta la spiegazione. Formato: projects/{project}/locations/{location}/endpoints/{endpoint}

instances List<Value>

Obbligatorio. Le istanze che sono l'input della chiamata di spiegazione. Un modello DeployedModel può avere un limite superiore al numero di istanze che supporta per richiesta e quando viene superato il numero di errori della chiamata di spiegazione nel caso di modelli AutoML o, nel caso di modelli creati dal cliente, il comportamento è come documentato da quel modello. Lo schema di qualsiasi singola istanza può essere specificato tramite instance_schema_uri di Models PredictSchemata di Endpoint.

parameters Value

I parametri che regolano la previsione. Lo schema dei parametri può essere specificato tramite il valore parameters_schema_uri del modello Models di PredictSchemata di Endpoint.

deployedModelId String

Se specificato, questa richiesta ExplainRequest verrà gestita dal modello DeployedModel scelto, sostituendo Endpoint.traffic_split.

Restituisce
Tipo Description
ExplainResponse

spiegare(richiesta ExplainRequest)

public final ExplainResponse explain(ExplainRequest request)

Eseguire una spiegazione online.

Se deployed_model_id è specificato, per il modello DeployModel corrispondente deve essere compilato explanation_spec. Se deployed_model_id non è specificato, per tutti i DeployedModel deve essere compilato explanation_spec.

Codice campione:


 // This snippet has been automatically generated and should be regarded as a code template only.
 // It will require modifications to work:
 // - It may require correct/in-range values for request initialization.
 // - It may require specifying regional endpoints when creating the service client as shown in
 // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
 try (PredictionServiceClient predictionServiceClient = PredictionServiceClient.create()) {
   ExplainRequest request =
       ExplainRequest.newBuilder()
           .setEndpoint(
               EndpointName.ofProjectLocationEndpointName(
                       "[PROJECT]", "[LOCATION]", "[ENDPOINT]")
                   .toString())
           .addAllInstances(new ArrayList<Value>())
           .setParameters(Value.newBuilder().setBoolValue(true).build())
           .setExplanationSpecOverride(ExplanationSpecOverride.newBuilder().build())
           .setDeployedModelId("deployedModelId-1817547906")
           .build();
   ExplainResponse response = predictionServiceClient.explain(request);
 }
 
Parametro
Nome Description
request ExplainRequest

L'oggetto della richiesta contenente tutti i parametri per la chiamata API.

Restituisce
Tipo Description
ExplainResponse

spiegare(Endpoint stringa, istanze List<Value>, parametri valore, stringa distribuitaModelId)

public final ExplainResponse explain(String endpoint, List<Value> instances, Value parameters, String deployedModelId)

Eseguire una spiegazione online.

Se deployed_model_id è specificato, per il modello DeployModel corrispondente deve essere compilato explanation_spec. Se deployed_model_id non è specificato, per tutti i DeployedModel deve essere compilato explanation_spec.

Codice campione:


 // This snippet has been automatically generated and should be regarded as a code template only.
 // It will require modifications to work:
 // - It may require correct/in-range values for request initialization.
 // - It may require specifying regional endpoints when creating the service client as shown in
 // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
 try (PredictionServiceClient predictionServiceClient = PredictionServiceClient.create()) {
   String endpoint =
       EndpointName.ofProjectLocationEndpointName("[PROJECT]", "[LOCATION]", "[ENDPOINT]")
           .toString();
   List<Value> instances = new ArrayList<>();
   Value parameters = Value.newBuilder().setBoolValue(true).build();
   String deployedModelId = "deployedModelId-1817547906";
   ExplainResponse response =
       predictionServiceClient.explain(endpoint, instances, parameters, deployedModelId);
 }
 
Parametri
Nome Description
endpoint String

Obbligatorio. Il nome dell'endpoint di cui è stata richiesta la spiegazione. Formato: projects/{project}/locations/{location}/endpoints/{endpoint}

instances List<Value>

Obbligatorio. Le istanze che sono l'input della chiamata di spiegazione. Un modello DeployedModel può avere un limite superiore al numero di istanze che supporta per richiesta e quando viene superato il numero di errori della chiamata di spiegazione nel caso di modelli AutoML o, nel caso di modelli creati dal cliente, il comportamento è come documentato da quel modello. Lo schema di qualsiasi singola istanza può essere specificato tramite instance_schema_uri di Models PredictSchemata di Endpoint.

parameters Value

I parametri che regolano la previsione. Lo schema dei parametri può essere specificato tramite il valore parameters_schema_uri del modello Models di PredictSchemata di Endpoint.

deployedModelId String

Se specificato, questa richiesta ExplainRequest verrà gestita dal modello DeployedModel scelto, sostituendo Endpoint.traffic_split.

Restituisce
Tipo Description
ExplainResponse

explainCallable()

public final UnaryCallable<ExplainRequest,ExplainResponse> explainCallable()

Eseguire una spiegazione online.

Se deployed_model_id è specificato, per il modello DeployModel corrispondente deve essere compilato explanation_spec. Se deployed_model_id non è specificato, per tutti i DeployedModel deve essere compilato explanation_spec.

Codice campione:


 // This snippet has been automatically generated and should be regarded as a code template only.
 // It will require modifications to work:
 // - It may require correct/in-range values for request initialization.
 // - It may require specifying regional endpoints when creating the service client as shown in
 // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
 try (PredictionServiceClient predictionServiceClient = PredictionServiceClient.create()) {
   ExplainRequest request =
       ExplainRequest.newBuilder()
           .setEndpoint(
               EndpointName.ofProjectLocationEndpointName(
                       "[PROJECT]", "[LOCATION]", "[ENDPOINT]")
                   .toString())
           .addAllInstances(new ArrayList<Value>())
           .setParameters(Value.newBuilder().setBoolValue(true).build())
           .setExplanationSpecOverride(ExplanationSpecOverride.newBuilder().build())
           .setDeployedModelId("deployedModelId-1817547906")
           .build();
   ApiFuture<ExplainResponse> future =
       predictionServiceClient.explainCallable().futureCall(request);
   // Do something.
   ExplainResponse response = future.get();
 }
 
Restituisce
Tipo Description
UnaryCallable<ExplainRequest,ExplainResponse>

generateContent(GenerateContentRequest request)

public final GenerateContentResponse generateContent(GenerateContentRequest request)

Genera contenuti con input multimodali.

Codice campione:


 // This snippet has been automatically generated and should be regarded as a code template only.
 // It will require modifications to work:
 // - It may require correct/in-range values for request initialization.
 // - It may require specifying regional endpoints when creating the service client as shown in
 // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
 try (PredictionServiceClient predictionServiceClient = PredictionServiceClient.create()) {
   GenerateContentRequest request =
       GenerateContentRequest.newBuilder()
           .setModel("model104069929")
           .addAllContents(new ArrayList<Content>())
           .setSystemInstruction(Content.newBuilder().build())
           .addAllTools(new ArrayList<Tool>())
           .addAllSafetySettings(new ArrayList<SafetySetting>())
           .setGenerationConfig(GenerationConfig.newBuilder().build())
           .build();
   GenerateContentResponse response = predictionServiceClient.generateContent(request);
 }
 
Parametro
Nome Description
request GenerateContentRequest

L'oggetto della richiesta contenente tutti i parametri per la chiamata API.

Restituisce
Tipo Description
GenerateContentResponse

generateContent(String model, List<Content> contents)

public final GenerateContentResponse generateContent(String model, List<Content> contents)

Genera contenuti con input multimodali.

Codice campione:


 // This snippet has been automatically generated and should be regarded as a code template only.
 // It will require modifications to work:
 // - It may require correct/in-range values for request initialization.
 // - It may require specifying regional endpoints when creating the service client as shown in
 // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
 try (PredictionServiceClient predictionServiceClient = PredictionServiceClient.create()) {
   String model = "model104069929";
   List<Content> contents = new ArrayList<>();
   GenerateContentResponse response = predictionServiceClient.generateContent(model, contents);
 }
 
Parametri
Nome Description
model String

Obbligatorio. Il nome del modello del publisher di cui è stata richiesta la previsione. Formato: projects/{project}/locations/{location}/publishers/*/models/*

contents List<Content>

Obbligatorio. I contenuti della conversazione corrente con il modello.

Per le query a turno singolo, si tratta di una singola istanza. Per le query in più passaggi, si tratta di un campo ripetuto contenente la cronologia delle conversazioni e l'ultima richiesta.

Restituisce
Tipo Description
GenerateContentResponse

generateContentCallable()

public final UnaryCallable<GenerateContentRequest,GenerateContentResponse> generateContentCallable()

Genera contenuti con input multimodali.

Codice campione:


 // This snippet has been automatically generated and should be regarded as a code template only.
 // It will require modifications to work:
 // - It may require correct/in-range values for request initialization.
 // - It may require specifying regional endpoints when creating the service client as shown in
 // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
 try (PredictionServiceClient predictionServiceClient = PredictionServiceClient.create()) {
   GenerateContentRequest request =
       GenerateContentRequest.newBuilder()
           .setModel("model104069929")
           .addAllContents(new ArrayList<Content>())
           .setSystemInstruction(Content.newBuilder().build())
           .addAllTools(new ArrayList<Tool>())
           .addAllSafetySettings(new ArrayList<SafetySetting>())
           .setGenerationConfig(GenerationConfig.newBuilder().build())
           .build();
   ApiFuture<GenerateContentResponse> future =
       predictionServiceClient.generateContentCallable().futureCall(request);
   // Do something.
   GenerateContentResponse response = future.get();
 }
 
Restituisce
Tipo Description
UnaryCallable<GenerateContentRequest,GenerateContentResponse>

getIamPolicy(GetIamPolicyRequest request)

public final Policy getIamPolicy(GetIamPolicyRequest request)

Ottieni il criterio di controllo dell'accesso per una risorsa. Restituisce un criterio vuoto se la risorsa esiste e non è stato impostato un criterio.

Codice campione:


 // This snippet has been automatically generated and should be regarded as a code template only.
 // It will require modifications to work:
 // - It may require correct/in-range values for request initialization.
 // - It may require specifying regional endpoints when creating the service client as shown in
 // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
 try (PredictionServiceClient predictionServiceClient = PredictionServiceClient.create()) {
   GetIamPolicyRequest request =
       GetIamPolicyRequest.newBuilder()
           .setResource(
               EndpointName.ofProjectLocationEndpointName(
                       "[PROJECT]", "[LOCATION]", "[ENDPOINT]")
                   .toString())
           .setOptions(GetPolicyOptions.newBuilder().build())
           .build();
   Policy response = predictionServiceClient.getIamPolicy(request);
 }
 
Parametro
Nome Description
request com.google.iam.v1.GetIamPolicyRequest

L'oggetto della richiesta contenente tutti i parametri per la chiamata API.

Restituisce
Tipo Description
com.google.iam.v1.Policy

getIamPolicyCallable()

public final UnaryCallable<GetIamPolicyRequest,Policy> getIamPolicyCallable()

Ottieni il criterio di controllo dell'accesso per una risorsa. Restituisce un criterio vuoto se la risorsa esiste e non è stato impostato un criterio.

Codice campione:


 // This snippet has been automatically generated and should be regarded as a code template only.
 // It will require modifications to work:
 // - It may require correct/in-range values for request initialization.
 // - It may require specifying regional endpoints when creating the service client as shown in
 // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
 try (PredictionServiceClient predictionServiceClient = PredictionServiceClient.create()) {
   GetIamPolicyRequest request =
       GetIamPolicyRequest.newBuilder()
           .setResource(
               EndpointName.ofProjectLocationEndpointName(
                       "[PROJECT]", "[LOCATION]", "[ENDPOINT]")
                   .toString())
           .setOptions(GetPolicyOptions.newBuilder().build())
           .build();
   ApiFuture<Policy> future = predictionServiceClient.getIamPolicyCallable().futureCall(request);
   // Do something.
   Policy response = future.get();
 }
 
Restituisce
Tipo Description
UnaryCallable<com.google.iam.v1.GetIamPolicyRequest,com.google.iam.v1.Policy>

getLocation(GetLocationRequest request)

public final Location getLocation(GetLocationRequest request)

Recupera le informazioni su una posizione.

Codice campione:


 // This snippet has been automatically generated and should be regarded as a code template only.
 // It will require modifications to work:
 // - It may require correct/in-range values for request initialization.
 // - It may require specifying regional endpoints when creating the service client as shown in
 // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
 try (PredictionServiceClient predictionServiceClient = PredictionServiceClient.create()) {
   GetLocationRequest request = GetLocationRequest.newBuilder().setName("name3373707").build();
   Location response = predictionServiceClient.getLocation(request);
 }
 
Parametro
Nome Description
request com.google.cloud.location.GetLocationRequest

L'oggetto della richiesta contenente tutti i parametri per la chiamata API.

Restituisce
Tipo Description
com.google.cloud.location.Location

getLocationCallable()

public final UnaryCallable<GetLocationRequest,Location> getLocationCallable()

Recupera le informazioni su una posizione.

Codice campione:


 // This snippet has been automatically generated and should be regarded as a code template only.
 // It will require modifications to work:
 // - It may require correct/in-range values for request initialization.
 // - It may require specifying regional endpoints when creating the service client as shown in
 // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
 try (PredictionServiceClient predictionServiceClient = PredictionServiceClient.create()) {
   GetLocationRequest request = GetLocationRequest.newBuilder().setName("name3373707").build();
   ApiFuture<Location> future =
       predictionServiceClient.getLocationCallable().futureCall(request);
   // Do something.
   Location response = future.get();
 }
 
Restituisce
Tipo Description
UnaryCallable<com.google.cloud.location.GetLocationRequest,com.google.cloud.location.Location>

getSettings()

public final PredictionServiceSettings getSettings()
Restituisce
Tipo Description
PredictionServiceSettings

getStub()

public PredictionServiceStub getStub()
Restituisce
Tipo Description
PredictionServiceStub

isShutdown()

public boolean isShutdown()
Restituisce
Tipo Description
boolean

isTerminated()

public boolean isTerminated()
Restituisce
Tipo Description
boolean

listLocations(ListLocationsRequest request)

public final PredictionServiceClient.ListLocationsPagedResponse listLocations(ListLocationsRequest request)

Elenca le informazioni sulle località supportate per questo servizio.

Codice campione:


 // This snippet has been automatically generated and should be regarded as a code template only.
 // It will require modifications to work:
 // - It may require correct/in-range values for request initialization.
 // - It may require specifying regional endpoints when creating the service client as shown in
 // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
 try (PredictionServiceClient predictionServiceClient = PredictionServiceClient.create()) {
   ListLocationsRequest request =
       ListLocationsRequest.newBuilder()
           .setName("name3373707")
           .setFilter("filter-1274492040")
           .setPageSize(883849137)
           .setPageToken("pageToken873572522")
           .build();
   for (Location element : predictionServiceClient.listLocations(request).iterateAll()) {
     // doThingsWith(element);
   }
 }
 
Parametro
Nome Description
request com.google.cloud.location.ListLocationsRequest

L'oggetto della richiesta contenente tutti i parametri per la chiamata API.

Restituisce
Tipo Description
PredictionServiceClient.ListLocationsPagedResponse

listLocationsCallable()

public final UnaryCallable<ListLocationsRequest,ListLocationsResponse> listLocationsCallable()

Elenca le informazioni sulle località supportate per questo servizio.

Codice campione:


 // This snippet has been automatically generated and should be regarded as a code template only.
 // It will require modifications to work:
 // - It may require correct/in-range values for request initialization.
 // - It may require specifying regional endpoints when creating the service client as shown in
 // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
 try (PredictionServiceClient predictionServiceClient = PredictionServiceClient.create()) {
   ListLocationsRequest request =
       ListLocationsRequest.newBuilder()
           .setName("name3373707")
           .setFilter("filter-1274492040")
           .setPageSize(883849137)
           .setPageToken("pageToken873572522")
           .build();
   while (true) {
     ListLocationsResponse response =
         predictionServiceClient.listLocationsCallable().call(request);
     for (Location element : response.getLocationsList()) {
       // doThingsWith(element);
     }
     String nextPageToken = response.getNextPageToken();
     if (!Strings.isNullOrEmpty(nextPageToken)) {
       request = request.toBuilder().setPageToken(nextPageToken).build();
     } else {
       break;
     }
   }
 }
 
Restituisce
Tipo Description
UnaryCallable<com.google.cloud.location.ListLocationsRequest,com.google.cloud.location.ListLocationsResponse>

listLocationsPagedCallable()

public final UnaryCallable<ListLocationsRequest,PredictionServiceClient.ListLocationsPagedResponse> listLocationsPagedCallable()

Elenca le informazioni sulle località supportate per questo servizio.

Codice campione:


 // This snippet has been automatically generated and should be regarded as a code template only.
 // It will require modifications to work:
 // - It may require correct/in-range values for request initialization.
 // - It may require specifying regional endpoints when creating the service client as shown in
 // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
 try (PredictionServiceClient predictionServiceClient = PredictionServiceClient.create()) {
   ListLocationsRequest request =
       ListLocationsRequest.newBuilder()
           .setName("name3373707")
           .setFilter("filter-1274492040")
           .setPageSize(883849137)
           .setPageToken("pageToken873572522")
           .build();
   ApiFuture<Location> future =
       predictionServiceClient.listLocationsPagedCallable().futureCall(request);
   // Do something.
   for (Location element : future.get().iterateAll()) {
     // doThingsWith(element);
   }
 }
 
Restituisce
Tipo Description
UnaryCallable<com.google.cloud.location.ListLocationsRequest,ListLocationsPagedResponse>

previsioni(endpoint NomeEndpoint, istanze List<Value>, parametri Value)

public final PredictResponse predict(EndpointName endpoint, List<Value> instances, Value parameters)

Eseguire una previsione online.

Codice campione:


 // This snippet has been automatically generated and should be regarded as a code template only.
 // It will require modifications to work:
 // - It may require correct/in-range values for request initialization.
 // - It may require specifying regional endpoints when creating the service client as shown in
 // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
 try (PredictionServiceClient predictionServiceClient = PredictionServiceClient.create()) {
   EndpointName endpoint =
       EndpointName.ofProjectLocationEndpointName("[PROJECT]", "[LOCATION]", "[ENDPOINT]");
   List<Value> instances = new ArrayList<>();
   Value parameters = Value.newBuilder().setBoolValue(true).build();
   PredictResponse response = predictionServiceClient.predict(endpoint, instances, parameters);
 }
 
Parametri
Nome Description
endpoint EndpointName

Obbligatorio. Il nome dell'endpoint di cui è stata richiesta la previsione. Formato: projects/{project}/locations/{location}/endpoints/{endpoint}

instances List<Value>

Obbligatorio. Le istanze che sono l'input della chiamata di previsione. Un modello DeployedModel può avere un limite superiore al numero di istanze che supporta per richiesta e quando viene superato il numero di errori delle chiamate di previsione nel caso di modelli AutoML o, nel caso di modelli creati dal cliente, il comportamento è come documentato da quel modello. Lo schema di qualsiasi singola istanza può essere specificato tramite instance_schema_uri di Models PredictSchemata di Endpoint.

parameters Value

I parametri che regolano la previsione. Lo schema dei parametri può essere specificato tramite il valore parameters_schema_uri del modello Models di PredictSchemata di Endpoint.

Restituisce
Tipo Description
PredictResponse

predicted(richiesta PredictRequest)

public final PredictResponse predict(PredictRequest request)

Eseguire una previsione online.

Codice campione:


 // This snippet has been automatically generated and should be regarded as a code template only.
 // It will require modifications to work:
 // - It may require correct/in-range values for request initialization.
 // - It may require specifying regional endpoints when creating the service client as shown in
 // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
 try (PredictionServiceClient predictionServiceClient = PredictionServiceClient.create()) {
   PredictRequest request =
       PredictRequest.newBuilder()
           .setEndpoint(
               EndpointName.ofProjectLocationEndpointName(
                       "[PROJECT]", "[LOCATION]", "[ENDPOINT]")
                   .toString())
           .addAllInstances(new ArrayList<Value>())
           .setParameters(Value.newBuilder().setBoolValue(true).build())
           .build();
   PredictResponse response = predictionServiceClient.predict(request);
 }
 
Parametro
Nome Description
request PredictRequest

L'oggetto della richiesta contenente tutti i parametri per la chiamata API.

Restituisce
Tipo Description
PredictResponse

predicted(Endpoint stringa, istanze List<Value>, parametri value)

public final PredictResponse predict(String endpoint, List<Value> instances, Value parameters)

Eseguire una previsione online.

Codice campione:


 // This snippet has been automatically generated and should be regarded as a code template only.
 // It will require modifications to work:
 // - It may require correct/in-range values for request initialization.
 // - It may require specifying regional endpoints when creating the service client as shown in
 // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
 try (PredictionServiceClient predictionServiceClient = PredictionServiceClient.create()) {
   String endpoint =
       EndpointName.ofProjectLocationEndpointName("[PROJECT]", "[LOCATION]", "[ENDPOINT]")
           .toString();
   List<Value> instances = new ArrayList<>();
   Value parameters = Value.newBuilder().setBoolValue(true).build();
   PredictResponse response = predictionServiceClient.predict(endpoint, instances, parameters);
 }
 
Parametri
Nome Description
endpoint String

Obbligatorio. Il nome dell'endpoint di cui è stata richiesta la previsione. Formato: projects/{project}/locations/{location}/endpoints/{endpoint}

instances List<Value>

Obbligatorio. Le istanze che sono l'input della chiamata di previsione. Un modello DeployedModel può avere un limite superiore al numero di istanze che supporta per richiesta e quando viene superato il numero di errori delle chiamate di previsione nel caso di modelli AutoML o, nel caso di modelli creati dal cliente, il comportamento è come documentato da quel modello. Lo schema di qualsiasi singola istanza può essere specificato tramite instance_schema_uri di Models PredictSchemata di Endpoint.

parameters Value

I parametri che regolano la previsione. Lo schema dei parametri può essere specificato tramite il valore parameters_schema_uri del modello Models di PredictSchemata di Endpoint.

Restituisce
Tipo Description
PredictResponse

predictCallable()

public final UnaryCallable<PredictRequest,PredictResponse> predictCallable()

Eseguire una previsione online.

Codice campione:


 // This snippet has been automatically generated and should be regarded as a code template only.
 // It will require modifications to work:
 // - It may require correct/in-range values for request initialization.
 // - It may require specifying regional endpoints when creating the service client as shown in
 // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
 try (PredictionServiceClient predictionServiceClient = PredictionServiceClient.create()) {
   PredictRequest request =
       PredictRequest.newBuilder()
           .setEndpoint(
               EndpointName.ofProjectLocationEndpointName(
                       "[PROJECT]", "[LOCATION]", "[ENDPOINT]")
                   .toString())
           .addAllInstances(new ArrayList<Value>())
           .setParameters(Value.newBuilder().setBoolValue(true).build())
           .build();
   ApiFuture<PredictResponse> future =
       predictionServiceClient.predictCallable().futureCall(request);
   // Do something.
   PredictResponse response = future.get();
 }
 
Restituisce
Tipo Description
UnaryCallable<PredictRequest,PredictResponse>

rawPredict(EndpointName endpoint, HttpBody httpBody)

public final HttpBody rawPredict(EndpointName endpoint, HttpBody httpBody)

Eseguire una previsione online con un payload HTTP arbitrario.

La risposta include le seguenti intestazioni HTTP:

  • X-Vertex-AI-Endpoint-Id: ID dell'endpoint che ha fornito questa previsione.
  • X-Vertex-AI-Deployed-Model-Id: ID del modello DeployedModel dell'endpoint che ha pubblicato questa previsione.

Codice campione:


 // This snippet has been automatically generated and should be regarded as a code template only.
 // It will require modifications to work:
 // - It may require correct/in-range values for request initialization.
 // - It may require specifying regional endpoints when creating the service client as shown in
 // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
 try (PredictionServiceClient predictionServiceClient = PredictionServiceClient.create()) {
   EndpointName endpoint =
       EndpointName.ofProjectLocationEndpointName("[PROJECT]", "[LOCATION]", "[ENDPOINT]");
   HttpBody httpBody = HttpBody.newBuilder().build();
   HttpBody response = predictionServiceClient.rawPredict(endpoint, httpBody);
 }
 
Parametri
Nome Description
endpoint EndpointName

Obbligatorio. Il nome dell'endpoint di cui è stata richiesta la previsione. Formato: projects/{project}/locations/{location}/endpoints/{endpoint}

httpBody com.google.api.HttpBody

L'input di previsione. Supporta le intestazioni HTTP e il payload arbitrario di dati.

Un DeployedModel può avere un limite superiore al numero di istanze che supporta per ogni richiesta. Quando questo limite viene superato per un modello AutoML, il metodo RawPredict restituisce un errore. Quando questo limite viene superato per un modello con addestramento personalizzato, il comportamento varia in base al modello.

Puoi specificare lo schema per ogni istanza nel campo predict_schemata.instance_schema_uri quando crei un modello. Questo schema si applica quando esegui il deployment di Model come DeployedModel in un endpoint e utilizzi il metodo RawPredict.

Restituisce
Tipo Description
com.google.api.HttpBody

rawPredict(RawPredictRequest request)

public final HttpBody rawPredict(RawPredictRequest request)

Eseguire una previsione online con un payload HTTP arbitrario.

La risposta include le seguenti intestazioni HTTP:

  • X-Vertex-AI-Endpoint-Id: ID dell'endpoint che ha fornito questa previsione.
  • X-Vertex-AI-Deployed-Model-Id: ID del modello DeployedModel dell'endpoint che ha pubblicato questa previsione.

Codice campione:


 // This snippet has been automatically generated and should be regarded as a code template only.
 // It will require modifications to work:
 // - It may require correct/in-range values for request initialization.
 // - It may require specifying regional endpoints when creating the service client as shown in
 // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
 try (PredictionServiceClient predictionServiceClient = PredictionServiceClient.create()) {
   RawPredictRequest request =
       RawPredictRequest.newBuilder()
           .setEndpoint(
               EndpointName.ofProjectLocationEndpointName(
                       "[PROJECT]", "[LOCATION]", "[ENDPOINT]")
                   .toString())
           .setHttpBody(HttpBody.newBuilder().build())
           .build();
   HttpBody response = predictionServiceClient.rawPredict(request);
 }
 
Parametro
Nome Description
request RawPredictRequest

L'oggetto della richiesta contenente tutti i parametri per la chiamata API.

Restituisce
Tipo Description
com.google.api.HttpBody

rawPredict(String endpoint, HttpBody httpBody)

public final HttpBody rawPredict(String endpoint, HttpBody httpBody)

Eseguire una previsione online con un payload HTTP arbitrario.

La risposta include le seguenti intestazioni HTTP:

  • X-Vertex-AI-Endpoint-Id: ID dell'endpoint che ha fornito questa previsione.
  • X-Vertex-AI-Deployed-Model-Id: ID del modello DeployedModel dell'endpoint che ha pubblicato questa previsione.

Codice campione:


 // This snippet has been automatically generated and should be regarded as a code template only.
 // It will require modifications to work:
 // - It may require correct/in-range values for request initialization.
 // - It may require specifying regional endpoints when creating the service client as shown in
 // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
 try (PredictionServiceClient predictionServiceClient = PredictionServiceClient.create()) {
   String endpoint =
       EndpointName.ofProjectLocationEndpointName("[PROJECT]", "[LOCATION]", "[ENDPOINT]")
           .toString();
   HttpBody httpBody = HttpBody.newBuilder().build();
   HttpBody response = predictionServiceClient.rawPredict(endpoint, httpBody);
 }
 
Parametri
Nome Description
endpoint String

Obbligatorio. Il nome dell'endpoint di cui è stata richiesta la previsione. Formato: projects/{project}/locations/{location}/endpoints/{endpoint}

httpBody com.google.api.HttpBody

L'input di previsione. Supporta le intestazioni HTTP e il payload arbitrario di dati.

Un DeployedModel può avere un limite superiore al numero di istanze che supporta per ogni richiesta. Quando questo limite viene superato per un modello AutoML, il metodo RawPredict restituisce un errore. Quando questo limite viene superato per un modello con addestramento personalizzato, il comportamento varia in base al modello.

Puoi specificare lo schema per ogni istanza nel campo predict_schemata.instance_schema_uri quando crei un modello. Questo schema si applica quando esegui il deployment di Model come DeployedModel in un endpoint e utilizzi il metodo RawPredict.

Restituisce
Tipo Description
com.google.api.HttpBody

rawPredictCallable()

public final UnaryCallable<RawPredictRequest,HttpBody> rawPredictCallable()

Eseguire una previsione online con un payload HTTP arbitrario.

La risposta include le seguenti intestazioni HTTP:

  • X-Vertex-AI-Endpoint-Id: ID dell'endpoint che ha fornito questa previsione.
  • X-Vertex-AI-Deployed-Model-Id: ID del modello DeployedModel dell'endpoint che ha pubblicato questa previsione.

Codice campione:


 // This snippet has been automatically generated and should be regarded as a code template only.
 // It will require modifications to work:
 // - It may require correct/in-range values for request initialization.
 // - It may require specifying regional endpoints when creating the service client as shown in
 // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
 try (PredictionServiceClient predictionServiceClient = PredictionServiceClient.create()) {
   RawPredictRequest request =
       RawPredictRequest.newBuilder()
           .setEndpoint(
               EndpointName.ofProjectLocationEndpointName(
                       "[PROJECT]", "[LOCATION]", "[ENDPOINT]")
                   .toString())
           .setHttpBody(HttpBody.newBuilder().build())
           .build();
   ApiFuture<HttpBody> future = predictionServiceClient.rawPredictCallable().futureCall(request);
   // Do something.
   HttpBody response = future.get();
 }
 
Restituisce
Tipo Description
UnaryCallable<RawPredictRequest,com.google.api.HttpBody>

serverStreamingPredictCallable()

public final ServerStreamingCallable<StreamingPredictRequest,StreamingPredictResponse> serverStreamingPredictCallable()

Esegui una richiesta di previsione online di streaming lato server per i flussi di dati Vertex LLM.

Codice campione:


 // This snippet has been automatically generated and should be regarded as a code template only.
 // It will require modifications to work:
 // - It may require correct/in-range values for request initialization.
 // - It may require specifying regional endpoints when creating the service client as shown in
 // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
 try (PredictionServiceClient predictionServiceClient = PredictionServiceClient.create()) {
   StreamingPredictRequest request =
       StreamingPredictRequest.newBuilder()
           .setEndpoint(
               EndpointName.ofProjectLocationEndpointName(
                       "[PROJECT]", "[LOCATION]", "[ENDPOINT]")
                   .toString())
           .addAllInputs(new ArrayList<Tensor>())
           .setParameters(Tensor.newBuilder().build())
           .build();
   ServerStream<StreamingPredictResponse> stream =
       predictionServiceClient.serverStreamingPredictCallable().call(request);
   for (StreamingPredictResponse response : stream) {
     // Do something when a response is received.
   }
 }
 
Restituisce
Tipo Description
ServerStreamingCallable<StreamingPredictRequest,StreamingPredictResponse>

setIamPolicy(SetIamPolicyRequest request)

public final Policy setIamPolicy(SetIamPolicyRequest request)

Imposta il criterio di controllo dell'accesso sulla risorsa specificata. Sostituisce qualsiasi criterio esistente.

Può restituire errori NOT_FOUND, INVALID_ARGUMENT e PERMISSION_DENIED.

Codice campione:


 // This snippet has been automatically generated and should be regarded as a code template only.
 // It will require modifications to work:
 // - It may require correct/in-range values for request initialization.
 // - It may require specifying regional endpoints when creating the service client as shown in
 // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
 try (PredictionServiceClient predictionServiceClient = PredictionServiceClient.create()) {
   SetIamPolicyRequest request =
       SetIamPolicyRequest.newBuilder()
           .setResource(
               EndpointName.ofProjectLocationEndpointName(
                       "[PROJECT]", "[LOCATION]", "[ENDPOINT]")
                   .toString())
           .setPolicy(Policy.newBuilder().build())
           .setUpdateMask(FieldMask.newBuilder().build())
           .build();
   Policy response = predictionServiceClient.setIamPolicy(request);
 }
 
Parametro
Nome Description
request com.google.iam.v1.SetIamPolicyRequest

L'oggetto della richiesta contenente tutti i parametri per la chiamata API.

Restituisce
Tipo Description
com.google.iam.v1.Policy

setIamPolicyCallable()

public final UnaryCallable<SetIamPolicyRequest,Policy> setIamPolicyCallable()

Imposta il criterio di controllo dell'accesso sulla risorsa specificata. Sostituisce qualsiasi criterio esistente.

Può restituire errori NOT_FOUND, INVALID_ARGUMENT e PERMISSION_DENIED.

Codice campione:


 // This snippet has been automatically generated and should be regarded as a code template only.
 // It will require modifications to work:
 // - It may require correct/in-range values for request initialization.
 // - It may require specifying regional endpoints when creating the service client as shown in
 // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
 try (PredictionServiceClient predictionServiceClient = PredictionServiceClient.create()) {
   SetIamPolicyRequest request =
       SetIamPolicyRequest.newBuilder()
           .setResource(
               EndpointName.ofProjectLocationEndpointName(
                       "[PROJECT]", "[LOCATION]", "[ENDPOINT]")
                   .toString())
           .setPolicy(Policy.newBuilder().build())
           .setUpdateMask(FieldMask.newBuilder().build())
           .build();
   ApiFuture<Policy> future = predictionServiceClient.setIamPolicyCallable().futureCall(request);
   // Do something.
   Policy response = future.get();
 }
 
Restituisce
Tipo Description
UnaryCallable<com.google.iam.v1.SetIamPolicyRequest,com.google.iam.v1.Policy>

stop()

public void shutdown()

stopNow()

public void shutdownNow()

streamDirectPredictCallable()

public final BidiStreamingCallable<StreamDirectPredictRequest,StreamDirectPredictResponse> streamDirectPredictCallable()

Esegui una richiesta di previsione online di flussi di dati a un server del modello gRPC per prodotti e framework proprietari Vertex.

Codice campione:


 // This snippet has been automatically generated and should be regarded as a code template only.
 // It will require modifications to work:
 // - It may require correct/in-range values for request initialization.
 // - It may require specifying regional endpoints when creating the service client as shown in
 // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
 try (PredictionServiceClient predictionServiceClient = PredictionServiceClient.create()) {
   BidiStream<StreamDirectPredictRequest, StreamDirectPredictResponse> bidiStream =
       predictionServiceClient.streamDirectPredictCallable().call();
   StreamDirectPredictRequest request =
       StreamDirectPredictRequest.newBuilder()
           .setEndpoint(
               EndpointName.ofProjectLocationEndpointName(
                       "[PROJECT]", "[LOCATION]", "[ENDPOINT]")
                   .toString())
           .addAllInputs(new ArrayList<Tensor>())
           .setParameters(Tensor.newBuilder().build())
           .build();
   bidiStream.send(request);
   for (StreamDirectPredictResponse response : bidiStream) {
     // Do something when a response is received.
   }
 }
 
Restituisce
Tipo Description
BidiStreamingCallable<StreamDirectPredictRequest,StreamDirectPredictResponse>

streamDirectRawPredictCallable()

public final BidiStreamingCallable<StreamDirectRawPredictRequest,StreamDirectRawPredictResponse> streamDirectRawPredictCallable()

Eseguire una richiesta di previsione online di flussi di dati a un server del modello gRPC per i container personalizzati.

Codice campione:


 // This snippet has been automatically generated and should be regarded as a code template only.
 // It will require modifications to work:
 // - It may require correct/in-range values for request initialization.
 // - It may require specifying regional endpoints when creating the service client as shown in
 // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
 try (PredictionServiceClient predictionServiceClient = PredictionServiceClient.create()) {
   BidiStream<StreamDirectRawPredictRequest, StreamDirectRawPredictResponse> bidiStream =
       predictionServiceClient.streamDirectRawPredictCallable().call();
   StreamDirectRawPredictRequest request =
       StreamDirectRawPredictRequest.newBuilder()
           .setEndpoint(
               EndpointName.ofProjectLocationEndpointName(
                       "[PROJECT]", "[LOCATION]", "[ENDPOINT]")
                   .toString())
           .setMethodName("methodName-723163380")
           .setInput(ByteString.EMPTY)
           .build();
   bidiStream.send(request);
   for (StreamDirectRawPredictResponse response : bidiStream) {
     // Do something when a response is received.
   }
 }
 
Restituisce
Tipo Description
BidiStreamingCallable<StreamDirectRawPredictRequest,StreamDirectRawPredictResponse>

streamGenerateContentCallable()

public final ServerStreamingCallable<GenerateContentRequest,GenerateContentResponse> streamGenerateContentCallable()

Genera contenuti con input multimodali con supporto per lo streaming.

Codice campione:


 // This snippet has been automatically generated and should be regarded as a code template only.
 // It will require modifications to work:
 // - It may require correct/in-range values for request initialization.
 // - It may require specifying regional endpoints when creating the service client as shown in
 // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
 try (PredictionServiceClient predictionServiceClient = PredictionServiceClient.create()) {
   GenerateContentRequest request =
       GenerateContentRequest.newBuilder()
           .setModel("model104069929")
           .addAllContents(new ArrayList<Content>())
           .setSystemInstruction(Content.newBuilder().build())
           .addAllTools(new ArrayList<Tool>())
           .addAllSafetySettings(new ArrayList<SafetySetting>())
           .setGenerationConfig(GenerationConfig.newBuilder().build())
           .build();
   ServerStream<GenerateContentResponse> stream =
       predictionServiceClient.streamGenerateContentCallable().call(request);
   for (GenerateContentResponse response : stream) {
     // Do something when a response is received.
   }
 }
 
Restituisce
Tipo Description
ServerStreamingCallable<GenerateContentRequest,GenerateContentResponse>

streamRawPredictCallable()

public final ServerStreamingCallable<StreamRawPredictRequest,HttpBody> streamRawPredictCallable()

Eseguire una previsione online in modalità flusso con un payload HTTP arbitrario.

Codice campione:


 // This snippet has been automatically generated and should be regarded as a code template only.
 // It will require modifications to work:
 // - It may require correct/in-range values for request initialization.
 // - It may require specifying regional endpoints when creating the service client as shown in
 // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
 try (PredictionServiceClient predictionServiceClient = PredictionServiceClient.create()) {
   StreamRawPredictRequest request =
       StreamRawPredictRequest.newBuilder()
           .setEndpoint(
               EndpointName.ofProjectLocationEndpointName(
                       "[PROJECT]", "[LOCATION]", "[ENDPOINT]")
                   .toString())
           .setHttpBody(HttpBody.newBuilder().build())
           .build();
   ServerStream<HttpBody> stream =
       predictionServiceClient.streamRawPredictCallable().call(request);
   for (HttpBody response : stream) {
     // Do something when a response is received.
   }
 }
 
Restituisce
Tipo Description
ServerStreamingCallable<StreamRawPredictRequest,com.google.api.HttpBody>

streamingPredictCallable()

public final BidiStreamingCallable<StreamingPredictRequest,StreamingPredictResponse> streamingPredictCallable()

Esegui una richiesta di previsione online di streaming per prodotti e framework proprietari di Vertex.

Codice campione:


 // This snippet has been automatically generated and should be regarded as a code template only.
 // It will require modifications to work:
 // - It may require correct/in-range values for request initialization.
 // - It may require specifying regional endpoints when creating the service client as shown in
 // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
 try (PredictionServiceClient predictionServiceClient = PredictionServiceClient.create()) {
   BidiStream<StreamingPredictRequest, StreamingPredictResponse> bidiStream =
       predictionServiceClient.streamingPredictCallable().call();
   StreamingPredictRequest request =
       StreamingPredictRequest.newBuilder()
           .setEndpoint(
               EndpointName.ofProjectLocationEndpointName(
                       "[PROJECT]", "[LOCATION]", "[ENDPOINT]")
                   .toString())
           .addAllInputs(new ArrayList<Tensor>())
           .setParameters(Tensor.newBuilder().build())
           .build();
   bidiStream.send(request);
   for (StreamingPredictResponse response : bidiStream) {
     // Do something when a response is received.
   }
 }
 
Restituisce
Tipo Description
BidiStreamingCallable<StreamingPredictRequest,StreamingPredictResponse>

streamingRawPredictCallable()

public final BidiStreamingCallable<StreamingRawPredictRequest,StreamingRawPredictResponse> streamingRawPredictCallable()

Eseguire una richiesta di previsione online di flussi di dati tramite gRPC.

Codice campione:


 // This snippet has been automatically generated and should be regarded as a code template only.
 // It will require modifications to work:
 // - It may require correct/in-range values for request initialization.
 // - It may require specifying regional endpoints when creating the service client as shown in
 // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
 try (PredictionServiceClient predictionServiceClient = PredictionServiceClient.create()) {
   BidiStream<StreamingRawPredictRequest, StreamingRawPredictResponse> bidiStream =
       predictionServiceClient.streamingRawPredictCallable().call();
   StreamingRawPredictRequest request =
       StreamingRawPredictRequest.newBuilder()
           .setEndpoint(
               EndpointName.ofProjectLocationEndpointName(
                       "[PROJECT]", "[LOCATION]", "[ENDPOINT]")
                   .toString())
           .setMethodName("methodName-723163380")
           .setInput(ByteString.EMPTY)
           .build();
   bidiStream.send(request);
   for (StreamingRawPredictResponse response : bidiStream) {
     // Do something when a response is received.
   }
 }
 
Restituisce
Tipo Description
BidiStreamingCallable<StreamingRawPredictRequest,StreamingRawPredictResponse>

testIamPermissions(TestIamPermissionsRequest request)

public final TestIamPermissionsResponse testIamPermissions(TestIamPermissionsRequest request)

Restituisce le autorizzazioni di cui un chiamante dispone per la risorsa specificata. Se la risorsa non esiste, verrà restituito un set di autorizzazioni vuoto, non un errore NOT_FOUND.

Nota: questa operazione è progettata per essere utilizzata per UI e strumenti a riga di comando che supportano la creazione di autorizzazioni, non per il controllo delle autorizzazioni. Questa operazione potrebbe non riuscire ad aprirsi senza avviso.

Codice campione:


 // This snippet has been automatically generated and should be regarded as a code template only.
 // It will require modifications to work:
 // - It may require correct/in-range values for request initialization.
 // - It may require specifying regional endpoints when creating the service client as shown in
 // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
 try (PredictionServiceClient predictionServiceClient = PredictionServiceClient.create()) {
   TestIamPermissionsRequest request =
       TestIamPermissionsRequest.newBuilder()
           .setResource(
               EndpointName.ofProjectLocationEndpointName(
                       "[PROJECT]", "[LOCATION]", "[ENDPOINT]")
                   .toString())
           .addAllPermissions(new ArrayList<String>())
           .build();
   TestIamPermissionsResponse response = predictionServiceClient.testIamPermissions(request);
 }
 
Parametro
Nome Description
request com.google.iam.v1.TestIamPermissionsRequest

L'oggetto della richiesta contenente tutti i parametri per la chiamata API.

Restituisce
Tipo Description
com.google.iam.v1.TestIamPermissionsResponse

testIamPermissionsCallable()

public final UnaryCallable<TestIamPermissionsRequest,TestIamPermissionsResponse> testIamPermissionsCallable()

Restituisce le autorizzazioni di cui un chiamante dispone per la risorsa specificata. Se la risorsa non esiste, verrà restituito un set di autorizzazioni vuoto, non un errore NOT_FOUND.

Nota: questa operazione è progettata per essere utilizzata per UI e strumenti a riga di comando che supportano la creazione di autorizzazioni, non per il controllo delle autorizzazioni. Questa operazione potrebbe non riuscire ad aprirsi senza avviso.

Codice campione:


 // This snippet has been automatically generated and should be regarded as a code template only.
 // It will require modifications to work:
 // - It may require correct/in-range values for request initialization.
 // - It may require specifying regional endpoints when creating the service client as shown in
 // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
 try (PredictionServiceClient predictionServiceClient = PredictionServiceClient.create()) {
   TestIamPermissionsRequest request =
       TestIamPermissionsRequest.newBuilder()
           .setResource(
               EndpointName.ofProjectLocationEndpointName(
                       "[PROJECT]", "[LOCATION]", "[ENDPOINT]")
                   .toString())
           .addAllPermissions(new ArrayList<String>())
           .build();
   ApiFuture<TestIamPermissionsResponse> future =
       predictionServiceClient.testIamPermissionsCallable().futureCall(request);
   // Do something.
   TestIamPermissionsResponse response = future.get();
 }
 
Restituisce
Tipo Description
UnaryCallable<com.google.iam.v1.TestIamPermissionsRequest,com.google.iam.v1.TestIamPermissionsResponse>