Questa pagina è stata tradotta dall'API Cloud Translation.

KRM API prediction.aiplatform.gdc.goog/v1

prediction.aiplatform.gdc.goog/v1

Il pacchetto v1 contiene definizioni dello schema API per il gruppo di API v1 di prediction.aiplatform.gdc.goog.

Scalabilità automatica

Definisce i parametri di scalabilità automatica per un deployment.

Appare in:

DedicatedResources

Campo	Descrizione
`minReplica` integer	Numero minimo di repliche. Il valore predefinito è `1`. Il tag successivo è `5`.
`maxReplica` integer	Numero massimo di repliche.
`cpuTarget` integer	La soglia di utilizzo della CPU per lo scale up di un pod.
`gpuDutyCycleTarget` integer	La soglia di utilizzo del ciclo di servizio della GPU per lo scale up di un pod.

DedicatedResources

Definisce le risorse dedicate a un pool di risorse. Il prossimo ID è 8.

Appare in:

ResourcePoolSpec

Campo	Descrizione
`machineSpec`	Non obbligatorio. Specifica la configurazione di una singola macchina utilizzando il valore `machineType`. Se non viene fornito, viene utilizzato un valore predefinito. Per la previsione, il tipo di macchina predefinito per un deployment è `n1-standard-2` (modelli basati su GKE) o `n2-standard-2-gdc` (modelli basati su CPU).
`autoscaling` Scalabilità automatica	Specifica i parametri di scalabilità automatica per i carichi di lavoro degli utenti, ad esempio il deployment del predittore per la previsione.

DeployedModel

Definisce lo schema per l'API DeployedModels.

Appare in:

DeployedModelList

Campo	Descrizione
`apiVersion` stringa	`prediction.aiplatform.gdc.goog/v1`
`kind` stringa	`DeployedModel`
`metadata` ObjectMeta	Per i campi di `metadata`, consulta la documentazione dell'API Kubernetes.
`spec` DeployedModelSpec
`status` DeployedModelStatus

DeployedModelList

Contiene un elenco di risorse DeployedModel.

Campo	Descrizione
`apiVersion` stringa	`prediction.aiplatform.gdc.goog/v1`
`kind` stringa	`DeployedModelList`
`metadata` ListMeta	Per i campi di `metadata`, consulta la documentazione dell'API Kubernetes.
`items` Array DeployedModel

DeployedModelSpec

Definisce lo stato previsto delle risorse DeployedModel.

Appare in:

DeployedModel

Campo	Descrizione
`endpointPath` stringa	Specifica il nome della risorsa dell'endpoint. Il formato è `projects/{project}/locations/{location}/endpoints/{endpoint-id}`. Il tag successivo è `6`.
`modelSpec` tipo non valido	Definisce la specifica del modello necessaria per il deployment.
`resourcePoolRef` ObjectReference	Specifica il riferimento del pool di risorse con le specifiche delle risorse richieste per questo `DeployedModel`.
`sharesResourcePool` boolean	Specifica se `DeployedModel` condivide un pool di risorse con altri modelli.

DeployedModelStatus

Definisce lo stato osservato della risorsa DeployedModel.

Appare in:

DeployedModel

Campo	Descrizione
`ready` boolean	Indica se la risorsa è in stato pronto.
`primaryCondition`	Rappresenta la condizione principale di una risorsa. Se la risorsa è pronta, la condizione indica che la risorsa è pronta. In caso contrario, la condizione è il motivo principale per cui la risorsa non è pronta.
`resourceConditions` array	Rappresenta una raccolta di condizioni per una risorsa e le relative risorse secondarie. Puoi utilizzarlo per determinare lo stato generale di una risorsa e delle relative risorse secondarie.
`conditions` Array Condition	Rappresenta le condizioni delle risorse non elaborate compilate dalle risorse Kubernetes a scopo di debug.
`routes` Route	Rappresenta le route del container o del sistema per la previsione o il controllo di integrità del modello di cui è stato eseguito il deployment.
`ports` Porte	Rappresenta le porte HTTP o gRPC del container.
`rpcStatus` RpcStatus	Indica una rappresentazione RPC canonica della condizione principale del modello di cui è stato eseguito il deployment.
`observedGeneration` integer	Indica la revisione della risorsa riconciliata più di recente.

Porte

Appare in:

DeployedModelStatus

Campo	Descrizione
`predictorPorts` array di numeri interi	Elenca le porte HTTP da esporre dal predittore. Le richieste non vengono inoltrate a porte diverse dalla prima elencata. Questo campo corrisponde al campo `ports` dell'API principale v1 di Kubernetes Containers.
`predictorGRPCPorts` array di numeri interi	Elenca le porte gRPC da esporre dal predittore. Se questo campo viene omesso, le richieste gRPC al contenitore vengono disattivate. Le richieste non vengono inoltrate a porte diverse dalla prima elencata. Questo campo corrisponde al campo `ports` dell'API principale v1 di Kubernetes Containers.

ReplicaStatus

Definisce le informazioni sulla replica della risorsa ResourcePool.

Appare in:

ResourcePoolStatus

Campo	Descrizione
`resourceType` ResourceType	Specifica il tipo di risorsa.
`resourceName` stringa	Indica il nome univoco della risorsa nello spazio dei nomi del tipo di risorsa. Ad esempio, un `Deployment` `ResourceType` ha il nome del deployment Kubernetes come nome della risorsa.
`resourceNamespace` stringa	Indica lo spazio dei nomi della risorsa. Questo campo non è applicabile alle risorse con ambito cluster.
`appType` stringa	Indica il tipo di applicazione della risorsa, definito da un prodotto specifico. Ad esempio, Prediction supporta `predictor` e `explainer` come `appType`.
`availableReplicas` integer	Indica il numero totale di repliche disponibili. Per il tipo di risorsa di deployment Kubernetes, questo campo rappresenta il numero totale di pod disponibili, pronti per almeno un numero minimo di secondi, a cui è destinato questo deployment.
`unavailableReplicas` integer	Indica il numero totale di repliche non disponibili. Per il tipo di risorsa di deployment Kubernetes, rappresenta il numero totale di pod non disponibili a cui è destinato il deployment.

ResourcePool

Definisce lo schema per l'API ResourcePools.

Appare in:

ResourcePoolList

Campo	Descrizione
`apiVersion` stringa	`prediction.aiplatform.gdc.goog/v1`
`kind` stringa	`ResourcePool`
`metadata` ObjectMeta	Per i campi di `metadata`, consulta la documentazione dell'API Kubernetes.
`spec` ResourcePoolSpec
`status` ResourcePoolStatus

ResourcePoolList

Contiene un elenco di risorse ResourcePool.

Campo	Descrizione
`apiVersion` stringa	`prediction.aiplatform.gdc.goog/v1`
`kind` stringa	`ResourcePoolList`
`metadata` ListMeta	Per i campi di `metadata`, consulta la documentazione dell'API Kubernetes.
`items` Array ResourcePool

ResourcePoolSpec

Definisce lo stato previsto delle risorse ResourcePool.

Appare in:

ResourcePool

Campo	Descrizione
`resourcePoolID` stringa	Rappresenta l'ID generato dal sistema della risorsa `ResourcePool`. Questo campo è applicabile solo a Google Cloud e GDCE. Il tag successivo è `8`.
`userProvidedID` stringa	Rappresenta l'ID fornito dall'utente della risorsa `ResourcePool`. Questo campo è applicabile solo a Google Cloud e GDCE.
`dedicatedResources` DedicatedResources	Contiene una descrizione delle risorse dedicate al pool di risorse.
`enableContainerLogging` boolean	Indica se la registrazione dei container è abilitata per `ResourcePool`.
`userGsa` stringa	Indica il account di servizio IAM fornito dall'utente nel progetto utente. Se non specificato, viene utilizzato il service account di servizio predefinito.
`customKsaName` stringa	Specifica il nome personalizzato creato dall'operatore e utilizzato dal workload utente solo per i casi di Bring your own account di servizio (BYOSA). Se è vuoto, il sistema utilizza il pattern di denominazione predefinito.
`rolloutStrategy` tipo non valido	Specifica se i modelli di cui è stato eseguito il deployment in questo pool devono essere implementati gradualmente o tutti contemporaneamente nelle repliche del server dei modelli.

ResourcePoolStatus

Definisce lo stato osservato delle risorse ResourcePool.

Appare in:

ResourcePool

Campo	Descrizione
`ready` boolean	Indica se la risorsa è in stato pronto.
`primaryCondition`	Rappresenta la condizione principale di una risorsa. Se la risorsa è pronta, la condizione indica che la risorsa è pronta. In caso contrario, la condizione è il motivo principale per cui la risorsa non è pronta.
`resourceConditions`	Rappresenta una raccolta di condizioni per una risorsa e le relative risorse secondarie. Puoi utilizzarlo per determinare lo stato generale di una risorsa e delle relative risorse secondarie.
`conditions` Array Condition	Rappresenta le condizioni delle risorse non elaborate compilate dalle risorse Kubernetes a scopo di debug.
`replicaStatuses` Array ReplicaStatus
`rpcStatus` RpcStatus	Indica una rappresentazione RPC canonica della condizione principale di ResourcePool.
`observedGeneration` integer	Indica l'ultima revisione della risorsa riconciliata.

Route

Appare in:

DeployedModelStatus

Campo	Descrizione
`predictRoute` stringa	Rappresenta il percorso di routing sul container per inviare le richieste di previsione. Vertex AI inoltra le richieste utilizzando `projects.locations.endpoints.predict` a questo percorso sull'indirizzo IP e sulla porta del container. Vertex AI restituisce quindi la risposta del contenitore nella risposta dell'API.
`predictSystemRoute` stringa	Rappresenta il percorso di routing del sistema per inviare richieste di previsione all'ingresso del cluster. Questo campo viene compilato internamente solo quando viene copiato in `deployedModel` durante l'implementazione.
`healthRoute` stringa	Rappresenta il percorso di routing sul container per inviare i controlli di integrità. Vertex AI invia a intermittenza richieste GET a questo percorso sull'indirizzo IP e sulla porta del container per verificare che il container sia integro.
`healthSystemRoute` stringa	Rappresenta il percorso di routing del sistema per inviare richieste di controllo di integrità all'ingresso del cluster. Questo campo viene compilato internamente solo quando viene copiato in `deployedModel` durante l'implementazione.

RpcStatus

Contiene un codice RPC e un messaggio.

Appare in:

DeployedModelStatus

Campo	Descrizione
`code` Codice	Rappresenta il codice RPC. Il tag successivo è `4`.
`message` stringa	Contiene una descrizione della condizione rivolta all'utente.
`terminalState` boolean	Indica un valore di `true` se la risorsa ha raggiunto uno stato terminale e non può diventare pronta.