Diese Seite wurde von der Cloud Translation API übersetzt.

KRM API prediction.aiplatform.gdc.goog/v1

prediction.aiplatform.gdc.goog/v1

Das Paket v1 enthält API-Schemadefinitionen für die API-Gruppe „prediction.aiplatform.gdc.goog“ v1.

Autoscaling

Definiert die Autoscaling-Parameter für ein Deployment.

Wird angezeigt in:

DedicatedResources

Feld	Beschreibung
`minReplica` Ganzzahl	Mindestanzahl von Replikaten. Der Standardwert ist `1`. Das nächste Tag ist `5`.
`maxReplica` Ganzzahl	Maximale Anzahl von Replikaten.
`cpuTarget` Ganzzahl	Der Schwellenwert der CPU-Auslastung für die Hochskalierung eines Pods.
`gpuDutyCycleTarget` Ganzzahl	Der Grenzwert für die GPU-Arbeitszyklusauslastung für das Hochskalieren eines Pods.

DedicatedResources

Definiert die Ressourcen, die einem Ressourcenpool zugewiesen sind. Die nächste ID ist 8.

Wird angezeigt in:

ResourcePoolSpec

Feld	Beschreibung
`machineSpec`	Nicht erforderlich. Gibt die Konfiguration einer einzelnen Maschine mit dem Wert `machineType` an. Wenn kein Wert angegeben wird, wird ein Standardwert verwendet. Für die Vorhersage ist der Standardmaschinentyp für eine Bereitstellung `n1-standard-2` (GKE-basierte Modelle) oder `n2-standard-2-gdc` (CPU-basierte Modelle).
`autoscaling` Autoscaling	Gibt die Autoscaling-Parameter für die Nutzerarbeitslasten an, z. B. die Vorhersagebereitstellung für die Vorhersage.

DeployedModel

Definiert das Schema für die DeployedModels API.

Wird angezeigt in:

DeployedModelList

Feld	Beschreibung
`apiVersion` String	`prediction.aiplatform.gdc.goog/v1`
`kind` String	`DeployedModel`
`metadata` ObjectMeta	Informationen zu den Feldern von `metadata` finden Sie in der Dokumentation zur Kubernetes API.
`spec` DeployedModelSpec
`status` DeployedModelStatus

DeployedModelList

Enthält eine Liste von DeployedModel-Ressourcen.

Feld	Beschreibung
`apiVersion` String	`prediction.aiplatform.gdc.goog/v1`
`kind` String	`DeployedModelList`
`metadata` ListMeta	Informationen zu den Feldern von `metadata` finden Sie in der Dokumentation zur Kubernetes API.
`items` DeployedModel-Array

DeployedModelSpec

Definiert den erwarteten Status von DeployedModel-Ressourcen.

Wird angezeigt in:

DeployedModel

Feld	Beschreibung
`endpointPath` String	Gibt den Ressourcennamen des Endpunkts an. Das Format dafür ist `projects/{project}/locations/{location}/endpoints/{endpoint-id}`. Das nächste Tag ist `6`.
`modelSpec` Ungültiger Typ	Definiert die Modellspezifikation, die für die Bereitstellung des Modells erforderlich ist.
`resourcePoolRef` ObjectReference	Gibt die Referenz des Ressourcenpools mit den für diese `DeployedModel` erforderlichen Ressourcenspezifikationen an.
`sharesResourcePool` boolean	Gibt an, ob die `DeployedModel` einen Ressourcenpool mit anderen Modellen teilt.

DeployedModelStatus

Definiert den beobachteten Status der Ressource DeployedModel.

Wird angezeigt in:

DeployedModel

Feld	Beschreibung
`ready` boolean	Gibt an, ob sich die Ressource im Status „Bereit“ befindet.
`primaryCondition`	Stellt den primären Zustand einer Ressource dar. Wenn die Ressource bereit ist, wird dies durch die Bedingung angegeben. Andernfalls ist die Bedingung der primäre Grund dafür, dass die Ressource nicht bereit ist.
`resourceConditions` Array	Stellt eine Sammlung von Bedingungen für eine Ressource und ihre untergeordneten Ressourcen dar. Damit können Sie den Allgemeinzustand einer Ressource und ihrer Unterressourcen ermitteln.
`conditions` Condition-Array	Stellt Rohressourcenbedingungen dar, die aus Kubernetes-Ressourcen zu Debugging-Zwecken abgeleitet werden.
`routes` Routen	Stellt die Container- oder Systemrouten für die Vorhersage oder Systemdiagnose des bereitgestellten Modells dar.
`ports` Ports	Stellt die HTTP- oder gRPC-Ports des Containers dar.
`rpcStatus` RpcStatus	Gibt eine kanonische RPC-Darstellung der primären Bedingung des bereitgestellten Modells an.
`observedGeneration` Ganzzahl	Gibt die Version der Ressource an, die zuletzt abgeglichen wurde.

Ports

Wird angezeigt in:

DeployedModelStatus

Feld	Beschreibung
`predictorPorts` Ganzzahl-Array	Listet die HTTP-Ports auf, die vom Predictor verfügbar gemacht werden sollen. Anfragen werden nicht an andere Ports als den ersten in der Liste weitergeleitet. Dieses Feld entspricht dem Feld `ports` der v1 core API für Kubernetes-Container.
`predictorGRPCPorts` Ganzzahl-Array	Hier werden die gRPC-Ports aufgeführt, die vom Predictor verfügbar gemacht werden sollen. Wenn dieses Feld ausgelassen wird, sind die gRPC-Anfragen an den Container deaktiviert. Anfragen werden nicht an andere Ports als den ersten in der Liste weitergeleitet. Dieses Feld entspricht dem Feld `ports` der v1 core API für Kubernetes-Container.

ReplicaStatus

Definiert die Replikatinformationen der ResourcePool-Ressource.

Wird angezeigt in:

ResourcePoolStatus

Feld	Beschreibung
`resourceType` ResourceType	Gibt den Typ der Ressource an.
`resourceName` String	Gibt den eindeutigen Ressourcennamen im Namespace des Ressourcentyps an. Ein `Deployment` `ResourceType` hat beispielsweise den Namen des Kubernetes-Deployments als Ressourcennamen.
`resourceNamespace` String	Gibt den Namespace der Ressource an. Dieses Feld gilt nicht für Ressourcen mit Clusterbereich.
`appType` String	Gibt den Anwendungstyp der Ressource an, der durch ein bestimmtes Produkt definiert wird. In Prediction werden beispielsweise `predictor` und `explainer` als `appType` unterstützt.
`availableReplicas` Ganzzahl	Gibt die Gesamtzahl der verfügbaren Replikate an. Für den Kubernetes-Bereitstellungsressourcentyp steht dieses Feld für die Gesamtzahl der verfügbaren Pods, die mindestens die Mindestanzahl an Sekunden bereit sind und auf die diese Bereitstellung ausgerichtet ist.
`unavailableReplicas` Ganzzahl	Gibt die Gesamtzahl der nicht verfügbaren Replikate an. Für den Kubernetes-Deployment-Ressourcentyp steht er für die Gesamtzahl der nicht verfügbaren Pods, auf die das Deployment ausgerichtet ist.

Ressourcenpool

Definiert das Schema für die ResourcePools API.

Wird angezeigt in:

ResourcePoolList

Feld	Beschreibung
`apiVersion` String	`prediction.aiplatform.gdc.goog/v1`
`kind` String	`ResourcePool`
`metadata` ObjectMeta	Informationen zu den Feldern von `metadata` finden Sie in der Dokumentation zur Kubernetes API.
`spec` ResourcePoolSpec
`status` ResourcePoolStatus

ResourcePoolList

Enthält eine Liste von ResourcePool-Ressourcen.

Feld	Beschreibung
`apiVersion` String	`prediction.aiplatform.gdc.goog/v1`
`kind` String	`ResourcePoolList`
`metadata` ListMeta	Informationen zu den Feldern von `metadata` finden Sie in der Dokumentation zur Kubernetes API.
`items` ResourcePool-Array

ResourcePoolSpec

Definiert den erwarteten Status von ResourcePool-Ressourcen.

Wird angezeigt in:

ResourcePool

Feld	Beschreibung
`resourcePoolID` String	Stellt die vom System generierte ID der `ResourcePool`-Ressource dar. Dieses Feld ist nur für Google Cloud und GDCE relevant. Das nächste Tag ist `8`.
`userProvidedID` String	Stellt die vom Nutzer angegebene ID der `ResourcePool`-Ressource dar. Dieses Feld ist nur für Google Cloud und GDCE relevant.
`dedicatedResources` DedicatedResources	Enthält eine Beschreibung der Ressourcen, die dem Ressourcenpool zugewiesen sind.
`enableContainerLogging` boolean	Gibt an, ob das Container-Logging für `ResourcePool` aktiviert ist.
`userGsa` String	Gibt das vom Nutzer bereitgestellte IAM-Dienstkonto im Nutzerprojekt an. Wenn nicht angegeben, wird das Standarddienstkonto für die Bereitstellung verwendet.
`customKsaName` String	Gibt den benutzerdefinierten Namen an, den der Operator erstellt und den die Nutzerarbeitslast nur für BYOSA-Fälle (Bring Your Own Service Account) verwendet. Wenn leer, verwendet das System das Standardbenennungsmuster.
`rolloutStrategy` Ungültiger Typ	Gibt an, ob Modelle, die für diesen Pool bereitgestellt werden, nach und nach oder gleichzeitig auf die Modellserverrepliken ausgerollt werden müssen.

ResourcePoolStatus

Definiert den beobachteten Status von ResourcePool-Ressourcen.

Wird angezeigt in:

ResourcePool

Feld	Beschreibung
`ready` boolean	Gibt an, ob sich die Ressource im Status „Bereit“ befindet.
`primaryCondition`	Stellt den primären Zustand einer Ressource dar. Wenn die Ressource bereit ist, wird dies durch die Bedingung angegeben. Andernfalls ist die Bedingung der primäre Grund dafür, dass die Ressource nicht bereit ist.
`resourceConditions`	Stellt eine Sammlung von Bedingungen für eine Ressource und ihre untergeordneten Ressourcen dar. Damit können Sie den Allgemeinzustand einer Ressource und ihrer Unterressourcen ermitteln.
`conditions` Condition-Array	Stellt Rohressourcenbedingungen dar, die aus Kubernetes-Ressourcen zu Debugging-Zwecken abgeleitet werden.
`replicaStatuses` ReplicaStatus-Array
`rpcStatus` RpcStatus	Gibt eine kanonische RPC-Darstellung der primären Bedingung des ResourcePool an.
`observedGeneration` Ganzzahl	Gibt an, welche Version der Ressource zuletzt abgeglichen wurde.

Routen

Wird angezeigt in:

DeployedModelStatus

Feld	Beschreibung
`predictRoute` String	Stellt den Routingpfad im Container dar, an den Vorhersageanfragen gesendet werden. Vertex AI leitet Anfragen mit `projects.locations.endpoints.predict` an diesen Pfad über die IP-Adresse und den Port des Containers weiter. Vertex AI gibt dann die Antwort des Containers in der API-Antwort zurück.
`predictSystemRoute` String	Stellt den Systemroutingpfad dar, über den Vorhersageanfragen an den Cluster-Ingress gesendet werden. Dieses Feld wird intern nur ausgefüllt, wenn es während der Bereitstellung in `deployedModel` kopiert wird.
`healthRoute` String	Stellt den Routingpfad im Container dar, an den Systemdiagnosen gesendet werden sollen. Vertex AI sendet gelegentlich GET-Anfragen an diesen Pfad über die IP-Adresse und den Port des Containers, um zu prüfen, ob der Container fehlerfrei ist.
`healthSystemRoute` String	Stellt den Systemroutingpfad dar, über den Systemdiagnoseanfragen an den Cluster-Ingress gesendet werden. Dieses Feld wird intern nur ausgefüllt, wenn es während der Bereitstellung in `deployedModel` kopiert wird.

RpcStatus

Kapselt einen RPC-Code und eine Nachricht.

Wird angezeigt in:

DeployedModelStatus

Feld	Beschreibung
`code` Code	Stellt den RPC-Code dar. Das nächste Tag ist `4`.
`message` String	Enthält eine für Nutzer sichtbare Beschreibung der Bedingung.
`terminalState` boolean	Gibt den Wert `true` an, wenn die Ressource einen Endstatus erreicht hat und nicht bereit werden kann.