KRM API prediction.aiplatform.gdc.goog/v1

prediction.aiplatform.gdc.goog/v1

Das Paket v1 enthält API-Schemadefinitionen für die API-Gruppe „prediction.aiplatform.gdc.goog“ v1.

Autoscaling

Definiert die Autoscaling-Parameter für ein Deployment.

Wird angezeigt in:

Feld Beschreibung
minReplica Ganzzahl Mindestanzahl von Replikaten. Der Standardwert ist 1. Das nächste Tag ist 5.
maxReplica Ganzzahl Maximale Anzahl von Replikaten.
cpuTarget Ganzzahl Der Schwellenwert der CPU-Auslastung für die Hochskalierung eines Pods.
gpuDutyCycleTarget Ganzzahl Der Grenzwert für die GPU-Arbeitszyklusauslastung für das Hochskalieren eines Pods.

DedicatedResources

Definiert die Ressourcen, die einem Ressourcenpool zugewiesen sind. Die nächste ID ist 8.

Wird angezeigt in:

Feld Beschreibung
machineSpec Nicht erforderlich. Gibt die Konfiguration einer einzelnen Maschine mit dem Wert machineType an. Wenn kein Wert angegeben wird, wird ein Standardwert verwendet. Für die Vorhersage ist der Standardmaschinentyp für eine Bereitstellung n1-standard-2 (GKE-basierte Modelle) oder n2-standard-2-gdc (CPU-basierte Modelle).
autoscaling Autoscaling Gibt die Autoscaling-Parameter für die Nutzerarbeitslasten an, z. B. die Vorhersagebereitstellung für die Vorhersage.

DeployedModel

Definiert das Schema für die DeployedModels API.

Wird angezeigt in:

Feld Beschreibung
apiVersion String prediction.aiplatform.gdc.goog/v1
kind String DeployedModel
metadata ObjectMeta Informationen zu den Feldern von metadata finden Sie in der Dokumentation zur Kubernetes API.
spec DeployedModelSpec
status DeployedModelStatus

DeployedModelList

Enthält eine Liste von DeployedModel-Ressourcen.

Feld Beschreibung
apiVersion String prediction.aiplatform.gdc.goog/v1
kind String DeployedModelList
metadata ListMeta Informationen zu den Feldern von metadata finden Sie in der Dokumentation zur Kubernetes API.
items DeployedModel-Array

DeployedModelSpec

Definiert den erwarteten Status von DeployedModel-Ressourcen.

Wird angezeigt in:

Feld Beschreibung
endpointPath String Gibt den Ressourcennamen des Endpunkts an. Das Format dafür ist projects/{project}/locations/{location}/endpoints/{endpoint-id}. Das nächste Tag ist 6.
modelSpec Ungültiger Typ Definiert die Modellspezifikation, die für die Bereitstellung des Modells erforderlich ist.
resourcePoolRef ObjectReference Gibt die Referenz des Ressourcenpools mit den für diese DeployedModel erforderlichen Ressourcenspezifikationen an.
sharesResourcePool boolean Gibt an, ob die DeployedModel einen Ressourcenpool mit anderen Modellen teilt.

DeployedModelStatus

Definiert den beobachteten Status der Ressource DeployedModel.

Wird angezeigt in:

Feld Beschreibung
ready boolean Gibt an, ob sich die Ressource im Status „Bereit“ befindet.
primaryCondition Stellt den primären Zustand einer Ressource dar. Wenn die Ressource bereit ist, wird dies durch die Bedingung angegeben. Andernfalls ist die Bedingung der primäre Grund dafür, dass die Ressource nicht bereit ist.
resourceConditions Array Stellt eine Sammlung von Bedingungen für eine Ressource und ihre untergeordneten Ressourcen dar. Damit können Sie den Allgemeinzustand einer Ressource und ihrer Unterressourcen ermitteln.
conditions Condition-Array Stellt Rohressourcenbedingungen dar, die aus Kubernetes-Ressourcen zu Debugging-Zwecken abgeleitet werden.
routes Routen Stellt die Container- oder Systemrouten für die Vorhersage oder Systemdiagnose des bereitgestellten Modells dar.
ports Ports Stellt die HTTP- oder gRPC-Ports des Containers dar.
rpcStatus RpcStatus Gibt eine kanonische RPC-Darstellung der primären Bedingung des bereitgestellten Modells an.
observedGeneration Ganzzahl Gibt die Version der Ressource an, die zuletzt abgeglichen wurde.

Ports

Wird angezeigt in:

Feld Beschreibung
predictorPorts Ganzzahl-Array Listet die HTTP-Ports auf, die vom Predictor verfügbar gemacht werden sollen. Anfragen werden nicht an andere Ports als den ersten in der Liste weitergeleitet. Dieses Feld entspricht dem Feld ports der v1 core API für Kubernetes-Container.
predictorGRPCPorts Ganzzahl-Array Hier werden die gRPC-Ports aufgeführt, die vom Predictor verfügbar gemacht werden sollen. Wenn dieses Feld ausgelassen wird, sind die gRPC-Anfragen an den Container deaktiviert. Anfragen werden nicht an andere Ports als den ersten in der Liste weitergeleitet. Dieses Feld entspricht dem Feld ports der v1 core API für Kubernetes-Container.

ReplicaStatus

Definiert die Replikatinformationen der ResourcePool-Ressource.

Wird angezeigt in:

Feld Beschreibung
resourceType ResourceType Gibt den Typ der Ressource an.
resourceName String Gibt den eindeutigen Ressourcennamen im Namespace des Ressourcentyps an. Ein Deployment ResourceType hat beispielsweise den Namen des Kubernetes-Deployments als Ressourcennamen.
resourceNamespace String Gibt den Namespace der Ressource an. Dieses Feld gilt nicht für Ressourcen mit Clusterbereich.
appType String Gibt den Anwendungstyp der Ressource an, der durch ein bestimmtes Produkt definiert wird. In Prediction werden beispielsweise predictor und explainer als appType unterstützt.
availableReplicas Ganzzahl Gibt die Gesamtzahl der verfügbaren Replikate an. Für den Kubernetes-Bereitstellungsressourcentyp steht dieses Feld für die Gesamtzahl der verfügbaren Pods, die mindestens die Mindestanzahl an Sekunden bereit sind und auf die diese Bereitstellung ausgerichtet ist.
unavailableReplicas Ganzzahl Gibt die Gesamtzahl der nicht verfügbaren Replikate an. Für den Kubernetes-Deployment-Ressourcentyp steht er für die Gesamtzahl der nicht verfügbaren Pods, auf die das Deployment ausgerichtet ist.

Ressourcenpool

Definiert das Schema für die ResourcePools API.

Wird angezeigt in:

Feld Beschreibung
apiVersion String prediction.aiplatform.gdc.goog/v1
kind String ResourcePool
metadata ObjectMeta Informationen zu den Feldern von metadata finden Sie in der Dokumentation zur Kubernetes API.
spec ResourcePoolSpec
status ResourcePoolStatus

ResourcePoolList

Enthält eine Liste von ResourcePool-Ressourcen.

Feld Beschreibung
apiVersion String prediction.aiplatform.gdc.goog/v1
kind String ResourcePoolList
metadata ListMeta Informationen zu den Feldern von metadata finden Sie in der Dokumentation zur Kubernetes API.
items ResourcePool-Array

ResourcePoolSpec

Definiert den erwarteten Status von ResourcePool-Ressourcen.

Wird angezeigt in:

Feld Beschreibung
resourcePoolID String Stellt die vom System generierte ID der ResourcePool-Ressource dar. Dieses Feld ist nur für Google Cloud und GDCE relevant. Das nächste Tag ist 8.
userProvidedID String Stellt die vom Nutzer angegebene ID der ResourcePool-Ressource dar. Dieses Feld ist nur für Google Cloud und GDCE relevant.
dedicatedResources DedicatedResources Enthält eine Beschreibung der Ressourcen, die dem Ressourcenpool zugewiesen sind.
enableContainerLogging boolean Gibt an, ob das Container-Logging für ResourcePool aktiviert ist.
userGsa String Gibt das vom Nutzer bereitgestellte IAM-Dienstkonto im Nutzerprojekt an. Wenn nicht angegeben, wird das Standarddienstkonto für die Bereitstellung verwendet.
customKsaName String Gibt den benutzerdefinierten Namen an, den der Operator erstellt und den die Nutzerarbeitslast nur für BYOSA-Fälle (Bring Your Own Service Account) verwendet. Wenn leer, verwendet das System das Standardbenennungsmuster.
rolloutStrategy Ungültiger Typ Gibt an, ob Modelle, die für diesen Pool bereitgestellt werden, nach und nach oder gleichzeitig auf die Modellserverrepliken ausgerollt werden müssen.

ResourcePoolStatus

Definiert den beobachteten Status von ResourcePool-Ressourcen.

Wird angezeigt in:

Feld Beschreibung
ready boolean Gibt an, ob sich die Ressource im Status „Bereit“ befindet.
primaryCondition Stellt den primären Zustand einer Ressource dar. Wenn die Ressource bereit ist, wird dies durch die Bedingung angegeben. Andernfalls ist die Bedingung der primäre Grund dafür, dass die Ressource nicht bereit ist.
resourceConditions Stellt eine Sammlung von Bedingungen für eine Ressource und ihre untergeordneten Ressourcen dar. Damit können Sie den Allgemeinzustand einer Ressource und ihrer Unterressourcen ermitteln.
conditions Condition-Array Stellt Rohressourcenbedingungen dar, die aus Kubernetes-Ressourcen zu Debugging-Zwecken abgeleitet werden.
replicaStatuses ReplicaStatus-Array
rpcStatus RpcStatus Gibt eine kanonische RPC-Darstellung der primären Bedingung des ResourcePool an.
observedGeneration Ganzzahl Gibt an, welche Version der Ressource zuletzt abgeglichen wurde.

Routen

Wird angezeigt in:

Feld Beschreibung
predictRoute String Stellt den Routingpfad im Container dar, an den Vorhersageanfragen gesendet werden. Vertex AI leitet Anfragen mit projects.locations.endpoints.predict an diesen Pfad über die IP-Adresse und den Port des Containers weiter. Vertex AI gibt dann die Antwort des Containers in der API-Antwort zurück.
predictSystemRoute String Stellt den Systemroutingpfad dar, über den Vorhersageanfragen an den Cluster-Ingress gesendet werden. Dieses Feld wird intern nur ausgefüllt, wenn es während der Bereitstellung in deployedModel kopiert wird.
healthRoute String Stellt den Routingpfad im Container dar, an den Systemdiagnosen gesendet werden sollen. Vertex AI sendet gelegentlich GET-Anfragen an diesen Pfad über die IP-Adresse und den Port des Containers, um zu prüfen, ob der Container fehlerfrei ist.
healthSystemRoute String Stellt den Systemroutingpfad dar, über den Systemdiagnoseanfragen an den Cluster-Ingress gesendet werden. Dieses Feld wird intern nur ausgefüllt, wenn es während der Bereitstellung in deployedModel kopiert wird.

RpcStatus

Kapselt einen RPC-Code und eine Nachricht.

Wird angezeigt in:

Feld Beschreibung
code Code Stellt den RPC-Code dar. Das nächste Tag ist 4.
message String Enthält eine für Nutzer sichtbare Beschreibung der Bedingung.
terminalState boolean Gibt den Wert true an, wenn die Ressource einen Endstatus erreicht hat und nicht bereit werden kann.