prediction.aiplatform.gdc.goog/v1
Das Paket v1 enthält API-Schemadefinitionen für die API-Gruppe „prediction.aiplatform.gdc.goog“ v1.
Autoscaling
Definiert die Autoscaling-Parameter für ein Deployment.
Wird angezeigt in:
Feld | Beschreibung |
---|---|
minReplica Ganzzahl |
Mindestanzahl von Replikaten. Der Standardwert ist 1 . Das nächste Tag ist 5 . |
maxReplica Ganzzahl |
Maximale Anzahl von Replikaten. |
cpuTarget Ganzzahl |
Der Schwellenwert der CPU-Auslastung für die Hochskalierung eines Pods. |
gpuDutyCycleTarget Ganzzahl |
Der Grenzwert für die GPU-Arbeitszyklusauslastung für das Hochskalieren eines Pods. |
DedicatedResources
Definiert die Ressourcen, die einem Ressourcenpool zugewiesen sind. Die nächste ID ist 8
.
Wird angezeigt in:
Feld | Beschreibung |
---|---|
machineSpec |
Nicht erforderlich. Gibt die Konfiguration einer einzelnen Maschine mit dem Wert machineType an. Wenn kein Wert angegeben wird, wird ein Standardwert verwendet. Für die Vorhersage ist der Standardmaschinentyp für eine Bereitstellung n1-standard-2 (GKE-basierte Modelle) oder n2-standard-2-gdc (CPU-basierte Modelle). |
autoscaling Autoscaling |
Gibt die Autoscaling-Parameter für die Nutzerarbeitslasten an, z. B. die Vorhersagebereitstellung für die Vorhersage. |
DeployedModel
Definiert das Schema für die DeployedModels
API.
Wird angezeigt in:
Feld | Beschreibung |
---|---|
apiVersion String |
prediction.aiplatform.gdc.goog/v1 |
kind String |
DeployedModel |
metadata ObjectMeta |
Informationen zu den Feldern von metadata finden Sie in der Dokumentation zur Kubernetes API. |
spec DeployedModelSpec |
|
status DeployedModelStatus |
DeployedModelList
Enthält eine Liste von DeployedModel
-Ressourcen.
Feld | Beschreibung |
---|---|
apiVersion String |
prediction.aiplatform.gdc.goog/v1 |
kind String |
DeployedModelList |
metadata ListMeta |
Informationen zu den Feldern von metadata finden Sie in der Dokumentation zur Kubernetes API. |
items DeployedModel-Array |
DeployedModelSpec
Definiert den erwarteten Status von DeployedModel
-Ressourcen.
Wird angezeigt in:
Feld | Beschreibung |
---|---|
endpointPath String |
Gibt den Ressourcennamen des Endpunkts an. Das Format dafür ist projects/{project}/locations/{location}/endpoints/{endpoint-id} . Das nächste Tag ist 6 . |
modelSpec Ungültiger Typ |
Definiert die Modellspezifikation, die für die Bereitstellung des Modells erforderlich ist. |
resourcePoolRef ObjectReference |
Gibt die Referenz des Ressourcenpools mit den für diese DeployedModel erforderlichen Ressourcenspezifikationen an. |
sharesResourcePool boolean |
Gibt an, ob die DeployedModel einen Ressourcenpool mit anderen Modellen teilt. |
DeployedModelStatus
Definiert den beobachteten Status der Ressource DeployedModel
.
Wird angezeigt in:
Feld | Beschreibung |
---|---|
ready boolean |
Gibt an, ob sich die Ressource im Status „Bereit“ befindet. |
primaryCondition |
Stellt den primären Zustand einer Ressource dar. Wenn die Ressource bereit ist, wird dies durch die Bedingung angegeben. Andernfalls ist die Bedingung der primäre Grund dafür, dass die Ressource nicht bereit ist. |
resourceConditions Array |
Stellt eine Sammlung von Bedingungen für eine Ressource und ihre untergeordneten Ressourcen dar. Damit können Sie den Allgemeinzustand einer Ressource und ihrer Unterressourcen ermitteln. |
conditions Condition-Array |
Stellt Rohressourcenbedingungen dar, die aus Kubernetes-Ressourcen zu Debugging-Zwecken abgeleitet werden. |
routes Routen |
Stellt die Container- oder Systemrouten für die Vorhersage oder Systemdiagnose des bereitgestellten Modells dar. |
ports Ports |
Stellt die HTTP- oder gRPC-Ports des Containers dar. |
rpcStatus RpcStatus |
Gibt eine kanonische RPC-Darstellung der primären Bedingung des bereitgestellten Modells an. |
observedGeneration Ganzzahl |
Gibt die Version der Ressource an, die zuletzt abgeglichen wurde. |
Ports
Wird angezeigt in:
Feld | Beschreibung |
---|---|
predictorPorts Ganzzahl-Array |
Listet die HTTP-Ports auf, die vom Predictor verfügbar gemacht werden sollen. Anfragen werden nicht an andere Ports als den ersten in der Liste weitergeleitet. Dieses Feld entspricht dem Feld ports der v1 core API für Kubernetes-Container. |
predictorGRPCPorts Ganzzahl-Array |
Hier werden die gRPC-Ports aufgeführt, die vom Predictor verfügbar gemacht werden sollen. Wenn dieses Feld ausgelassen wird, sind die gRPC-Anfragen an den Container deaktiviert. Anfragen werden nicht an andere Ports als den ersten in der Liste weitergeleitet. Dieses Feld entspricht dem Feld ports der v1 core API für Kubernetes-Container. |
ReplicaStatus
Definiert die Replikatinformationen der ResourcePool
-Ressource.
Wird angezeigt in:
Feld | Beschreibung |
---|---|
resourceType ResourceType |
Gibt den Typ der Ressource an. |
resourceName String |
Gibt den eindeutigen Ressourcennamen im Namespace des Ressourcentyps an. Ein Deployment ResourceType hat beispielsweise den Namen des Kubernetes-Deployments als Ressourcennamen. |
resourceNamespace String |
Gibt den Namespace der Ressource an. Dieses Feld gilt nicht für Ressourcen mit Clusterbereich. |
appType String |
Gibt den Anwendungstyp der Ressource an, der durch ein bestimmtes Produkt definiert wird. In Prediction werden beispielsweise predictor und explainer als appType unterstützt. |
availableReplicas Ganzzahl |
Gibt die Gesamtzahl der verfügbaren Replikate an. Für den Kubernetes-Bereitstellungsressourcentyp steht dieses Feld für die Gesamtzahl der verfügbaren Pods, die mindestens die Mindestanzahl an Sekunden bereit sind und auf die diese Bereitstellung ausgerichtet ist. |
unavailableReplicas Ganzzahl |
Gibt die Gesamtzahl der nicht verfügbaren Replikate an. Für den Kubernetes-Deployment-Ressourcentyp steht er für die Gesamtzahl der nicht verfügbaren Pods, auf die das Deployment ausgerichtet ist. |
Ressourcenpool
Definiert das Schema für die ResourcePools
API.
Wird angezeigt in:
Feld | Beschreibung |
---|---|
apiVersion String |
prediction.aiplatform.gdc.goog/v1 |
kind String |
ResourcePool |
metadata ObjectMeta |
Informationen zu den Feldern von metadata finden Sie in der Dokumentation zur Kubernetes API. |
spec ResourcePoolSpec |
|
status ResourcePoolStatus |
ResourcePoolList
Enthält eine Liste von ResourcePool
-Ressourcen.
Feld | Beschreibung |
---|---|
apiVersion String |
prediction.aiplatform.gdc.goog/v1 |
kind String |
ResourcePoolList |
metadata ListMeta |
Informationen zu den Feldern von metadata finden Sie in der Dokumentation zur Kubernetes API. |
items ResourcePool-Array |
ResourcePoolSpec
Definiert den erwarteten Status von ResourcePool
-Ressourcen.
Wird angezeigt in:
Feld | Beschreibung |
---|---|
resourcePoolID String |
Stellt die vom System generierte ID der ResourcePool -Ressource dar. Dieses Feld ist nur für Google Cloud und GDCE relevant. Das nächste Tag ist 8 . |
userProvidedID String |
Stellt die vom Nutzer angegebene ID der ResourcePool -Ressource dar. Dieses Feld ist nur für Google Cloud und GDCE relevant. |
dedicatedResources DedicatedResources |
Enthält eine Beschreibung der Ressourcen, die dem Ressourcenpool zugewiesen sind. |
enableContainerLogging boolean |
Gibt an, ob das Container-Logging für ResourcePool aktiviert ist. |
userGsa String |
Gibt das vom Nutzer bereitgestellte IAM-Dienstkonto im Nutzerprojekt an. Wenn nicht angegeben, wird das Standarddienstkonto für die Bereitstellung verwendet. |
customKsaName String |
Gibt den benutzerdefinierten Namen an, den der Operator erstellt und den die Nutzerarbeitslast nur für BYOSA-Fälle (Bring Your Own Service Account) verwendet. Wenn leer, verwendet das System das Standardbenennungsmuster. |
rolloutStrategy Ungültiger Typ |
Gibt an, ob Modelle, die für diesen Pool bereitgestellt werden, nach und nach oder gleichzeitig auf die Modellserverrepliken ausgerollt werden müssen. |
ResourcePoolStatus
Definiert den beobachteten Status von ResourcePool
-Ressourcen.
Wird angezeigt in:
Feld | Beschreibung |
---|---|
ready boolean |
Gibt an, ob sich die Ressource im Status „Bereit“ befindet. |
primaryCondition |
Stellt den primären Zustand einer Ressource dar. Wenn die Ressource bereit ist, wird dies durch die Bedingung angegeben. Andernfalls ist die Bedingung der primäre Grund dafür, dass die Ressource nicht bereit ist. |
resourceConditions |
Stellt eine Sammlung von Bedingungen für eine Ressource und ihre untergeordneten Ressourcen dar. Damit können Sie den Allgemeinzustand einer Ressource und ihrer Unterressourcen ermitteln. |
conditions Condition-Array |
Stellt Rohressourcenbedingungen dar, die aus Kubernetes-Ressourcen zu Debugging-Zwecken abgeleitet werden. |
replicaStatuses ReplicaStatus-Array |
|
rpcStatus RpcStatus |
Gibt eine kanonische RPC-Darstellung der primären Bedingung des ResourcePool an. |
observedGeneration Ganzzahl |
Gibt an, welche Version der Ressource zuletzt abgeglichen wurde. |
Routen
Wird angezeigt in:
Feld | Beschreibung |
---|---|
predictRoute String |
Stellt den Routingpfad im Container dar, an den Vorhersageanfragen gesendet werden. Vertex AI leitet Anfragen mit projects.locations.endpoints.predict an diesen Pfad über die IP-Adresse und den Port des Containers weiter. Vertex AI gibt dann die Antwort des Containers in der API-Antwort zurück. |
predictSystemRoute String |
Stellt den Systemroutingpfad dar, über den Vorhersageanfragen an den Cluster-Ingress gesendet werden. Dieses Feld wird intern nur ausgefüllt, wenn es während der Bereitstellung in deployedModel kopiert wird. |
healthRoute String |
Stellt den Routingpfad im Container dar, an den Systemdiagnosen gesendet werden sollen. Vertex AI sendet gelegentlich GET-Anfragen an diesen Pfad über die IP-Adresse und den Port des Containers, um zu prüfen, ob der Container fehlerfrei ist. |
healthSystemRoute String |
Stellt den Systemroutingpfad dar, über den Systemdiagnoseanfragen an den Cluster-Ingress gesendet werden. Dieses Feld wird intern nur ausgefüllt, wenn es während der Bereitstellung in deployedModel kopiert wird. |
RpcStatus
Kapselt einen RPC-Code und eine Nachricht.
Wird angezeigt in:
Feld | Beschreibung |
---|---|
code Code |
Stellt den RPC-Code dar. Das nächste Tag ist 4 . |
message String |
Enthält eine für Nutzer sichtbare Beschreibung der Bedingung. |
terminalState boolean |
Gibt den Wert true an, wenn die Ressource einen Endstatus erreicht hat und nicht bereit werden kann. |