Prediksi KRM API prediction.aiplatform.gdc.goog/v1

prediction.aiplatform.gdc.goog/v1

Paket v1 berisi definisi Skema API untuk grup API prediction.aiplatform.gdc.goog v1.

Penskalaan otomatis

Menentukan parameter penskalaan otomatis untuk deployment.

Muncul di:

Kolom Deskripsi
minReplica integer Jumlah replika minimum. Nilai defaultnya adalah 1. Tag berikutnya adalah 5.
maxReplica integer Jumlah replika maksimum.
cpuTarget integer Nilai minimum penggunaan CPU untuk menaikkan skala pod.
gpuDutyCycleTarget integer Nilai minimum pemakaian siklus tugas GPU untuk meningkatkan skala pod.

DedicatedResources

Menentukan resource yang dikhususkan untuk kumpulan resource. ID berikutnya adalah 8.

Muncul di:

Kolom Deskripsi
machineSpec Tidak diperlukan. Menentukan konfigurasi satu mesin menggunakan nilai machineType. Jika tidak diberikan, nilai default akan digunakan. Untuk Prediksi, jenis mesin default untuk deployment adalah n1-standard-2 (model berbasis GKE) atau n2-standard-2-gdc (model berbasis CPU).
autoscaling Penskalaan otomatis Menentukan parameter penskalaan otomatis untuk workload pengguna, misalnya, deployment prediktor untuk prediksi.

DeployedModel

Mendefinisikan Skema untuk DeployedModels API.

Muncul di:

Kolom Deskripsi
apiVersion string prediction.aiplatform.gdc.goog/v1
kind string DeployedModel
metadata ObjectMeta Lihat dokumentasi Kubernetes API untuk mengetahui kolom metadata.
spec DeployedModelSpec
status DeployedModelStatus

DeployedModelList

Berisi daftar resource DeployedModel.

Kolom Deskripsi
apiVersion string prediction.aiplatform.gdc.goog/v1
kind string DeployedModelList
metadata ListMeta Lihat dokumentasi Kubernetes API untuk mengetahui kolom metadata.
items Array DeployedModel

DeployedModelSpec

Menentukan status yang diharapkan dari resource DeployedModel.

Muncul di:

Kolom Deskripsi
endpointPath string Menentukan nama resource endpoint. Formatnya adalah projects/{project}/locations/{location}/endpoints/{endpoint-id}. Tag berikutnya adalah 6.
modelSpec jenis tidak valid Mendefinisikan spesifikasi model yang diperlukan saat men-deploy model.
resourcePoolRef ObjectReference Menentukan referensi kumpulan resource dengan spesifikasi resource yang diperlukan untuk DeployedModel ini.
sharesResourcePool boolean Menentukan apakah DeployedModel berbagi kumpulan resource dengan model lain.

DeployedModelStatus

Menentukan status yang diamati dari resource DeployedModel.

Muncul di:

Kolom Deskripsi
ready boolean Menunjukkan apakah resource dalam status siap.
primaryCondition Mewakili kondisi utama resource. Jika resource siap, kondisi menunjukkan bahwa resource siap. Jika tidak, kondisi tersebut adalah alasan utama mengapa resource belum siap.
resourceConditions array Mewakili kumpulan kondisi untuk resource dan sub-resource-nya. Anda dapat menggunakannya untuk menentukan kondisi keseluruhan resource dan sub-resource-nya.
conditions Array Condition Mewakili kondisi resource mentah yang diisi dari resource Kubernetes untuk tujuan penelusuran kesalahan.
routes Rute Mewakili rute penampung atau sistem untuk prediksi model yang di-deploy atau health check.
ports Port Mewakili port HTTP atau gRPC penampung.
rpcStatus RpcStatus Menunjukkan representasi RPC kanonis dari kondisi utama model yang di-deploy.
observedGeneration integer Menunjukkan revisi resource yang terakhir disesuaikan.

Port

Muncul di:

Kolom Deskripsi
predictorPorts array bilangan bulat Mencantumkan port HTTP yang akan diekspos dari prediktor. Permintaan tidak diteruskan ke port selain yang pertama dalam daftar. Kolom ini sesuai dengan kolom ports dari Kubernetes Containers v1 core API.
predictorGRPCPorts array bilangan bulat Mencantumkan port gRPC yang akan diekspos dari prediktor. Jika kolom ini tidak diisi, permintaan gRPC ke container akan dinonaktifkan. Permintaan tidak diteruskan ke port selain yang pertama dalam daftar. Kolom ini sesuai dengan kolom ports dari Kubernetes Containers v1 core API.

ReplicaStatus

Menentukan informasi replika resource ResourcePool.

Muncul di:

Kolom Deskripsi
resourceType ResourceType Menentukan jenis resource.
resourceName string Menunjukkan nama resource unik dalam namespace jenis resource. Misalnya, Deployment ResourceType memiliki nama deployment Kubernetes sebagai nama resource-nya.
resourceNamespace string Menunjukkan namespace resource. Kolom ini tidak berlaku untuk resource cakupan cluster.
appType string Menunjukkan jenis aplikasi resource, yang ditentukan oleh produk tertentu. Misalnya, Prediksi mendukung predictor dan explainer sebagai appType.
availableReplicas integer Menunjukkan jumlah total replika yang tersedia. Untuk jenis resource deployment Kubernetes, kolom ini menunjukkan jumlah total pod yang tersedia, siap setidaknya selama detik siap minimum, yang ditargetkan oleh deployment ini.
unavailableReplicas integer Menunjukkan jumlah total replika yang tidak tersedia. Untuk jenis resource deployment Kubernetes, ini menunjukkan jumlah total pod yang tidak tersedia yang ditargetkan oleh deployment.

ResourcePool

Mendefinisikan Skema untuk ResourcePools API.

Muncul di:

Kolom Deskripsi
apiVersion string prediction.aiplatform.gdc.goog/v1
kind string ResourcePool
metadata ObjectMeta Lihat dokumentasi Kubernetes API untuk mengetahui kolom metadata.
spec ResourcePoolSpec
status ResourcePoolStatus

ResourcePoolList

Berisi daftar resource ResourcePool.

Kolom Deskripsi
apiVersion string prediction.aiplatform.gdc.goog/v1
kind string ResourcePoolList
metadata ListMeta Lihat dokumentasi Kubernetes API untuk mengetahui kolom metadata.
items Array ResourcePool

ResourcePoolSpec

Menentukan status yang diharapkan dari resource ResourcePool.

Muncul di:

Kolom Deskripsi
resourcePoolID string Mewakili ID buatan sistem dari resource ResourcePool. Kolom ini hanya berlaku untuk Google Cloud dan GDCE. Tag berikutnya adalah 8.
userProvidedID string Mewakili ID yang disediakan pengguna untuk resource ResourcePool. Kolom ini hanya berlaku untuk Google Cloud dan GDCE.
dedicatedResources DedicatedResources Berisi deskripsi resource yang dikhususkan untuk kumpulan resource.
enableContainerLogging boolean Menunjukkan apakah logging container diaktifkan untuk ResourcePool.
userGsa string Menunjukkan akun layanan IAM yang disediakan pengguna dalam project pengguna. Jika tidak ditentukan, akun layanan penayangan default akan digunakan.
customKsaName string Menentukan nama kustom yang dibuat operator dan digunakan beban kerja pengguna hanya untuk kasus bawa akun layanan Anda sendiri (BYOSA). Jika kosong, sistem akan menggunakan pola penamaan default.
rolloutStrategy jenis tidak valid Menentukan apakah model yang di-deploy ke kumpulan ini harus di-roll out ke replika server model secara bertahap atau sekaligus.

ResourcePoolStatus

Menentukan status yang diamati dari resource ResourcePool.

Muncul di:

Kolom Deskripsi
ready boolean Menunjukkan apakah resource dalam status siap.
primaryCondition Mewakili kondisi utama resource. Jika resource siap, kondisi menunjukkan bahwa resource siap. Jika tidak, kondisi tersebut adalah alasan utama mengapa resource belum siap.
resourceConditions Mewakili kumpulan kondisi untuk resource dan sub-resource-nya. Anda dapat menggunakannya untuk menentukan kondisi keseluruhan resource dan sub-resource-nya.
conditions Array Condition Mewakili kondisi resource mentah yang diisi dari resource Kubernetes untuk tujuan penelusuran kesalahan.
replicaStatuses Array ReplicaStatus
rpcStatus RpcStatus Menunjukkan representasi RPC kanonis dari kondisi utama ResourcePool.
observedGeneration integer Menunjukkan revisi resource mana yang terakhir disesuaikan.

Rute

Muncul di:

Kolom Deskripsi
predictRoute string Mewakili jalur perutean di container untuk mengirim permintaan prediksi. Vertex AI meneruskan permintaan menggunakan projects.locations.endpoints.predict ke jalur ini di alamat IP dan port container. Kemudian, Vertex AI akan menampilkan respons container dalam respons API.
predictSystemRoute string Mewakili jalur perutean sistem untuk mengirim permintaan prediksi ke ingress cluster. Kolom ini hanya diisi secara internal saat disalin ke deployedModel selama deployment.
healthRoute string Mewakili jalur perutean di container untuk mengirim health check. Vertex AI secara berkala mengirim permintaan GET ke jalur ini di alamat IP dan port container untuk memeriksa apakah container dalam kondisi baik.
healthSystemRoute string Mewakili jalur perutean sistem untuk mengirim permintaan health check ke ingress cluster. Kolom ini hanya diisi secara internal saat disalin ke deployedModel selama deployment.

RpcStatus

Mengkapsulasi kode dan pesan RPC.

Muncul di:

Kolom Deskripsi
code Kode Mewakili kode RPC. Tag berikutnya adalah 4.
message string Berisi deskripsi kondisi yang ditampilkan kepada pengguna.
terminalState boolean Menunjukkan nilai true jika resource telah mencapai status akhir dan tidak dapat siap.