prediction.aiplatform.gdc.goog/v1
Paket v1 berisi definisi Skema API untuk grup API prediction.aiplatform.gdc.goog v1.
Penskalaan otomatis
Menentukan parameter penskalaan otomatis untuk deployment.
Muncul di:
Kolom | Deskripsi |
---|---|
minReplica integer |
Jumlah replika minimum. Nilai defaultnya adalah 1 . Tag berikutnya adalah 5 . |
maxReplica integer |
Jumlah replika maksimum. |
cpuTarget integer |
Nilai minimum penggunaan CPU untuk menaikkan skala pod. |
gpuDutyCycleTarget integer |
Nilai minimum pemakaian siklus tugas GPU untuk meningkatkan skala pod. |
DedicatedResources
Menentukan resource yang dikhususkan untuk kumpulan resource. ID berikutnya adalah 8
.
Muncul di:
Kolom | Deskripsi |
---|---|
machineSpec |
Tidak diperlukan. Menentukan konfigurasi satu mesin menggunakan nilai machineType . Jika tidak diberikan, nilai default akan digunakan. Untuk Prediksi, jenis mesin default untuk deployment adalah n1-standard-2 (model berbasis GKE) atau n2-standard-2-gdc (model berbasis CPU). |
autoscaling Penskalaan otomatis |
Menentukan parameter penskalaan otomatis untuk workload pengguna, misalnya, deployment prediktor untuk prediksi. |
DeployedModel
Mendefinisikan Skema untuk DeployedModels
API.
Muncul di:
Kolom | Deskripsi |
---|---|
apiVersion string |
prediction.aiplatform.gdc.goog/v1 |
kind string |
DeployedModel |
metadata ObjectMeta |
Lihat dokumentasi Kubernetes API untuk mengetahui kolom metadata . |
spec DeployedModelSpec |
|
status DeployedModelStatus |
DeployedModelList
Berisi daftar resource DeployedModel
.
Kolom | Deskripsi |
---|---|
apiVersion string |
prediction.aiplatform.gdc.goog/v1 |
kind string |
DeployedModelList |
metadata ListMeta |
Lihat dokumentasi Kubernetes API untuk mengetahui kolom metadata . |
items Array DeployedModel |
DeployedModelSpec
Menentukan status yang diharapkan dari resource DeployedModel
.
Muncul di:
Kolom | Deskripsi |
---|---|
endpointPath string |
Menentukan nama resource endpoint. Formatnya adalah projects/{project}/locations/{location}/endpoints/{endpoint-id} . Tag berikutnya adalah 6 . |
modelSpec jenis tidak valid |
Mendefinisikan spesifikasi model yang diperlukan saat men-deploy model. |
resourcePoolRef ObjectReference |
Menentukan referensi kumpulan resource dengan spesifikasi resource yang diperlukan untuk DeployedModel ini. |
sharesResourcePool boolean |
Menentukan apakah DeployedModel berbagi kumpulan resource dengan model lain. |
DeployedModelStatus
Menentukan status yang diamati dari resource DeployedModel
.
Muncul di:
Kolom | Deskripsi |
---|---|
ready boolean |
Menunjukkan apakah resource dalam status siap. |
primaryCondition |
Mewakili kondisi utama resource. Jika resource siap, kondisi menunjukkan bahwa resource siap. Jika tidak, kondisi tersebut adalah alasan utama mengapa resource belum siap. |
resourceConditions array |
Mewakili kumpulan kondisi untuk resource dan sub-resource-nya. Anda dapat menggunakannya untuk menentukan kondisi keseluruhan resource dan sub-resource-nya. |
conditions Array Condition |
Mewakili kondisi resource mentah yang diisi dari resource Kubernetes untuk tujuan penelusuran kesalahan. |
routes Rute |
Mewakili rute penampung atau sistem untuk prediksi model yang di-deploy atau health check. |
ports Port |
Mewakili port HTTP atau gRPC penampung. |
rpcStatus RpcStatus |
Menunjukkan representasi RPC kanonis dari kondisi utama model yang di-deploy. |
observedGeneration integer |
Menunjukkan revisi resource yang terakhir disesuaikan. |
Port
Muncul di:
Kolom | Deskripsi |
---|---|
predictorPorts array bilangan bulat |
Mencantumkan port HTTP yang akan diekspos dari prediktor. Permintaan tidak diteruskan ke port selain yang pertama dalam daftar. Kolom ini sesuai dengan kolom ports dari Kubernetes Containers v1 core API. |
predictorGRPCPorts array bilangan bulat |
Mencantumkan port gRPC yang akan diekspos dari prediktor. Jika kolom ini tidak diisi, permintaan gRPC ke container akan dinonaktifkan. Permintaan tidak diteruskan ke port selain yang pertama dalam daftar. Kolom ini sesuai dengan kolom ports dari Kubernetes Containers v1 core API. |
ReplicaStatus
Menentukan informasi replika resource ResourcePool
.
Muncul di:
Kolom | Deskripsi |
---|---|
resourceType ResourceType |
Menentukan jenis resource. |
resourceName string |
Menunjukkan nama resource unik dalam namespace jenis resource. Misalnya, Deployment ResourceType memiliki nama deployment Kubernetes sebagai nama resource-nya. |
resourceNamespace string |
Menunjukkan namespace resource. Kolom ini tidak berlaku untuk resource cakupan cluster. |
appType string |
Menunjukkan jenis aplikasi resource, yang ditentukan oleh produk tertentu. Misalnya, Prediksi mendukung predictor dan explainer sebagai appType . |
availableReplicas integer |
Menunjukkan jumlah total replika yang tersedia. Untuk jenis resource deployment Kubernetes, kolom ini menunjukkan jumlah total pod yang tersedia, siap setidaknya selama detik siap minimum, yang ditargetkan oleh deployment ini. |
unavailableReplicas integer |
Menunjukkan jumlah total replika yang tidak tersedia. Untuk jenis resource deployment Kubernetes, ini menunjukkan jumlah total pod yang tidak tersedia yang ditargetkan oleh deployment. |
ResourcePool
Mendefinisikan Skema untuk ResourcePools
API.
Muncul di:
Kolom | Deskripsi |
---|---|
apiVersion string |
prediction.aiplatform.gdc.goog/v1 |
kind string |
ResourcePool |
metadata ObjectMeta |
Lihat dokumentasi Kubernetes API untuk mengetahui kolom metadata . |
spec ResourcePoolSpec |
|
status ResourcePoolStatus |
ResourcePoolList
Berisi daftar resource ResourcePool
.
Kolom | Deskripsi |
---|---|
apiVersion string |
prediction.aiplatform.gdc.goog/v1 |
kind string |
ResourcePoolList |
metadata ListMeta |
Lihat dokumentasi Kubernetes API untuk mengetahui kolom metadata . |
items Array ResourcePool |
ResourcePoolSpec
Menentukan status yang diharapkan dari resource ResourcePool
.
Muncul di:
Kolom | Deskripsi |
---|---|
resourcePoolID string |
Mewakili ID buatan sistem dari resource ResourcePool . Kolom ini hanya berlaku untuk Google Cloud dan GDCE. Tag berikutnya adalah 8 . |
userProvidedID string |
Mewakili ID yang disediakan pengguna untuk resource ResourcePool . Kolom ini hanya berlaku untuk Google Cloud dan GDCE. |
dedicatedResources DedicatedResources |
Berisi deskripsi resource yang dikhususkan untuk kumpulan resource. |
enableContainerLogging boolean |
Menunjukkan apakah logging container diaktifkan untuk ResourcePool . |
userGsa string |
Menunjukkan akun layanan IAM yang disediakan pengguna dalam project pengguna. Jika tidak ditentukan, akun layanan penayangan default akan digunakan. |
customKsaName string |
Menentukan nama kustom yang dibuat operator dan digunakan beban kerja pengguna hanya untuk kasus bawa akun layanan Anda sendiri (BYOSA). Jika kosong, sistem akan menggunakan pola penamaan default. |
rolloutStrategy jenis tidak valid |
Menentukan apakah model yang di-deploy ke kumpulan ini harus di-roll out ke replika server model secara bertahap atau sekaligus. |
ResourcePoolStatus
Menentukan status yang diamati dari resource ResourcePool
.
Muncul di:
Kolom | Deskripsi |
---|---|
ready boolean |
Menunjukkan apakah resource dalam status siap. |
primaryCondition |
Mewakili kondisi utama resource. Jika resource siap, kondisi menunjukkan bahwa resource siap. Jika tidak, kondisi tersebut adalah alasan utama mengapa resource belum siap. |
resourceConditions |
Mewakili kumpulan kondisi untuk resource dan sub-resource-nya. Anda dapat menggunakannya untuk menentukan kondisi keseluruhan resource dan sub-resource-nya. |
conditions Array Condition |
Mewakili kondisi resource mentah yang diisi dari resource Kubernetes untuk tujuan penelusuran kesalahan. |
replicaStatuses Array ReplicaStatus |
|
rpcStatus RpcStatus |
Menunjukkan representasi RPC kanonis dari kondisi utama ResourcePool. |
observedGeneration integer |
Menunjukkan revisi resource mana yang terakhir disesuaikan. |
Rute
Muncul di:
Kolom | Deskripsi |
---|---|
predictRoute string |
Mewakili jalur perutean di container untuk mengirim permintaan prediksi. Vertex AI meneruskan permintaan menggunakan projects.locations.endpoints.predict ke jalur ini di alamat IP dan port container. Kemudian, Vertex AI akan menampilkan respons container dalam respons API. |
predictSystemRoute string |
Mewakili jalur perutean sistem untuk mengirim permintaan prediksi ke ingress cluster. Kolom ini hanya diisi secara internal saat disalin ke deployedModel selama deployment. |
healthRoute string |
Mewakili jalur perutean di container untuk mengirim health check. Vertex AI secara berkala mengirim permintaan GET ke jalur ini di alamat IP dan port container untuk memeriksa apakah container dalam kondisi baik. |
healthSystemRoute string |
Mewakili jalur perutean sistem untuk mengirim permintaan health check ke ingress cluster. Kolom ini hanya diisi secara internal saat disalin ke deployedModel selama deployment. |
RpcStatus
Mengkapsulasi kode dan pesan RPC.
Muncul di:
Kolom | Deskripsi |
---|---|
code Kode |
Mewakili kode RPC. Tag berikutnya adalah 4 . |
message string |
Berisi deskripsi kondisi yang ditampilkan kepada pengguna. |
terminalState boolean |
Menunjukkan nilai true jika resource telah mencapai status akhir dan tidak dapat siap. |