Halaman ini diterjemahkan oleh Cloud Translation API.

Mengonfigurasi penskalaan otomatis Pod horizontal

Autopilot Standard

Halaman ini menunjukkan cara menskalakan deployment di Google Kubernetes Engine (GKE) dengan menyesuaikan resource secara otomatis menggunakan metrik seperti alokasi resource, traffic load balancer, metrik kustom, atau beberapa metrik secara bersamaan. Halaman ini juga memberikan petunjuk langkah demi langkah untuk mengonfigurasi profil Horizontal Pod Autoscaler (HPA), termasuk cara melihat, menghapus, membersihkan, dan memecahkan masalah objek HPA Anda. Deployment adalah objek Kubernetes API yang memungkinkan Anda menjalankan beberapa replika Pod yang didistribusikan di antara node dalam cluster.

Halaman ini ditujukan untuk Operator dan Developer yang mengelola penskalaan aplikasi di GKE dan ingin memahami cara mengoptimalkan performa secara dinamis dan mempertahankan efisiensi biaya melalui penskalaan otomatis Pod horizontal. Untuk mempelajari lebih lanjut peran umum dan contoh tugas yang dirujuk dalam konten, lihat Peran dan tugas pengguna GKE umum. Google Cloud

Sebelum memulai

Sebelum memulai, pastikan Anda telah melakukan tugas berikut:

Aktifkan Google Kubernetes Engine API.

Aktifkan Google Kubernetes Engine API

Jika ingin menggunakan Google Cloud CLI untuk tugas ini, instal lalu lakukan inisialisasi gcloud CLI. Jika sebelumnya Anda telah menginstal gcloud CLI, dapatkan versi terbaru dengan menjalankan perintah gcloud components update. Versi gcloud CLI yang lebih lama mungkin tidak mendukung menjalankan perintah dalam dokumen ini.
Catatan: Untuk penginstalan gcloud CLI yang ada, pastikan untuk menyetel properti compute/region. Jika Anda terutama menggunakan cluster zona, tetapkan compute/zone. Dengan menyetel lokasi default, Anda dapat menghindari error di gcloud CLI yang seperti ini: One of [--zone, --region] must be supplied: Please specify location. Anda mungkin perlu menentukan lokasi dalam perintah tertentu jika lokasi cluster Anda berbeda dengan lokasi default yang Anda tetapkan.

Pastikan Anda sudah memiliki cluster Autopilot atau Standard. Jika Anda memerlukannya, buat cluster Autopilot.

Versi API untuk objek `HorizontalPodAutoscaler`

Saat Anda menggunakan konsol Google Cloud , objek HorizontalPodAutoscaler dibuat menggunakan autoscaling/v2 API.

Saat menggunakan kubectl untuk membuat atau melihat informasi tentang Horizontal Pod Autoscaler, Anda dapat menentukan autoscaling/v1 API atau autoscaling/v2 API.

apiVersion: autoscaling/v1 adalah default, dan memungkinkan Anda melakukan penskalaan otomatis hanya berdasarkan pemakaian CPU. Untuk melakukan penskalaan otomatis berdasarkan metrik lain, sebaiknya gunakan apiVersion: autoscaling/v2. Contoh dalam Membuat contoh Deployment menggunakan apiVersion: autoscaling/v1.
apiVersion: autoscaling/v2 direkomendasikan untuk membuat objek HorizontalPodAutoscaler baru. Alat ini memungkinkan Anda melakukan penskalaan otomatis berdasarkan beberapa metrik, termasuk metrik kustom atau eksternal. Semua contoh lain di halaman ini menggunakan apiVersion: autoscaling/v2.

Untuk memeriksa versi API yang didukung, gunakan perintah kubectl api-versions.

Anda dapat menentukan API yang akan digunakan saat melihat detail tentang Horizontal Pod Autoscaler yang menggunakan apiVersion: autoscaling/v2.

Membuat contoh Deployment

Sebelum dapat membuat Horizontal Pod Autoscaler, Anda harus membuat workload yang dipantau. Contoh di halaman ini menerapkan konfigurasi Horizontal Pod Autoscaler yang berbeda pada Deployment nginx berikut. Contoh terpisah menampilkan Horizontal Pod Autoscaler berdasarkan penggunaan resource, berdasarkan metrik kustom atau eksternal, dan berdasarkan beberapa metrik.

Simpan kode berikut ke file bernama nginx.yaml:

apiVersion: apps/v1
kind: Deployment
metadata:
  name: nginx
  namespace: default
spec:
  replicas: 3
  selector:
    matchLabels:
      app: nginx
  template:
    metadata:
      labels:
        app: nginx
    spec:
      containers:
      - name: nginx
        image: nginx:1.7.9
        ports:
        - containerPort: 80
        resources:
          # You must specify requests for CPU to autoscale
          # based on CPU utilization
          requests:
            cpu: "250m"

Manifes ini menentukan nilai untuk permintaan CPU. Jika ingin melakukan penskalaan otomatis berdasarkan penggunaan resource dalam persentase, Anda harus menentukan permintaan untuk resource tersebut. Jika tidak menentukan permintaan, Anda dapat melakukan penskalaan otomatis hanya berdasarkan nilai absolut pemakaian resource, seperti miliCPU untuk pemakaian CPU.

Untuk membuat Deployment, terapkan manifes nginx.yaml:

kubectl apply -f nginx.yaml

Deployment memiliki spec.replicas yang ditetapkan ke 3, sehingga tiga Pod di-deploy. Anda dapat memverifikasi hal ini menggunakan perintah kubectl get deployment nginx.

Setiap contoh di halaman ini menerapkan Horizontal Pod Autoscaler yang berbeda pada contoh Deployment nginx.

Penskalaan otomatis berdasarkan penggunaan resource

Contoh ini membuat objek HorizontalPodAutoscaler untuk menskalakan Deployment nginx secara otomatis saat pemakaian CPU melampaui 50%, dan memastikan selalu ada minimal 1 replika dan maksimum 10 replika.

Anda dapat membuat Horizontal Pod Autoscaler yang menargetkan CPU menggunakan konsol Google Cloud , perintah kubectl apply, atau hanya untuk CPU rata-rata, perintah kubectl autoscale.

Konsol

Buka halaman Workloads di konsol Google Cloud .

Buka Workloads
Klik nama Deployment nginx.
Klik Tindakan > Skalakan otomatis.
Tentukan nilai berikut:
- Jumlah minimum replika: 1
- Jumlah maksimum replika: 10
- Metrik penskalaan otomatis: CPU
- Target: 50
- Unit: %
Klik Done.
Klik Autoscale.

`kubectl apply`

Simpan manifes YAML berikut sebagai file bernama nginx-hpa.yaml:

apiVersion: autoscaling/v1
kind: HorizontalPodAutoscaler
metadata:
  name: nginx
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: nginx
  # Set the minimum and maximum number of replicas the Deployment can scale to.
  minReplicas: 1
  maxReplicas: 10
  # The target average CPU utilization percentage across all Pods.
  targetCPUUtilizationPercentage: 50

Untuk membuat HPA, terapkan manifes menggunakan perintah berikut:

kubectl apply -f nginx-hpa.yaml

`kubectl autoscale`

Untuk membuat objek HorizontalPodAutoscaler yang hanya menargetkan pemakaian CPU rata-rata, Anda dapat menggunakan perintah kubectl autoscale:

kubectl autoscale deployment nginx --cpu-percent=50 --min=1 --max=10

Untuk mendapatkan daftar Horizontal Pod Autoscaler dalam cluster, gunakan perintah berikut:

kubectl get hpa

Outputnya mirip dengan hal berikut ini:

NAME    REFERENCE          TARGETS   MINPODS   MAXPODS   REPLICAS   AGE
nginx   Deployment/nginx   0%/50%    1         10        3          61s

Untuk mendapatkan detail tentang Horizontal Pod Autoscaler, Anda dapat menggunakan konsol Google Cloud atau perintah kubectl.

Konsol

Buka halaman Workloads di konsol Google Cloud .

Buka Workloads
Klik nama Deployment nginx.
Lihat konfigurasi Horizontal Pod Autoscaler di bagian Autoscaler.
Lihat detail selengkapnya tentang peristiwa penskalaan otomatis di tab Events.

`kubectl get`

Untuk mendapatkan detail tentang Horizontal Pod Autoscaler, Anda dapat menggunakan kubectl get hpa dengan flag -o yaml. Kolom status berisi informasi tentang jumlah replika saat ini dan peristiwa penskalaan otomatis terbaru.

kubectl get hpa nginx -o yaml

Outputnya mirip dengan hal berikut ini:

apiVersion: autoscaling/v1
kind: HorizontalPodAutoscaler
metadata:
  annotations:
    autoscaling.alpha.kubernetes.io/conditions: '[{"type":"AbleToScale","status":"True","lastTransitionTime":"2019-10-30T19:42:59Z","reason":"ScaleDownStabilized","message":"recent
      recommendations were higher than current one, applying the highest recent recommendation"},{"type":"ScalingActive","status":"True","lastTransitionTime":"2019-10-30T19:42:59Z","reason":"ValidMetricFound","message":"the
      HPA was able to successfully calculate a replica count from cpu resource utilization
      (percentage of request)"},{"type":"ScalingLimited","status":"False","lastTransitionTime":"2019-10-30T19:42:59Z","reason":"DesiredWithinRange","message":"the
      desired count is within the acceptable range"}]'
    autoscaling.alpha.kubernetes.io/current-metrics: '[{"type":"Resource","resource":{"name":"cpu","currentAverageUtilization":0,"currentAverageValue":"0"}}]'
    kubectl.kubernetes.io/last-applied-configuration: |
      {"apiVersion":"autoscaling/v1","kind":"HorizontalPodAutoscaler","metadata":{"annotations":{},"name":"nginx","namespace":"default"},"spec":{"maxReplicas":10,"minReplicas":1,"scaleTargetRef":{"apiVersion":"apps/v1","kind":"Deployment","name":"nginx"},"targetCPUUtilizationPercentage":50}}
  creationTimestamp: "2019-10-30T19:42:43Z"
  name: nginx
  namespace: default
  resourceVersion: "220050"
  selfLink: /apis/autoscaling/v1/namespaces/default/horizontalpodautoscalers/nginx
  uid: 70d1067d-fb4d-11e9-8b2a-42010a8e013f
spec:
  maxReplicas: 10
  minReplicas: 1
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: nginx
  targetCPUUtilizationPercentage: 50
status:
  currentCPUUtilizationPercentage: 0
  currentReplicas: 3
  desiredReplicas: 3

Sebelum mengikuti contoh yang tersisa di halaman ini, hapus HPA:

kubectl delete hpa nginx

Saat Anda menghapus Horizontal Pod Autoscaler, jumlah replika Deployment tetap sama. Deployment tidak secara otomatis kembali ke statusnya sebelum Horizontal Pod Autoscaler diterapkan.

Anda dapat mempelajari lebih lanjut cara menghapus Horizontal Pod Autoscaler.

Penskalaan otomatis berdasarkan traffic load balancer

Penskalaan otomatis berbasis traffic adalah kemampuan GKE yang mengintegrasikan sinyal penggunaan traffic dari load balancer untuk menskalakan Pod secara otomatis.

Menggunakan traffic sebagai sinyal penskalaan otomatis mungkin dapat membantu karena traffic merupakan indikator beban utama yang melengkapi CPU dan memori. Integrasi bawaan dengan GKE memastikan bahwa penyiapannya mudah dan penskalaan otomatis bereaksi terhadap lonjakan traffic dengan cepat untuk memenuhi permintaan.

Penskalaan otomatis berbasis traffic diaktifkan oleh Pengontrol gateway dan kemampuan pengelolaan traffic global-nya. Untuk mempelajari lebih lanjut, lihat Penskalaan otomatis berbasis traffic.

Penskalaan otomatis berdasarkan traffic load balancer hanya tersedia untuk Workload gateway.

Persyaratan

Penskalaan otomatis berbasis traffic memiliki persyaratan berikut:

Didukung di GKE versi 1.31 dan yang lebih baru.
Gateway API diaktifkan di cluster GKE Anda.
Didukung untuk traffic yang melewati load balancer yang di-deploy menggunakan Gateway API dan gke-l7-global-external-managed, gke-l7-regional-external-managed, gke-l7-rilb, atau gke-l7-gxlb GatewayClass.

Batasan

Penskalaan otomatis berbasis traffic memiliki batasan berikut:

Tidak didukung oleh GatewayClass multi-cluster (gke-l7-global-external-managed-mc, gke-l7-regional-external-managed-mc, gke-l7-rilb-mc, dan gke-l7-gxlb-mc).
Tidak didukung untuk traffic yang menggunakan Service jenis LoadBalancer.
Harus ada hubungan yang jelas dan terisolasi antara komponen yang terlibat dalam penskalaan otomatis berbasis traffic. Satu Horizontal Pod Autoscaler harus dikhususkan untuk menskalakan satu Deployment (atau resource yang dapat diskalakan) yang diekspos oleh satu Service.
Setelah mengonfigurasi kapasitas Layanan menggunakan kolom maxRatePerEndpoint, berikan waktu yang cukup (biasanya satu menit, tetapi berpotensi hingga 15 menit di cluster besar) agar load balancer diperbarui dengan perubahan ini, sebelum mengonfigurasi Penskalaan Otomatis Pod Horizontal dengan metrik berbasis traffic. Hal ini memastikan layanan Anda tidak akan mengalami situasi sementara saat cluster Anda mencoba melakukan penskalaan otomatis berdasarkan metrik yang dikeluarkan oleh load balancer yang masih dalam proses konfigurasi.
Jika penskalaan otomatis berbasis traffic digunakan pada Layanan yang ditayangkan oleh beberapa load balancer (misalnya -- oleh Ingress dan Gateway, atau oleh dua Gateway), Horizontal Pod Autoscaler mungkin mempertimbangkan nilai traffic tertinggi dari setiap load balancer untuk membuat keputusan penskalaan, bukan jumlah nilai traffic dari semua load balancer.

Men-deploy penskalaan otomatis berbasis traffic

Latihan berikut menggunakan HorizontalPodAutoscaler untuk menskalakan Deployment store-autoscale secara otomatis berdasarkan traffic yang diterima. Gateway menerima traffic masuk dari internet untuk Pod. Autoscaler membandingkan sinyal traffic dari Gateway dengan kapasitas traffic per Pod yang dikonfigurasi pada resource Service store-autoscale. Dengan menghasilkan traffic ke Gateway, Anda memengaruhi jumlah Pod yang di-deploy.

Diagram berikut menunjukkan cara kerja penskalaan otomatis berbasis traffic:

HorizontalPodAutoscaler menskalakan Deployment berdasarkan traffic.

Untuk men-deploy penskalaan otomatis berbasis traffic, lakukan langkah berikut:

Untuk cluster Standard, pastikan GatewayClasses diinstal di cluster Anda. Untuk cluster Autopilot, GatewayClasses diinstal secara default.

kubectl get gatewayclass

Output akan mengonfirmasi bahwa resource GKE GatewayClass siap digunakan di cluster Anda:

NAME                               CONTROLLER                  ACCEPTED   AGE
gke-l7-global-external-managed     networking.gke.io/gateway   True       16h
gke-l7-regional-external-managed   networking.gke.io/gateway   True       16h
gke-l7-gxlb                        networking.gke.io/gateway   True       16h
gke-l7-rilb                        networking.gke.io/gateway   True       16h

Jika Anda tidak melihat output ini, aktifkan Gateway API di cluster GKE Anda.

Deploy aplikasi contoh dan load balancer Gateway ke cluster Anda:
```
kubectl apply -f https://raw.githubusercontent.com/GoogleCloudPlatform/gke-networking-recipes/master/gateway/docs/store-autoscale.yaml
```
Aplikasi contoh membuat:
- Deployment dengan 2 replika.
- Layanan dengan setelan GCPBackendPolicy terkait maxRatePerEndpoint ditetapkan ke 10. Untuk mempelajari kemampuan Gateway lebih lanjut, lihat Kemampuan GatewayClass.
- Gateway eksternal untuk mengakses aplikasi di internet. Untuk mempelajari lebih lanjut cara menggunakan load balancer Gateway, lihat Men-deploy Gateway.
- HTTPRoute yang cocok dengan semua traffic dan mengirimkannya ke Service store-autoscale.
Kapasitas layanan adalah elemen penting saat menggunakan penskalaan otomatis berbasis traffic karena menentukan jumlah traffic per Pod yang memicu peristiwa penskalaan otomatis. Konfigurasi ini menggunakan kolom maxRatePerEndpoint di GCPBackendPolicy yang terkait dengan Layanan, yang menentukan traffic maksimum yang harus diterima Layanan dalam permintaan per detik, per Pod. Kapasitas layanan bersifat khusus untuk aplikasi Anda.

Untuk mengetahui informasi selengkapnya, lihat Menentukan kapasitas Service.
Simpan manifes berikut sebagai hpa.yaml:
```
apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:
  name: store-autoscale
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: store-autoscale
  # Set the minimum and maximum number of replicas the Deployment can scale to.
  minReplicas: 1
  maxReplicas: 10
  # This section defines that scaling should be based on the fullness of load balancer
  # capacity, using the following configuration.
  metrics:
  - type: Object
    object:
      describedObject:
        kind: Service
        name: store-autoscale
      metric:
        # The name of the custom metric which measures how "full" a backend is
        # relative to its configured capacity.
        name: "autoscaling.googleapis.com|gclb-capacity-fullness"
      target:
        # The target average value for the metric. The autoscaler adjusts the number
        # of replicas to maintain an average capacity fullness of 70% across all Pods.
        averageValue: 70
        type: AverageValue
```
Catatan: Jika sebelumnya Anda menggunakan nama metrik autoscaling.googleapis.com|gclb-capacity-utilization, sebaiknya beralih ke nama metrik autoscaling.googleapis.com|gclb-capacity-fullness.

Manifes ini menjelaskan HorizontalPodAutoscaler dengan properti berikut:
- minReplicas dan maxReplicas: menetapkan jumlah replika minimum dan maksimum untuk Deployment ini. Dalam konfigurasi ini, jumlah Pod dapat diskalakan dari 1 hingga 10 replika.
- describedObject.name: store-autoscale: referensi ke Service store-autoscale yang menentukan kapasitas traffic.
- scaleTargetRef.name: store-autoscale: referensi ke Deployment store-autoscale yang menentukan resource yang diskalakan oleh Horizontal Pod Autoscaler.
- averageValue: 70: nilai rata-rata target penggunaan kapasitas 70%. Hal ini memberi margin pertumbuhan pada Horizontal Pod Autoscaler sehingga Pod yang berjalan dapat memproses traffic berlebih saat Pod baru sedang dibuat.
Catatan: Deployment atau Service tidak dapat direferensikan oleh lebih dari satu Horizontal Pod Autoscaler. Jika kondisi ini tidak terpenuhi, Horizontal Pod Autoscaler akan menghentikan penskalaan otomatis dan error akan muncul dalam peristiwa Horizontal Pod Autoscaler.

Horizontal Pod Autoscaler menghasilkan perilaku traffic berikut:

Jumlah Pod disesuaikan antara 1 hingga 10 replika untuk mencapai 70% dari tarif maksimum per endpoint. Hal ini akan menghasilkan 7 RPS per Pod saat maxRatePerEndpoint=10.
Di atas 7 RPS per pod, skala Pod akan ditingkatkan sampai mencapai maksimum 10 replika atau sampai traffic rata-ratanya adalah 7 RPS per Pod.
Jika traffic dikurangi, skala Pod akan diturunkan ke kecepatan yang wajar menggunakan algoritma Horizontal Pod Autoscaler.

Anda juga dapat men-deploy generator traffic untuk memvalidasi perilaku penskalaan otomatis berbasis traffic.

Pada 30 RPS, Deployment diskalakan menjadi 5 replika sehingga setiap replika idealnya menerima 6 RPS traffic, yang akan menunjukkan pemanfaatan sebesar 60% per Pod. Jumlah ini berada di bawah target pemanfaatan 70% sehingga Pod diskalakan dengan tepat. Bergantung pada fluktuasi traffic, jumlah replika yang diskalakan otomatis juga mungkin berfluktuasi. Untuk mengetahui deskripsi yang lebih mendetail tentang penghitungan jumlah replika, lihat Perilaku penskalaan otomatis.

Penskalaan otomatis berdasarkan metrik kustom atau eksternal

Guna membuat Horizontal Pod Autoscaler untuk metrik kustom dan metrik eksternal, lihat Mengoptimalkan penskalaan otomatis Pod berdasarkan metrik.

Penskalaan otomatis berdasarkan beberapa metrik

Contoh ini membuat Horizontal Pod Autoscaler yang melakukan penskalaan otomatis berdasarkan penggunaan CPU dan metrik kustom bernama packets_per_second.

Jika Anda telah mengikuti contoh sebelumnya dan masih memiliki Horizontal Pod Autoscaler bernama nginx, hapus sebelum mengikuti contoh ini.

Contoh ini memerlukan apiVersion: autoscaling/v2. Untuk mengetahui informasi selengkapnya tentang API yang tersedia, lihat Versi API untuk objek HorizontalPodAutoscaler.

Simpan manifes YAML ini sebagai file bernama nginx-multiple.yaml:

apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:
  name: nginx
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: nginx
  minReplicas: 1
  maxReplicas: 10
  metrics: # The metrics to base the autoscaling on.
  - type: Resource
    resource:
      name: cpu # Scale based on CPU utilization.
      target:
        type: Utilization
        averageUtilization: 50
        # The HPA will scale the replicas to try and maintain an average
        # CPU utilization of 50% across all Pods.
  - type: Resource
    resource:
      name: memory # Scale based on memory usage.
      target:
        type: AverageValue
        averageValue: 100Mi
        # The HPA will scale the replicas to try and maintain an average
        # memory usage of 100 Mebibytes (MiB) across all Pods.
  # Uncomment these lines if you create the custom packets_per_second metric and
  # configure your app to export the metric.
  # - type: Pods
  #   pods:
  #     metric:
  #       name: packets_per_second
  #     target:
  #       type: AverageValue
  #       averageValue: 100

Terapkan manifes YAML:

kubectl apply -f nginx-multiple.yaml

Saat dibuat, Horizontal Pod Autoscaler memantau Deployment nginx untuk mengetahui pemakaian CPU rata-rata, penggunaan memori rata-rata, dan (jika Anda membatalkan komentar) metrik packets_per_second kustom. Horizontal Pod Autoscaler menskalakan Deployment secara otomatis berdasarkan metrik yang nilainya akan membuat peristiwa penskalaan otomatis yang lebih besar.

Mengonfigurasi profil HPA Performa

Profil HPA Performa meningkatkan waktu reaksi Horizontal Pod Autoscaler, sehingga dapat menghitung ulang sejumlah besar objek HorizontalPodAutoscaler dengan cepat (hingga 1.000 objek dalam versi minor 1.31-1.32 dan 5.000 objek dalam versi 1.33 atau yang lebih baru).

Profil ini diaktifkan secara otomatis di cluster Autopilot yang memenuhi syarat dengan bidang kontrol yang menjalankan GKE versi 1.32 atau yang lebih baru. Untuk cluster Standard, profil ini otomatis diaktifkan di cluster yang memenuhi syarat dengan bidang kontrol yang menjalankan GKE versi 1.33 atau yang lebih baru.

Cluster Standard dikecualikan dari pengaktifan otomatis profil HPA Performa jika memenuhi semua kondisi berikut:

Cluster diupgrade dari versi sebelumnya ke versi 1.33 atau yang lebih baru.
Cluster memiliki setidaknya satu node pool dengan salah satu jenis machine berikut: e2-micro, e2-custom-micro, g1-small, f1-micro.
Penyediaan otomatis node tidak diaktifkan.

Anda juga dapat mengaktifkan profil HPA Performa di cluster yang ada jika cluster tersebut memenuhi persyaratan.

Persyaratan

Untuk mengaktifkan profil HPA Performa, pastikan cluster Autopilot dan Standar Anda memenuhi persyaratan berikut:

Bidang kontrol Anda menjalankan GKE versi 1.31 atau yang lebih baru.
Jika bidang kontrol Anda menjalankan GKE versi 1.31, aktifkan pengumpulan metrik sistem.
Autoscaling API diaktifkan di cluster Anda.
Semua Akun Layanan node telah diberi peran roles/autoscaling.metricsWriter.
Jika Anda menggunakan Kontrol Layanan VPC, pastikan Autoscaling API disertakan dalam perimeter layanan Anda.

Aktifkan profil HPA Performa

Untuk mengaktifkan profil HPA Performa di cluster Anda, gunakan perintah berikut:

gcloud container clusters update CLUSTER_NAME \
    --location=LOCATION \
    --project=PROJECT_ID \
    --hpa-profile=performance

Ganti:

CLUSTER_NAME: Nama cluster.
LOCATION: Zona atau region komputasi (misalnya, us-central1-a atau us-central1) untuk cluster.
PROJECT_ID: ID project Google Cloud Anda.

Menonaktifkan profil HPA Performa

Untuk menonaktifkan profil HPA Performa di cluster, gunakan perintah berikut:

gcloud container clusters update CLUSTER_NAME \
    --location=LOCATION \
    --project=PROJECT_ID \
    --hpa-profile=none

Ganti:

CLUSTER_NAME: Nama cluster.
LOCATION: Zona atau region komputasi (misalnya, us-central1-a atau us-central1) untuk cluster.
PROJECT_ID: ID project Google Cloud Anda.

Melihat detail tentang Horizontal Pod Autoscaler

Untuk melihat konfigurasi dan statistik Horizontal Pod Autoscaler, gunakan perintah berikut:

kubectl describe hpa HPA_NAME

Ganti HPA_NAME dengan nama objek HorizontalPodAutoscaler Anda.

Jika Horizontal Pod Autoscaler menggunakan apiVersion: autoscaling/v2 dan didasarkan pada beberapa metrik, perintah kubectl describe hpa hanya menampilkan metrik CPU. Untuk melihat semua metrik, gunakan perintah berikut:

kubectl describe hpa.v2.autoscaling HPA_NAME

Ganti HPA_NAME dengan nama objek HorizontalPodAutoscaler Anda.

Setiap status Horizontal Pod Autoscaler saat ini ditampilkan di kolom Conditions, dan peristiwa penskalaan otomatis dicantumkan di kolom Events.

Outputnya mirip dengan hal berikut ini:

Name:                                                  nginx
Namespace:                                             default
Labels:                                                <none>
Annotations:                                           kubectl.kubernetes.io/last-applied-configuration:
                                                         {"apiVersion":"autoscaling/v2","kind":"HorizontalPodAutoscaler","metadata":{"annotations":{},"name":"nginx","namespace":"default"},"s...
CreationTimestamp:                                     Tue, 05 May 2020 20:07:11 +0000
Reference:                                             Deployment/nginx
Metrics:                                               ( current / target )
  resource memory on pods:                             2220032 / 100Mi
  resource cpu on pods  (as a percentage of request):  0% (0) / 50%
Min replicas:                                          1
Max replicas:                                          10
Deployment pods:                                       1 current / 1 desired
Conditions:
  Type            Status  Reason              Message
  ----            ------  ------              -------
  AbleToScale     True    ReadyForNewScale    recommended size matches current size
  ScalingActive   True    ValidMetricFound    the HPA was able to successfully calculate a replica count from memory resource
  ScalingLimited  False   DesiredWithinRange  the desired count is within the acceptable range
Events:                                                <none>

Menghapus Horizontal Pod Autoscaler

Anda dapat menghapus Horizontal Pod Autoscaler menggunakan konsol Google Cloud atau perintah kubectl delete.

Konsol

Untuk menghapus Horizontal Pod Autoscaler nginx:

Buka halaman Workloads di konsol Google Cloud .

Buka Workloads
Klik nama Deployment nginx.
Klik Tindakan > Skalakan otomatis.
Klik Hapus.

`kubectl delete`

Untuk menghapus nginx Horizontal Pod Autoscaler, gunakan perintah berikut:

kubectl delete hpa nginx

Saat Anda menghapus Horizontal Pod Autoscaler, Deployment atau (atau objek deployment lainnya) akan tetap berada dalam skala yang ada, dan tidak kembali ke jumlah replika dalam manifes asli Deployment. Untuk menskalakan Deployment kembali secara manual ke tiga Pod, Anda dapat menggunakan perintah kubectl scale:

kubectl scale deployment nginx --replicas=3

Pembersihan

Hapus Horizontal Pod Autoscaler, jika Anda belum melakukannya:
```
kubectl delete hpa nginx
```
Hapus Deployment nginx:
```
kubectl delete deployment nginx
```
Jika ingin, hapus cluster.

Pemecahan masalah

Untuk mendapatkan saran tentang pemecahan masalah, lihat Memecahkan masalah penskalaan otomatis Pod horizontal.

Langkah berikutnya

Pelajari Penskalaan Otomatis Pod Horizontal lebih lanjut.
Pelajari Penskalaan Otomatis Pod Vertikal lebih lanjut.
Pelajari cara mengoptimalkan penskalaan otomatis Pod berdasarkan metrik.
Pelajari penskalaan otomatis Deployment dengan Metrik Kustom lebih lanjut.
Pelajari cara Menetapkan Resource CPU ke Container dan Pod.
Pelajari cara Menetapkan Resource Memori ke Container dan Pod.

Mengonfigurasi penskalaan otomatis Pod horizontal

Sebelum memulai

Versi API untuk objek HorizontalPodAutoscaler

Membuat contoh Deployment

Penskalaan otomatis berdasarkan penggunaan resource

Konsol

kubectl apply

kubectl autoscale

Konsol

kubectl get

Penskalaan otomatis berdasarkan traffic load balancer

Persyaratan

Batasan

Men-deploy penskalaan otomatis berbasis traffic

Penskalaan otomatis berdasarkan metrik kustom atau eksternal

Penskalaan otomatis berdasarkan beberapa metrik

Mengonfigurasi profil HPA Performa

Persyaratan

Aktifkan profil HPA Performa

Menonaktifkan profil HPA Performa

Melihat detail tentang Horizontal Pod Autoscaler

Menghapus Horizontal Pod Autoscaler

Konsol

kubectl delete

Pembersihan

Pemecahan masalah

Langkah berikutnya

Versi API untuk objek `HorizontalPodAutoscaler`

`kubectl apply`

`kubectl autoscale`

`kubectl get`

`kubectl delete`