Metrik pemanfaatan resource fleet

Halaman ini membahas lebih dalam metrik pemanfaatan resource tim dan armada dengan menjelaskan cara menghitung metrik ini dan memberikan tips tentang cara menggunakan metrik ini untuk mengoptimalkan penggunaan resource.

Anda dapat melihat metrik ini di dasbor berikut:

Metrik ini menjelaskan seberapa efektif cluster Anda memanfaatkan resource yang tersedia secara fisik yang Anda bayar atau resource yang Anda alokasikan di hardware lokal. Anda dapat menggunakan informasi ini untuk memahami efektivitas pemanfaatan resource dalam skala besar, di tingkat cakupan fleet atau tim. Hal ini dapat membantu Anda mengoptimalkan ukuran cluster dan alokasi resource di seluruh cluster dan namespace, atau mengoptimalkan cara tim aplikasi meminta dan mencadangkan resource.

Menggunakan metrik pemanfaatan resource

Tips berikut dapat membantu Anda menggunakan metrik di konsol untuk mengidentifikasi dan mengatasi masalah:

  • Jika Total penggunaan CPU/Memori/Disk armada Anda menunjukkan penggunaan yang tinggi atau rendah secara tidak terduga selama tujuh hari terakhir, selalu periksa diagram Penggunaan CPU/Memori/Disk menurut armada yang sesuai untuk mengevaluasi apakah penggunaan yang tidak terduga tersebut konstan atau disebabkan oleh lonjakan penggunaan.
  • Jika Penggunaan CPU/Memori/Disk teratas menurut cluster menunjukkan cluster individual yang berperilaku berbeda dari yang lain, pertimbangkan untuk menyelidiki cluster tertentu tersebut lebih cermat. Pertimbangkan untuk mengubah ukuran cluster jika memungkinkan.
  • Jika Penggunaan CPU/Memori/Disk teratas menurut namespace menunjukkan lonjakan yang tidak terduga selama tujuh hari terakhir, pertimbangkan untuk menyelidiki apakah beban kerja tertentu menyebabkan lonjakan tersebut. Kemungkinan solusi adalah mendistribusikan ulang beban kerja di seluruh resource.
  • Penggunaan CPU/Memori/Disk menurut fleet memungkinkan Anda mengamati rasio antara resource yang digunakan dan yang diminta. Perbedaan besar antara keduanya mungkin berarti tim aplikasi meminta dan mencadangkan terlalu banyak resource.

Memahami metrik pemanfaatan resource

Metrik berikut disediakan di dasbor ringkasan cakupan GKE, armada, dan tim, yang dihitung menggunakan informasi dari Cloud Monitoring di cluster armada Anda.

Anda dapat melihat metrik tingkat fleet di dasbor ringkasan GKE dan fleet. Metrik tingkat tim tersedia di dasbor ringkasan tim dan GKE.

Metrik CPU

  • Total pemakaian CPU:
    • Untuk metrik tingkat fleet, rata-rata semua titik waktu untuk jangka waktu tertentu, dengan titik waktu adalah rasio antara resource yang dapat dialokasikan dan yang digunakan di semua cluster yang terdaftar ke fleet.
      • Allocatable: Jumlah CPU yang dialokasikan ke semua node di semua cluster yang terdaftar ke fleet. Dihitung dari metrik node/cpu/allocatable_cores.
      • Digunakan: Jumlah CPU yang digunakan oleh semua container di semua cluster yang terdaftar ke armada. Dihitung dari metrik container/cpu/core_usage_time.
    • Untuk dasbor Monitoring tim, rata-rata semua titik waktu untuk jangka waktu tertentu, dengan titik waktu adalah rasio antara resource yang diminta dan digunakan di semua namespace yang terkait dengan cakupan tim.
      • Diminta: Jumlah CPU yang diminta oleh semua container di semua namespace yang terkait dengan cakupan tim. Dihitung dari metrik container/cpu/request_cores.
      • Digunakan: Jumlah CPU yang digunakan oleh semua container di semua namespace yang terkait dengan cakupan tim. Dihitung dari metrik container/cpu/core_usage_time.
  • Penggunaan CPU menurut armada/tim:
    • Untuk tingkat fleet, hubungan antara resource yang digunakan, diminta, dan dialokasikan.
      • Digunakan: Jumlah CPU yang digunakan oleh semua container di semua cluster yang terdaftar ke armada. Dihitung dari metrik container/cpu/core_usage_time.
      • Diminta: Jumlah CPU yang diminta oleh semua container di semua cluster yang terdaftar ke fleet. Dihitung dari metrik container/cpu/request_cores.
      • Allocatable: Jumlah CPU yang dialokasikan ke semua node di semua cluster yang terdaftar ke fleet. Dihitung dari metrik node/cpu/allocatable_cores.
    • Untuk tingkat tim, hubungan antara batas resource, dan resource yang digunakan dan diminta.
      • Digunakan: Jumlah CPU yang digunakan oleh semua container di semua namespace yang terkait dengan cakupan tim. Dihitung dari metrik container/cpu/core_usage_time.
      • Diminta: Jumlah CPU yang diminta oleh semua container di semua namespace yang terkait dengan cakupan tim. Dihitung dari metrik container/cpu/request_cores.
      • Batas: Jumlah CPU maksimum yang tersedia untuk semua container di semua namespace yang terkait dengan cakupan tim. Dihitung dari metrik container/cpu/limit_cores.
  • Penggunaan CPU teratas menurut cluster: Daftar cluster diurutkan berdasarkan rata-rata semua titik waktu untuk jangka waktu tertentu, dengan titik waktu adalah rasio antara resource yang dapat dialokasikan dan yang digunakan untuk cluster tertentu.
  • Penggunaan CPU teratas menurut namespace: Daftar namespace yang diurutkan berdasarkan rata-rata semua titik waktu untuk jangka waktu tertentu, dengan titik waktu adalah rasio antara resource yang digunakan dan yang diminta untuk namespace tertentu.

Metrik memori

  • Total pemanfaatan memori:
    • Untuk metrik tingkat fleet, ini mengacu pada rata-rata semua titik waktu untuk jangka waktu tertentu dengan titik waktu adalah rasio antara resource yang dapat dialokasikan dan yang digunakan di semua cluster yang termasuk dalam fleet.
      • Allocatable: Jumlah memori yang dialokasikan ke semua node di semua cluster yang terdaftar dalam fleet. Dihitung dari metrik node/memory/allocatable_byte.
      • Digunakan: Jumlah memori yang tidak dapat dievakuasi yang digunakan oleh semua container di semua cluster yang terdaftar dalam fleet. Dihitung dari metrik container/memory/used_bytes.
    • Untuk metrik tingkat tim, ini mengacu pada rata-rata semua titik waktu untuk jangka waktu tertentu dengan titik waktu adalah rasio antara resource yang diminta dan digunakan di semua namespace yang termasuk dalam cakupan tim.
      • Diminta: Jumlah memori yang diminta oleh semua container di semua namespace yang terkait dengan cakupan. Dihitung dari metrik container/memory/request_bytes.
      • Digunakan: Jumlah memori yang tidak dapat dikeluarkan yang digunakan oleh semua container di semua namespace yang terkait dengan cakupan. Dihitung dari metrik container/memory/used_bytes.
  • Penggunaan memori menurut tim/kumpulan:
    • Untuk tingkat fleet, hubungan antara resource yang digunakan, diminta, dan dialokasikan.
      • Digunakan: Jumlah memori yang tidak dapat dievakuasi yang digunakan oleh semua container di semua cluster yang terdaftar dalam fleet. Dihitung dari metrik container/memory/used_bytes.
      • Diminta: Jumlah memori yang diminta oleh semua container di semua cluster yang terdaftar ke fleet. Dihitung dari metrik container/memory/request_bytes.
      • Allocatable: Jumlah memori yang dialokasikan ke semua node di semua cluster yang terdaftar dalam fleet. Dihitung dari metrik node/memory/allocatable_byte.
    • Untuk tingkat tim, hubungan antara batas resource, dan resource yang digunakan dan diminta.
      • Digunakan: Jumlah memori yang tidak dapat dikeluarkan yang digunakan oleh semua container di semua namespace yang terkait dengan cakupan. Dihitung dari metrik container/memory/used_bytes.
      • Diminta: Jumlah memori yang diminta oleh semua container di semua namespace yang terkait dengan cakupan. Dihitung dari metrik container/memory/request_bytes.
      • Batas: Jumlah maksimum memori yang tersedia untuk semua container di semua namespace yang terkait dengan cakupan. Dihitung dari metrik container/memory/limit_bytes.
  • Penggunaan memori teratas menurut cluster: Daftar cluster diurutkan berdasarkan rata-rata semua titik waktu untuk jangka waktu tertentu, dengan titik waktu adalah rasio antara resource yang dapat dialokasikan dan yang digunakan untuk cluster tertentu.
    • Dapat dialokasikan: Jumlah memori yang dialokasikan ke semua node dalam cluster. Dihitung dari metrik node/memory/allocatable_byte.
    • Digunakan: Jumlah memori yang tidak dapat di-evict yang digunakan oleh semua container dalam cluster. Dihitung dari metrik container/memory/used_bytes.
  • Penggunaan memori teratas menurut namespace: Daftar namespace yang diurutkan berdasarkan rata-rata semua titik waktu untuk jangka waktu tertentu, dengan titik waktu adalah rasio antara resource yang digunakan dan yang diminta untuk namespace tertentu.
    • Digunakan: Jumlah memori yang tidak dapat dikeluarkan yang digunakan oleh semua container dalam namespace. Dihitung dari metrik container/memory/used_bytes.
    • Diminta: Jumlah memori yang diminta oleh semua container dalam namespace. Dihitung dari metrik container/memory/request_bytes.

Metrik disk

  • Total pemanfaatan disk:
    • Untuk metrik tingkat fleet, ini mengacu pada rata-rata semua titik waktu untuk jangka waktu tertentu, dengan titik waktu adalah rasio antara resource yang dapat dialokasikan dan yang digunakan di semua cluster yang termasuk dalam fleet.
    • Untuk metrik tingkat tim, ini mengacu pada rata-rata semua titik waktu untuk jangka waktu tertentu dengan titik waktu adalah rasio antara resource yang diminta dan digunakan di semua namespace yang termasuk dalam cakupan tim.
  • Penggunaan disk menurut tim/kumpulan VM:
    • Untuk tingkat fleet, hubungan antara resource yang digunakan, diminta, dan dialokasikan.
    • Untuk tingkat tim, hubungan antara batas resource, dan resource yang digunakan dan diminta.
  • Penggunaan disk teratas menurut cluster: Daftar cluster diurutkan berdasarkan rata-rata semua titik waktu untuk jangka waktu tertentu dengan titik waktu adalah rasio antara resource yang dapat dialokasikan dan yang digunakan untuk cluster tertentu.
  • Penggunaan disk teratas menurut namespace: Daftar namespace yang diurutkan berdasarkan rata-rata semua titik waktu untuk jangka waktu tertentu, dengan titik waktu adalah rasio antara resource yang digunakan dan yang diminta untuk namespace tertentu.

Distribusi error menurut namespace (khusus tingkat tim)

Daftar namespace yang diurutkan berdasarkan jumlah log error tertinggi untuk jangka waktu tertentu. Log dikumpulkan dari Cloud Logging.

Mulai ulang distribusi jumlah menurut namespace (khusus tingkat tim)

Daftar namespace yang diurutkan berdasarkan jumlah restart penampung tertinggi untuk jangka waktu tertentu. Dihitung dari metrik container/restart_count.

Pemecahan masalah

Metrik gagal dimuat untuk cluster baru

Jika Anda telah membuat cluster baru, bergantung pada jangka waktu yang Anda pilih, Anda mungkin melihat No Data di seluruh dasbor Monitoring, atau Anda mungkin melihat metrik. Misalnya, jika Anda membuat cluster dalam satu jam terakhir, dan memilih jangka waktu 1 jam atau 6 jam, dasbor mungkin menampilkan beberapa metrik untuk beban kerja Anda. Namun, jika Anda memilih periode waktu 1 hari atau lebih, Anda mungkin melihat No data ditampilkan di seluruh dasbor.

Hal ini karena Cloud Monitoring mengumpulkan data dalam periode (interval) yang berbeda untuk jangka waktu yang berbeda. Untuk jangka waktu 1 jam dan 6 jam, data dikumpulkan dalam periode 1 menit. Jadi, jika cluster Anda sudah ada selama beberapa menit, Anda akan melihat metrik untuk jangka waktu ini.

Untuk jangka waktu 1 hari dan 1 minggu, Cloud Monitoring mengumpulkan data dalam jangka waktu 1 jam. Jika cluster Anda sudah ada kurang dari satu jam, Anda mungkin tidak melihat data untuk jangka waktu ini.

Jika Anda mengalami error ini, periksa dasbor setelah lebih banyak waktu berlalu sejak pembuatan cluster baru.