Metrik pemanfaatan resource fleet

Halaman ini membahas lebih dalam metrik pemanfaatan resource tim dan fleet dengan menjelaskan cara penghitungan metrik ini dan memberikan tips untuk cara menggunakan metrik ini guna mengoptimalkan penggunaan resource.

Anda dapat melihat metrik ini di dasbor berikut:

Metrik ini menjelaskan seberapa efektif cluster Anda menggunakan resource yang tersedia secara fisik yang Anda bayar atau resource yang Anda alokasikan di hardware lokal. Anda dapat menggunakan informasi ini untuk memahami efektivitas penggunaan resource dalam skala besar, di tingkat cakupan tim atau fleet. Hal ini dapat membantu Anda mengoptimalkan ukuran cluster dan alokasi resource di seluruh cluster dan namespace, atau mengoptimalkan cara tim aplikasi meminta dan mencadangkan resource.

Menggunakan metrik penggunaan resource

Tips berikut dapat membantu Anda menggunakan metrik di konsol untuk mengidentifikasi dan mengatasi masalah:

  • Jika Total penggunaan CPU/Memori/Disk fleet Anda menunjukkan penggunaan yang tinggi atau rendah secara tidak terduga selama tujuh hari terakhir, selalu periksa diagram Penggunaan CPU/Memori/Disk menurut fleet yang sesuai untuk mengevaluasi apakah penggunaan yang tidak terduga tersebut konstan atau disebabkan oleh lonjakan penggunaan.
  • Jika Penggunaan CPU/Memori/Disk teratas menurut cluster menunjukkan setiap cluster yang berperilaku berbeda dengan yang lainnya, pertimbangkan untuk menyelidiki cluster tertentu tersebut lebih lanjut. Pertimbangkan untuk mengubah ukuran cluster jika memungkinkan.
  • Jika Penggunaan CPU/Memori/Disk teratas menurut namespace menunjukkan lonjakan yang tidak terduga selama tujuh hari terakhir, pertimbangkan untuk menyelidiki apakah beban kerja tertentu menyebabkan lonjakan tersebut. Solusi yang mungkin dilakukan adalah mendistribusikan ulang beban kerja di seluruh resource.
  • Penggunaan CPU/Memori/Disk menurut fleet memungkinkan Anda mengamati rasio antara resource yang digunakan dan diminta. Perbedaan besar antara keduanya mungkin berarti bahwa tim aplikasi meminta dan mencadangkan terlalu banyak resource.

Memahami metrik penggunaan resource

Metrik berikut disediakan di dasbor ringkasan cakupan tim, fleet, dan GKE Enterprise, yang dihitung menggunakan informasi dari Pemantauan Cloud di cluster fleet Anda.

Anda dapat melihat metrik tingkat fleet di dasbor ringkasan GKE Enterprise dan fleet. Metrik tingkat tim tersedia di dasbor ringkasan tim dan GKE Enterprise.

Metrik CPU

  • Total penggunaan CPU:
    • Untuk metrik tingkat fleet, rata-rata semua titik waktu untuk jangka waktu tertentu dengan titik waktu adalah rasio antara resource yang dapat dialokasikan dan yang digunakan di semua cluster yang terdaftar ke fleet.
      • Allocatable: Jumlah CPU yang dialokasikan ke semua node di semua cluster yang terdaftar ke fleet. Dihitung dari metrik node/cpu/allocatable_cores.
      • Digunakan: Jumlah CPU yang digunakan oleh semua container di semua cluster yang terdaftar ke fleet. Dihitung dari metrik container/cpu/core_usage_time.
    • Untuk dasbor Monitoring tim, rata-rata semua titik waktu untuk jangka waktu tertentu, dengan titik waktu adalah rasio antara resource yang diminta dan digunakan di semua namespace yang terkait dengan cakupan tim.
      • Diminta: Jumlah CPU yang diminta oleh semua penampung di seluruh namespace yang terkait dengan cakupan tim. Dihitung dari metrik container/cpu/request_cores.
      • Digunakan: Jumlah CPU yang digunakan oleh semua penampung di semua namespace yang terkait dengan cakupan tim. Dihitung dari metrik container/cpu/core_usage_time.
  • Pemakaian CPU menurut grup/tim:
    • Untuk tingkat fleet, hubungan antara resource yang digunakan, diminta, dan dialokasikan.
      • Digunakan: Jumlah CPU yang digunakan oleh semua container di semua cluster yang terdaftar ke fleet. Dihitung dari metrik container/cpu/core_usage_time.
      • Diminta: Jumlah CPU yang diminta oleh semua container di semua cluster yang terdaftar ke fleet. Dihitung dari metrik container/cpu/request_cores.
      • Allocatable: Jumlah CPU yang dialokasikan ke semua node di semua cluster yang terdaftar ke fleet. Dihitung dari metrik node/cpu/allocatable_cores.
    • Untuk tingkat tim, hubungan antara batas resource, dan resource yang digunakan dan diminta.
      • Digunakan: Jumlah CPU yang digunakan oleh semua penampung di semua namespace yang terkait dengan cakupan tim. Dihitung dari metrik container/cpu/core_usage_time.
      • Diminta: Jumlah CPU yang diminta oleh semua penampung di seluruh namespace yang terkait dengan cakupan tim. Dihitung dari metrik container/cpu/request_cores.
      • Batas: Jumlah maksimum CPU yang tersedia untuk semua penampung di semua namespace yang terkait dengan cakupan tim. Dihitung dari metrik container/cpu/limit_cores.
  • Penggunaan CPU teratas menurut cluster: Daftar cluster yang diurutkan berdasarkan rata-rata semua titik waktu untuk jangka waktu tertentu, dengan titik waktu adalah rasio antara resource yang dapat dialokasikan dan yang digunakan untuk cluster tertentu.
  • Penggunaan CPU teratas menurut namespace: Daftar namespace yang diurutkan berdasarkan rata-rata semua titik waktu untuk jangka waktu tertentu, dengan titik waktu adalah rasio antara resource yang digunakan dan diminta untuk namespace tertentu.

Metrik memori

  • Total penggunaan memori:
    • Untuk metrik tingkat fleet, ini mengacu pada rata-rata semua titik waktu untuk jangka waktu tertentu, dengan titik waktu adalah rasio antara resource yang dapat dialokasikan dan yang digunakan di semua cluster yang termasuk dalam fleet.
      • Allocatable: Jumlah memori yang dialokasikan ke semua node di semua cluster yang terdaftar ke fleet. Dihitung dari metrik node/memory/allocatable_byte.
      • Digunakan: Jumlah memori yang tidak dapat dihapus yang digunakan oleh semua container di semua cluster yang terdaftar ke fleet. Dihitung dari metrik container/memory/used_bytes.
    • Untuk metrik tingkat tim, ini mengacu pada rata-rata semua titik waktu untuk jangka waktu tertentu, dengan titik waktu adalah rasio antara resource yang diminta dan yang digunakan di semua namespace yang termasuk dalam cakupan tim.
      • Diminta: Jumlah memori yang diminta oleh semua penampung di semua namespace yang dikaitkan dengan cakupan. Dihitung dari metrik container/memory/request_bytes.
      • Digunakan: Jumlah memori yang tidak dapat dihapus yang digunakan oleh semua container di semua namespace yang terkait dengan cakupan. Dihitung dari metrik container/memory/used_bytes.
  • Pemakaian memori menurut grup/tim:
    • Untuk tingkat fleet, hubungan antara resource yang digunakan, diminta, dan dialokasikan.
      • Digunakan: Jumlah memori yang tidak dapat dihapus yang digunakan oleh semua container di semua cluster yang terdaftar ke fleet. Dihitung dari metrik container/memory/used_bytes.
      • Diminta: Jumlah memori yang diminta oleh semua container di semua cluster yang terdaftar ke fleet. Dihitung dari metrik container/memory/request_bytes.
      • Allocatable: Jumlah memori yang dialokasikan ke semua node di semua cluster yang terdaftar ke fleet. Dihitung dari metrik node/memory/allocatable_byte.
    • Untuk tingkat tim, hubungan antara batas resource, dan resource yang digunakan dan diminta.
      • Digunakan: Jumlah memori yang tidak dapat dihapus yang digunakan oleh semua container di semua namespace yang terkait dengan cakupan. Dihitung dari metrik container/memory/used_bytes.
      • Diminta: Jumlah memori yang diminta oleh semua penampung di semua namespace yang dikaitkan dengan cakupan. Dihitung dari metrik container/memory/request_bytes.
      • Batas: Jumlah maksimum memori yang tersedia untuk semua container di semua namespace yang terkait dengan cakupan. Dihitung dari metrik container/memory/limit_bytes.
  • Penggunaan memori teratas menurut cluster: Daftar cluster yang diurutkan berdasarkan rata-rata semua titik waktu untuk jangka waktu tertentu, dengan titik waktu adalah rasio antara resource yang dapat dialokasikan dan yang digunakan untuk cluster tertentu.
    • Allocatable: Jumlah memori yang dialokasikan ke semua node dalam cluster. Dihitung dari metrik node/memory/allocatable_byte.
    • Digunakan: Jumlah memori yang tidak dapat dihapus yang digunakan oleh semua penampung dalam cluster. Dihitung dari metrik container/memory/used_bytes.
  • Penggunaan memori teratas menurut namespace: Daftar namespace yang diurutkan berdasarkan rata-rata semua titik waktu untuk jangka waktu tertentu, dengan titik waktu adalah rasio antara resource yang digunakan dan diminta untuk namespace tertentu.

Metrik disk

  • Total penggunaan disk:
    • Untuk metrik tingkat fleet, ini mengacu pada rata-rata semua titik waktu untuk jangka waktu tertentu, dengan titik waktu adalah rasio antara resource yang dapat dialokasikan dan yang digunakan di semua cluster yang termasuk dalam fleet.
    • Untuk metrik tingkat tim, ini mengacu pada rata-rata semua titik waktu untuk jangka waktu tertentu, dengan titik waktu adalah rasio antara resource yang diminta dan yang digunakan di semua namespace yang termasuk dalam cakupan tim.
  • Penggunaan disk menurut grup/tim:
    • Untuk tingkat fleet, hubungan antara resource yang digunakan, diminta, dan dialokasikan.
    • Untuk tingkat tim, hubungan antara batas resource, dan resource yang digunakan dan diminta.
  • Penggunaan disk teratas menurut cluster: Daftar cluster yang diurutkan berdasarkan rata-rata semua titik waktu untuk jangka waktu tertentu, dengan titik waktu adalah rasio antara resource yang dapat dialokasikan dan yang digunakan untuk cluster tertentu.
  • Penggunaan disk teratas menurut namespace: Daftar namespace yang diurutkan berdasarkan rata-rata semua titik waktu untuk jangka waktu tertentu, dengan titik waktu adalah rasio antara resource yang digunakan dan diminta untuk namespace tertentu.

Distribusi error menurut namespace (khusus tingkat tim)

Daftar namespace diurutkan berdasarkan jumlah log error tertinggi untuk periode waktu tertentu. Log dikumpulkan dari Cloud Logging.

Memulai ulang distribusi jumlah menurut namespace (khusus tingkat tim)

Daftar namespace diurutkan berdasarkan jumlah tertinggi mulai ulang penampung untuk periode waktu tertentu. Dihitung dari metrik container/restart_count.

Pemecahan masalah

Metrik gagal dimuat untuk cluster baru

Jika telah membuat cluster baru, bergantung pada jangka waktu yang dipilih, Anda mungkin melihat No Data di seluruh dasbor Monitoring, atau Anda mungkin melihat metrik. Misalnya, jika Anda membuat cluster dalam satu jam terakhir, dan memilih periode waktu 1 jam atau 6 jam, dasbor mungkin menampilkan beberapa metrik untuk beban kerja Anda. Namun, jika memilih periode waktu 1 hari atau lebih, Anda mungkin melihat No data ditampilkan di seluruh dasbor.

Hal ini karena Cloud Monitoring mengumpulkan data dalam periode (interval) yang berbeda untuk jangka waktu yang berbeda. Untuk periode waktu 1 jam dan 6 jam, data dikumpulkan dalam periode 1 menit. Jadi, jika cluster Anda telah ada selama beberapa menit, Anda akan melihat metrik untuk periode waktu ini.

Untuk jangka waktu 1 hari dan 1 minggu, Cloud Monitoring mengumpulkan data dalam periode 1 jam. Jika cluster Anda sudah ada selama kurang dari satu jam, Anda mungkin tidak akan melihat data untuk jangka waktu ini.

Jika Anda mengalami error ini, periksa dasbor setelah lebih banyak waktu berlalu sejak membuat cluster baru.