Metrik pemanfaatan resource fleet

Halaman ini membahas lebih dalam tentang metrik pemanfaatan resource tim dan fleet dengan menjelaskan cara penghitungan metrik ini dan memberikan tips mengenai cara menggunakan metrik ini untuk mengoptimalkan penggunaan resource.

Anda dapat melihat metrik ini di dasbor berikut:

Metrik ini menjelaskan seberapa efektif cluster Anda dalam memanfaatkan resource yang tersedia secara fisik yang Anda bayar atau resource yang Anda alokasikan di hardware lokal. Anda dapat menggunakan informasi ini untuk memahami efektivitas pemanfaatan resource dalam skala besar, pada tingkat cakupan fleet atau tim. Hal ini dapat membantu Anda mengoptimalkan ukuran cluster dan alokasi resource di seluruh cluster dan namespace, atau mengoptimalkan cara tim aplikasi meminta dan memesan resource.

Menggunakan metrik pemanfaatan resource

Tips berikut dapat membantu Anda menggunakan metrik di konsol untuk mengidentifikasi dan mengatasi masalah:

  • Jika Total pemakaian CPU/Memori/Disk perangkat Anda menunjukkan pemakaian yang tinggi atau rendah secara tidak terduga selama tujuh hari terakhir, selalu periksa diagram penggunaan CPU/Memori/Disk oleh fleet yang sesuai untuk mengevaluasi apakah pemakaian yang tidak terduga bersifat konstan atau disebabkan oleh lonjakan penggunaan.
  • Jika Penggunaan CPU/Memori/Disk teratas menurut cluster menunjukkan setiap cluster yang berperilaku berbeda dari yang lain, pertimbangkan untuk menyelidiki cluster tertentu tersebut dengan lebih cermat. Pertimbangkan untuk mengubah ukuran cluster jika memungkinkan.
  • Jika Penggunaan CPU/Memori/Disk Teratas menurut namespace menunjukkan lonjakan yang tidak terduga selama tujuh hari terakhir, sebaiknya selidiki apakah beban kerja tertentu menyebabkan lonjakan. Solusi yang memungkinkan adalah dengan mendistribusikan ulang beban kerja di seluruh resource.
  • Penggunaan CPU/Memori/Disk oleh fleet memungkinkan Anda mengamati rasio antara resource yang digunakan dan yang diminta. Perbedaan besar antara keduanya mungkin berarti bahwa tim aplikasi meminta dan memesan terlalu banyak resource.

Memahami metrik pemanfaatan resource

Metrik berikut disediakan di dasbor ringkasan cakupan tim, fleet, dan GKE Enterprise, yang dihitung menggunakan informasi dari Cloud Monitoring di cluster fleet Anda.

Anda dapat melihat metrik tingkat fleet di GKE Enterprise dan dasbor ringkasan fleet. Metrik tingkat tim tersedia di GKE Enterprise dan dasbor ringkasan tim.

Metrik CPU

  • Total penggunaan CPU:
    • Untuk metrik tingkat fleet, rata-rata semua titik waktu untuk periode waktu tertentu dengan titik waktu adalah rasio antara resource yang dapat dialokasikan dan digunakan di semua cluster yang didaftarkan ke fleet.
      • Allocatable: Jumlah CPU yang dialokasikan ke semua node di semua cluster yang terdaftar ke fleet. Dihitung dari metrik node/cpu/allocatable_cores.
      • Digunakan: Jumlah CPU yang digunakan oleh semua container di seluruh cluster yang terdaftar ke suatu fleet. Dihitung dari metrik container/cpu/core_usage_time.
    • Untuk dasbor Monitoring tim, nilai rata-rata dari semua titik waktu untuk periode waktu tertentu adalah rasio antara resource yang diminta dan yang digunakan di semua namespace yang terkait dengan cakupan tim.
      • Diminta: Jumlah CPU yang diminta oleh semua container di semua namespace yang terkait dengan cakupan tim. Dihitung dari metrik container/cpu/request_cores.
      • Digunakan: Jumlah CPU yang digunakan oleh semua container di seluruh namespace yang terkait dengan cakupan tim. Dihitung dari metrik container/cpu/core_usage_time.
  • Pemakaian CPU menurut fleet/tim:
    • Untuk tingkat fleet, hubungan antara resource yang digunakan, diminta, dan dialokasikan.
      • Digunakan: Jumlah CPU yang digunakan oleh semua container di seluruh cluster yang terdaftar ke suatu fleet. Dihitung dari metrik container/cpu/core_usage_time.
      • Diminta: Jumlah CPU yang diminta oleh semua container di seluruh cluster yang terdaftar ke fleet. Dihitung dari metrik container/cpu/request_cores.
      • Allocatable: Jumlah CPU yang dialokasikan ke semua node di semua cluster yang terdaftar ke fleet. Dihitung dari metrik node/cpu/allocatable_cores.
    • Untuk tingkat tim, hubungan antara batas resource, serta resource yang digunakan dan diminta.
      • Digunakan: Jumlah CPU yang digunakan oleh semua container di seluruh namespace yang terkait dengan cakupan tim. Dihitung dari metrik container/cpu/core_usage_time.
      • Diminta: Jumlah CPU yang diminta oleh semua container di semua namespace yang terkait dengan cakupan tim. Dihitung dari metrik container/cpu/request_cores.
      • Batas: Jumlah maksimum CPU yang tersedia untuk semua container di semua namespace yang terkait dengan cakupan tim. Dihitung dari metrik container/cpu/limit_cores.
  • Penggunaan CPU teratas berdasarkan cluster: Daftar cluster diurutkan berdasarkan rata-rata semua titik waktu untuk periode waktu tertentu, dengan titik waktu adalah rasio antara resource yang dapat dialokasikan dan yang digunakan untuk cluster tertentu.
  • Penggunaan CPU teratas berdasarkan namespace: Daftar namespace diurutkan berdasarkan rata-rata semua titik waktu untuk jangka waktu tertentu, dengan titik waktu merupakan rasio antara resource yang digunakan dan yang diminta untuk namespace tertentu.

Metrik memori

  • Total penggunaan memori:
    • Untuk metrik tingkat fleet, metrik ini mengacu pada rata-rata semua titik waktu untuk periode waktu tertentu, dengan titik waktu adalah rasio antara resource yang dapat dialokasikan dan digunakan di semua cluster milik suatu fleet.
      • Allocatable: Jumlah memori yang dialokasikan ke semua node di semua cluster yang terdaftar ke fleet. Dihitung dari metrik node/memory/allocatable_byte.
      • Digunakan: Jumlah memori yang tidak dapat dihapus yang digunakan oleh semua container di semua cluster yang terdaftar ke fleet. Dihitung dari metrik container/memory/used_bytes.
    • Untuk metrik tingkat tim, metrik ini mengacu pada rata-rata semua poin waktu untuk periode waktu tertentu ketika titik waktu merupakan rasio antara resource yang diminta dan yang digunakan di semua namespace yang termasuk dalam cakupan tim.
      • Diminta: Jumlah memori yang diminta oleh semua container di semua namespace yang terkait dengan cakupan. Dihitung dari metrik container/memory/request_bytes.
      • Digunakan: Jumlah memori yang tidak dapat dikeluarkan yang digunakan oleh semua penampung di semua namespace yang terkait dengan cakupan. Dihitung dari metrik container/memory/used_bytes.
  • Pemakaian memori oleh fleet/tim:
    • Untuk tingkat fleet, hubungan antara resource yang digunakan, diminta, dan dialokasikan.
      • Digunakan: Jumlah memori yang tidak dapat dihapus yang digunakan oleh semua container di semua cluster yang terdaftar ke fleet. Dihitung dari metrik container/memory/used_bytes.
      • Diminta: Jumlah memori yang diminta oleh semua container di semua cluster yang terdaftar ke fleet. Dihitung dari metrik container/memory/request_bytes.
      • Allocatable: Jumlah memori yang dialokasikan ke semua node di semua cluster yang terdaftar ke fleet. Dihitung dari metrik node/memory/allocatable_byte.
    • Untuk tingkat tim, hubungan antara batas resource, serta resource yang digunakan dan diminta.
      • Digunakan: Jumlah memori yang tidak dapat dikeluarkan yang digunakan oleh semua penampung di semua namespace yang terkait dengan cakupan. Dihitung dari metrik container/memory/used_bytes.
      • Diminta: Jumlah memori yang diminta oleh semua container di semua namespace yang terkait dengan cakupan. Dihitung dari metrik container/memory/request_bytes.
      • Batas: Jumlah maksimum memori yang tersedia untuk semua penampung di semua namespace yang terkait dengan cakupan. Dihitung dari metrik container/memory/limit_bytes.
  • Penggunaan memori teratas berdasarkan cluster: Daftar cluster diurutkan berdasarkan rata-rata semua titik waktu untuk jangka waktu tertentu, dengan titik waktu adalah rasio antara resource yang dapat dialokasikan dan yang digunakan untuk cluster tertentu.
    • Allocatable: Jumlah memori yang dialokasikan ke semua node dalam cluster. Dihitung dari metrik node/memory/allocatable_byte.
    • Digunakan: Jumlah memori yang tidak dapat dikeluarkan yang digunakan oleh semua container dalam cluster. Dihitung dari metrik container/memory/used_bytes.
  • Penggunaan memori teratas berdasarkan namespace: Daftar namespace diurutkan berdasarkan rata-rata semua titik waktu untuk jangka waktu tertentu, dengan titik waktu merupakan rasio antara resource yang digunakan dan yang diminta untuk namespace tertentu.

Metrik disk

  • Total penggunaan disk:
    • Untuk metrik tingkat fleet, hal ini mengacu pada rata-rata semua titik waktu untuk jangka waktu tertentu dengan titik waktu adalah rasio antara resource yang dapat dialokasikan dan digunakan di semua cluster yang termasuk dalam suatu fleet.
    • Untuk metrik tingkat tim, metrik ini mengacu pada rata-rata semua poin waktu untuk periode waktu tertentu ketika titik waktu merupakan rasio antara resource yang diminta dan yang digunakan di semua namespace yang termasuk dalam cakupan tim.
  • Penggunaan disk berdasarkan fleet/tim:
    • Untuk tingkat fleet, hubungan antara resource yang digunakan, diminta, dan dialokasikan.
    • Untuk tingkat tim, hubungan antara batas resource, serta resource yang digunakan dan diminta.
  • Penggunaan disk teratas berdasarkan cluster: Daftar cluster diurutkan berdasarkan rata-rata semua titik waktu untuk jangka waktu tertentu dengan titik waktu adalah rasio antara resource yang dapat dialokasikan dan yang digunakan untuk cluster tertentu.
  • Penggunaan disk teratas berdasarkan namespace: Daftar namespace diurutkan berdasarkan rata-rata semua titik waktu untuk jangka waktu tertentu, dengan titik waktu merupakan rasio antara resource yang digunakan dan yang diminta untuk namespace tertentu.

Distribusi error menurut namespace (khusus tingkat tim)

Daftar namespace diurutkan berdasarkan jumlah log error tertinggi untuk jangka waktu tertentu. Log dikumpulkan dari Cloud Logging.

Distribusi jumlah mulai ulang menurut namespace (khusus tingkat tim)

Daftar namespace diurutkan berdasarkan jumlah tertinggi yang dimulai ulang untuk container selama periode waktu tertentu. Dihitung dari metrik container/restart_count.

Pemecahan masalah

Metrik gagal dimuat untuk cluster baru

Jika telah membuat cluster baru, bergantung pada periode waktu yang dipilih, Anda mungkin akan melihat No Data di seluruh dasbor Monitoring, atau Anda mungkin melihat metrik. Misalnya, jika Anda membuat cluster dalam satu jam terakhir, dan memilih jangka waktu 1 jam atau 6 jam, dasbor dapat menampilkan beberapa metrik untuk beban kerja Anda. Namun, jika memilih periode waktu 1 hari atau lebih, Anda mungkin melihat No data ditampilkan di seluruh dasbor.

Hal ini karena Cloud Monitoring mengumpulkan data dalam periode (interval) yang berbeda untuk jangka waktu yang berbeda. Untuk periode waktu 1 jam dan 6 jam, data dikumpulkan dalam periode 1 menit. Jadi, jika cluster telah ada selama beberapa menit, Anda akan melihat metrik untuk periode tersebut.

Untuk jangka waktu 1 hari dan 1 minggu, Cloud Monitoring mengumpulkan data dalam periode 1 jam. Jika cluster ada selama kurang dari satu jam, Anda mungkin tidak melihat data untuk periode waktu tersebut.

Jika Anda mengalami error ini, periksa dasbor setelah beberapa waktu berlalu sejak membuat cluster baru.