Menemukan informasi pemecahan masalah Agen Operasional

Dokumen ini menjelaskan sumber informasi diagnostik yang dapat Anda gunakan untuk mengidentifikasi masalah dalam penginstalan atau menjalankan Ops Agent.

Memverifikasi status agen menggunakan gcpdiag

Anda dapat menggunakan gcpdiag untuk melaporkan status Ops Agent di setiap VM atau seluruh fleet VM dalam project Anda, yang mengonfirmasi bahwa agen telah diinstal dan secara aktif mengirimkan log dan metrik. gcpdiag dapat membuat laporan status dalam beberapa format, termasuk format CSV atau JSON.

Berikut ini menunjukkan laporan status agen di seluruh armada dalam format CSV:

🔎 gce/ERR/2024_004: Verify Ops Agent is installed on GCE VMs and is sending logs and metrics.

gce/ERR/2024_004,projects/my-project/zones/my-location/instances/instance-1,failed,Ops Agent not installed on the VM,https://gcpdiag.dev/rules/gce/ERR/2024_004
gce/ERR/2024_004,projects/my-project/zones/my-location/instances/instance-2,skipped,VM Manager is needed for the ops agent detection. Please enable it at: https://cloud.google.com/compute/docs/manage-os#automatic and run this check again.,https://gcpdiag.dev/rules/gce/ERR/2024_004
gce/ERR/2024_004,projects/my-project/zones/my-location/instances/instance-3,skipped,VM Manager is needed for the ops agent detection. Please enable it at: https://cloud.google.com/compute/docs/manage-os#automatic and run this check again.,https://gcpdiag.dev/rules/gce/ERR/2024_004
gce/ERR/2024_004,projects/my-project/zones/my-location/instances/instance-4,ok,"Ops Agent installed on the VM, and is successfully sending logs and metrics.",https://gcpdiag.dev/rules/gce/ERR/2024_004
gce/ERR/2024_004,projects/my-project/zones/my-location/instances/instance-5,ok,"Ops Agent installed on the VM, and is successfully sending logs and metrics.",https://gcpdiag.dev/rules/gce/ERR/2024_004

Alat gcpdiag dibuat oleh tim Google Cloud dukungan untuk membantu Anda mendiagnosis sendiri masalah umum di project Google Cloud , termasuk masalah pada Ops Agent. gcpdiag adalah alat open source, bukan produk Google Cloudresmi, tetapi dikembangkan dan dikelola secara aktif oleh tim Google Cloud dukungan. Berkontribusi atau melaporkan masalah di GitHub.

Sebelum memulai

gcpdiag terintegrasi dengan Cloud Shell, sehingga Anda dapat menjalankannya tanpa perlu penginstalan. Untuk menjalankan gcpdiag, Anda harus memenuhi prasyarat berikut terlebih dahulu:

  • Otorisasi: gcpdiag menggunakan kredensial default aplikasi (ADC) di Cloud Shell untuk melakukan autentikasi.
    Pastikan kredensial yang digunakan dengan gcpdiag memiliki setidaknya peran berikut di project Google Cloud tempat Agen Operasional berjalan:

    • Pelihat (roles/viewer)
    • Pelanggan Penggunaan Layanan (roles/serviceusage.serviceUsageConsumer)
  • API: Untuk menggunakan gcpdiag dalam project, API berikut harus diaktifkan:

    • Cloud Resource Manager API: cloudresourcemanager.googleapis.com
    • Identity and Access Management API: iam.googleapis.com
    • Cloud Logging API: logging.googleapis.com
    • Penggunaan Layanan: serviceusage.googleapis.com

    Untuk mengaktifkan API ini, jalankan perintah berikut di Cloud Shell atau command line lain:

     gcloud --project=PROJECT_ID services enable \
       cloudresourcemanager.googleapis.com \
       iam.googleapis.com \
       logging.googleapis.com \
       serviceusage.googleapis.com
    
  • VM Manager: Aktifkan VM Manager di tingkat gratis pada instance Anda. Jika Anda menginstal Agen Operasional selama pembuatan VM atau jika kebijakan agen mengelola penginstalan Agen Operasional di instance VM, Anda telah memenuhi persyaratan untuk VM Manager.

Menjalankan gcpdiag

Perintah gcpdiag untuk digunakan dengan Agen Operasional memiliki sintaksis dasar berikut:

gcpdiag lint --project=PROJECT_ID [--name=INSTANCE_NAME] --show-skipped --include=gce/err/2024_004 [--output=[CSV|JSON]]
  • PROJECT_ID adalah ID project Google Cloud Anda.
  • INSTANCE_NAME adalah nama VM Compute Engine Anda. Gunakan opsi --name untuk mengkueri VM tertentu; hilangkan opsi untuk mengkueri seluruh armada.
  • Gunakan opsi --output untuk menyimpan laporan dalam file berformat CSV atau JSON; hilangkan opsi ini jika Anda tidak menginginkan file output.

Nilai opsi --include menentukan satu atau beberapa aturan gcpdiag; gce/ERR/2024-004 adalah aturan untuk Ops Agent. Untuk mengetahui informasi selengkapnya tentang sintaksis perintah gcpdiag, lihat gcpdiag - Diagnostics for Google Cloud Platform.

Misalnya, untuk membuat laporan seluruh armada untuk project "my-project", jalankan perintah berikut:

gcpdiag lint --project=my-project --show-skipped --include=gce/ERR/2024_004

Outputnya akan terlihat seperti berikut:

🔎 gce/ERR/2024_004: Verify Ops Agent is installed on GCE VMs and is sending logs and metrics.
  - my-project/instance-1                                                 [FAIL] Ops Agent not installed on the VM
  - my-project/instance-2                                                 [FAIL] Ops Agent not installed on the VM
  - my-project/instance-3                                                 [SKIP] Unable to confirm Ops Agent installation
  VM Manager is needed for the ops agent detection. Please enable it at: https://cloud.google.com/compute/docs/manage-os#automatic and run this check again.
  - my-project/instance-4                                            [FAIL] Ops Agent is installed, but it's failing to send both logs and metrics to Google Cloud.
  Is Ops Agent sending logs? (Yes)  Is Ops Agent sending metrics? (No)
  - my-project/instance-5                                                 [FAIL] Ops Agent is installed, but it's failing to send both logs and metrics to Google Cloud.
  Is Ops Agent sending logs? (No)   Is Ops Agent sending metrics? (No)
  - my-project/instance-6                                                 [ OK ] Ops Agent installed on the VM, and is successfully sending logs and metrics.
  - my-project/instance-7                                                 [ OK ] Ops Agent installed on the VM, and is successfully sending logs and metrics.

Untuk membuat laporan untuk instance "my-instance" di project "my-project", jalankan perintah berikut:

gcpdiag lint  --project=my-project --name=my-instance --show-skipped --include=gce/err/2024_004

Outputnya akan terlihat seperti berikut:

🔎 gce/ERR/2024_004: Verify Ops Agent is installed on GCE VMs and is sending logs and metrics.
  - my-project/my-instance   [ OK ] Ops Agent installed on the VM, and is successfully sending logs and metrics.

Jika perintah gcpdiag Anda gagal dengan output yang menyerupai berikut, verifikasi bahwa Anda telah memenuhi semua prasyarat untuk menjalankan alat.

WARNING:googleapiclient.http:Encountered 403 Forbidden with reason "PERMISSION_DENIED"
[ERROR]:can't access project my-project: Cloud Resource Manager API has not been used in project my-project before or it is disabled. Enable it by visiting https://console.developers.google.com/apis/api/cloudresourcemanager.googleapis.com/overview?project=my-project then retry. If you enabled this API recently, wait a few minutes for the action to propagate to our systems and retry..
[DEBUG]: An Http Error occurred whiles accessing projects.get

HttpError 403 when requesting https://cloudresourcemanager.googleapis.com/v3/projects/my-project?alt=json returned Cloud Resource Manager API has not been used in project my-project before or it is disabled. Enable it by visiting https://console.developers.google.com/apis/api/cloudresourcemanager.googleapis.com/overview?project=my-project then retry. If you enabled this API recently, wait a few minutes for the action to propagate to our systems and retry. Details: ...
[ERROR]:exiting program...
error getting project details

Menafsirkan output gcpdiag

Bagian ini memberikan informasi untuk membantu Anda memahami dan menggunakan laporan yang dibuat oleh gcpdiag.

Perintah gcpdiag menghasilkan laporan yang berisi informasi berikut:

  • Indikator aturan gcpdiag yang digunakan untuk memanggil perintah. Untuk Agen Operasional, informasi ini terlihat seperti berikut:
    🔎 gce/ERR/2024_004: Verify Ops Agent is installed on GCE VMs and is sending logs and metrics
  • ID hasil untuk VM tertentu dengan format PROJECT_ID/INSTANCE_ID. Untuk laporan seluruh fleet, output berisi entri untuk setiap VM. Untuk laporan VM tunggal, output berisi satu entri.
  • Status pemeriksaan. Status memiliki salah satu nilai berikut:
  • Deskripsi nilai status.

Bagian berikut memberikan informasi selengkapnya tentang nilai status dan artinya.

Status: OK

Status OK berarti Agen Operasional berjalan di VM dan mengirimkan log dan metrik dari VM. Laporan ini mencakup deskripsi status berikut:
Ops Agent installed on the VM, and is successfully sending logs and metrics.

Status: FAIL

Status FAIL berarti Agen Operasional tidak diinstal, atau tidak mengirimkan log dan metrik dari VM. Deskripsi status menunjukkan masalah yang telah terdeteksi:

  • Jika Agen Operasional tidak diinstal, Anda akan melihat deskripsi status berikut:
    Ops Agent not installed on the VM
  • Jika Agen Operasional tidak mengirimkan log dan metrik dari VM, Anda akan melihat deskripsi status seperti berikut:
    Agent is installed, but it's failing to send both logs and metrics to Google Cloud.
    Is Ops Agent sending logs? (Yes) Is Ops Agent sending metrics? (No)

Jika Agen Operasional belum diinstal, instal Agen Operasional. Jika penginstalan gagal, masalahnya mungkin salah satu dari berikut ini:

Jika Ops Agent tidak mengirimkan log atau metrik dari VM, gunakan pemeriksaan kondisi agen untuk error waktu mulai guna menentukan dan memperbaiki masalah.

Status: SKIP

Status SKIP berarti gcpdiag tidak dapat menentukan apakah Agen Operasional diinstal di VM. Laporan ini mencakup deskripsi status berikut:
Unable to confirm Ops Agent installation
  VM Manager is needed for the ops agent detection.
  Please enable it at: https://cloud.google.com/compute/docs/manage-os#automatic and run this check again.

Untuk menguji status agen, gcpdiag memerlukan VM Manager agar berjalan di VM Anda. Untuk mengatasi masalah ini, instal tingkat gratis VM Manager di instance Anda. Setelah menginstal, tunggu 15 menit, lalu coba jalankan perintah gcpdiag lagi.

Health check agen

Versi 2.25.1 memperkenalkan health check waktu mulai untuk Agen Operasional. Saat dimulai, Agen Operasi akan melakukan serangkaian pemeriksaan untuk kondisi yang mencegah agen berjalan dengan benar. Jika agen mendeteksi salah satu kondisi, agen akan mencatat pesan yang menjelaskan masalah tersebut. Agen Operasional memeriksa hal berikut:

  • Masalah konektivitas
  • Ketersediaan port yang digunakan oleh agen untuk melaporkan metrik tentang dirinya sendiri
  • Masalah izin
  • Ketersediaan API yang digunakan oleh agen untuk menulis log atau metrik
  • Masalah dalam rutin health check itu sendiri.
Untuk mengetahui informasi tentang cara menemukan kesalahan waktu mulai, lihat Menemukan kesalahan waktu mulai.

Versi 2.37.0 memperkenalkan health check runtime untuk Agen Operasional. Error ini dilaporkan ke Cloud Logging dan Error Reporting. Untuk mengetahui informasi tentang cara menemukan error runtime, lihat Menemukan error runtime.

Versi 2.46.0 memperkenalkan kode LogPingOpsAgent informasi. Kode ini tidak menunjukkan error. Untuk mengetahui informasi selengkapnya, lihat Memverifikasi keberhasilan pengumpulan log.

Tabel berikut mencantumkan setiap kode pemeriksaan kondisi dalam urutan abjad dan menjelaskan arti setiap kode. Kode yang diakhiri dengan string Err menunjukkan error; kode lainnya bersifat informatif.

Kode health check Kategori Arti Saran
DLApiConnErr Konektivitas Permintaan ke subdomain download, dl.google.com, gagal. Periksa koneksi internet dan aturan firewall Anda. Untuk mengetahui informasi selengkapnya, lihat Masalah konektivitas jaringan.
FbMetricsPortErr Ketersediaan port Port 20202, yang diperlukan untuk metrik mandiri Agen Operasional, tidak tersedia. Pastikan port 20202 terbuka. Untuk mengetahui informasi selengkapnya, lihat Port yang diperlukan tidak tersedia.
HcFailureErr Generik Rutinitas health check Ops Agent mengalami error internal. Kirim kasus dukungan dari Google Cloud konsol. Untuk mengetahui informasi selengkapnya, lihat Mendapatkan dukungan.
LogApiConnErr Konektivitas Permintaan ke Logging API gagal. Periksa koneksi internet dan aturan firewall Anda. Untuk mengetahui informasi selengkapnya, lihat Masalah konektivitas jaringan.
LogApiDisabledErr API Logging API dinonaktifkan di project Google Cloud saat ini. Aktifkan Logging API.
LogApiPermissionErr Izin Akun layanan tidak memiliki peran Logs Writer (roles/logging.logWriter). Berikan peran Penulis Log ke akun layanan. Untuk mengetahui informasi selengkapnya, lihat Agen tidak memiliki izin API.
LogApiScopeErr Izin VM tidak memiliki cakupan akses https://www.googleapis.com/​auth/​logging.write. Tambahkan cakupan https://www.googleapis.com/​auth/​logging.write ke VM. Untuk mengetahui informasi selengkapnya, lihat Memverifikasi cakupan akses Anda.
LogApiUnauthenticatedErr API VM saat ini tidak dapat melakukan autentikasi ke Logging API. Pastikan file kredensial, cakupan akses VM, dan izin Anda disiapkan dengan benar. Untuk mengetahui informasi selengkapnya, lihat Memberikan otorisasi Agen Operasional.
LogPingOpsAgent   Pesan payload informasi yang ditulis setiap 10 menit ke log ops-agent-health. Anda dapat menggunakan entri log yang dihasilkan untuk memverifikasi bahwa agen mengirim log. Pesan ini bukan kesalahan. Pesan ini akan muncul setiap 10 menit. Jika pesan tidak muncul selama 20 menit atau lebih, agen mungkin mengalami masalah. Untuk mengetahui informasi pemecahan masalah, lihat Memecahkan masalah Agen Operasional.
LogParseErr Runtime Ops Agent tidak dapat mengurai satu atau beberapa log. Periksa konfigurasi pemroses logging yang telah Anda buat. Untuk mengetahui informasi selengkapnya, lihat Error penguraian log.
LogPipeLineErr Runtime Pipeline logging Ops Agent gagal. Pastikan agen memiliki akses ke file buffer; periksa apakah disk penuh, dan pastikan konfigurasi Agen Operasi sudah benar. Untuk mengetahui informasi selengkapnya, lihat Error pipeline.
MetaApiConnErr Konektivitas Permintaan ke server Metadata G​C​E, untuk membuat kueri cakupan akses VM, token OAuth, dan label resource, gagal. Periksa koneksi internet dan aturan firewall Anda. Untuk mengetahui informasi selengkapnya, lihat Masalah konektivitas jaringan.
MonApiConnErr Konektivitas Permintaan ke Monitoring API gagal. Periksa koneksi internet dan aturan firewall Anda. Untuk mengetahui informasi selengkapnya, lihat Masalah konektivitas jaringan.
MonApiDisabledErr API Monitoring API dinonaktifkan di project Google Cloud saat ini. Aktifkan Monitoring API.
MonApiPermissionErr Izin Akun layanan tidak memiliki peran Monitoring Metric Writer (roles/monitoring.metricWriter). Berikan peran Monitoring Metric Writer ke akun layanan. Untuk mengetahui informasi selengkapnya, lihat Agen tidak memiliki izin API.
MonApiScopeErr Izin VM tidak memiliki cakupan akses https://www.googleapis.com/​auth/​monitoring.write. Tambahkan cakupan https://www.googleapis.com/​auth/​monitoring.write ke VM. Untuk mengetahui informasi selengkapnya, lihat Memverifikasi cakupan akses Anda.
MonApiUnauthenticatedErr API VM saat ini tidak dapat melakukan autentikasi ke Monitoring API. Pastikan file kredensial, cakupan akses VM, dan izin Anda disiapkan dengan benar. Untuk mengetahui informasi selengkapnya, lihat Memberikan otorisasi Agen Operasional.
OtelMetricsPortErr Ketersediaan port Port 20201, yang diperlukan untuk metrik mandiri Agen Operasional, tidak tersedia. Pastikan port 20201 terbuka. Untuk mengetahui informasi selengkapnya, lihat Port yang diperlukan tidak tersedia.
PacApiConnErr Konektivitas Kode pemeriksaan kondisi ini tidak dapat diandalkan. Kode ini dinonaktifkan di Ops Agent versi 2.46.1. Update ke Agen Operasional versi 2.46.1 atau yang lebih baru.

Menemukan error waktu mulai

Mulai versi 2.35.0, informasi pemeriksaan kondisi ditulis ke log ops-agent-health oleh Cloud Logging API (versi 2.33.0, 2.34.0 menggunakan ops-agent-health-checks). Informasi yang sama juga ditulis ke file health-checks.log sebagai berikut:

  • Linux: /var/log/google-cloud-ops-agent/health-checks.log
  • Windows: C:\ProgramData\Google\Cloud Operations\Ops Agent\log\health-checks.log

Anda juga dapat melihat pesan health check dengan membuat kueri status layanan Agen Operasi sebagai berikut:

  • Di Linux, jalankan perintah berikut:
       sudo systemctl status google-cloud-ops-agent"*"
       

    Cari pesan seperti "[Ports Check] Result: PASS". Hasil lainnya mencakup "ERROR" dan "FAIL".

  • Di Windows, gunakan Event Viewer Windows. Cari pesan "Informasi", "Error", atau "Kegagalan" yang terkait dengan layanan google-cloud-ops-agent.

Setelah Anda mengatasi masalah, Anda harus memulai ulang agen. Health check dijalankan saat agen dimulai, jadi untuk menjalankan ulang pemeriksaan, Anda harus memulai ulang agen.

Menemukan error runtime

Pemeriksaan kondisi runtime dilaporkan ke Cloud Logging dan Error Reporting. Jika agen gagal dimulai, tetapi dapat melaporkan error sebelum gagal, Anda mungkin juga melihat error waktu mulai yang dilaporkan.

Untuk melihat error runtime dari Agen Operasional di Logging, lakukan hal berikut:

  1. Di konsol Google Cloud , buka halaman Logs Explorer:

    Buka Logs Explorer

    Jika Anda menggunakan kotak penelusuran untuk menemukan halaman ini, pilih hasil yang subjudulnya adalah Logging.

  2. Masukkan kueri berikut, lalu klik Run query:
    log_id("ops-agent-health")

Untuk melihat error runtime dari Agen Operasional di Error Reporting, lakukan hal berikut:

  1. Di konsol Google Cloud , buka halaman Error Reporting:

    Buka Error Reporting

    Anda juga dapat menemukan halaman ini dengan menggunakan kotak penelusuran.

  2. Untuk melihat error dari Agen Operasional, filter error untuk Ops Agent.

Memverifikasi keberhasilan pengumpulan log

Agen Operasional versi 2.46.0 memperkenalkan health check LogPingOpsAgent informasi. Pemeriksaan ini menulis pesan informasi ke ops-agent-health setiap 10 menit. Anda dapat menggunakan keberadaan pesan ini untuk memverifikasi bahwa Ops Agent sedang menulis log dengan melakukan salah satu tindakan berikut:

Jika salah satu opsi ini menunjukkan bahwa pesan log tidak diproses, Anda dapat melakukan hal berikut:

Untuk memeriksa status Agen Operasional di VM tertentu, Anda memerlukan ID instance VM. Untuk menemukan ID instance, lakukan hal berikut:

  • Di konsol Google Cloud , buka halaman VM instances:

    Buka instance VM

    Jika Anda menggunakan kotak penelusuran untuk menemukan halaman ini, pilih hasil yang subjudulnya adalah Compute Engine.

  • Klik nama instance VM.
  • Di tab Detail, cari bagian Informasi dasar. ID instance muncul sebagai string numerik. Gunakan string ini untuk nilai INSTANCE_ID di bagian berikutnya.

Alat diagnostik agen untuk VM

Alat diagnostik agen mengumpulkan informasi pen-debugan lokal penting dari VM Anda untuk semua agen berikut: Agen Operasional, agen Logging lama, dan agen Monitoring lama. Informasi pen-debug-an mencakup hal-hal seperti info project, info VM, konfigurasi agen, log agen, status layanan agen, informasi yang biasanya memerlukan pekerjaan manual untuk dikumpulkan. Alat ini juga memeriksa lingkungan VM lokal untuk memastikan bahwa lingkungan tersebut memenuhi persyaratan tertentu agar agen dapat berfungsi dengan baik, misalnya, konektivitas jaringan dan izin yang diperlukan.

Saat mengajukan kasus pelanggan untuk agen di VM, jalankan alat diagnostik agen dan lampirkan informasi yang dikumpulkan ke kasus tersebut. Dengan memberikan informasi ini, waktu yang diperlukan untuk memecahkan masalah kasus dukungan Anda akan berkurang. Sebelum Anda melampirkan informasi ke kasus dukungan, samarkan informasi sensitif seperti sandi.

Alat diagnostik agen harus dijalankan dari dalam VM, jadi biasanya Anda harus melakukan SSH ke VM terlebih dahulu. Perintah berikut mengambil alat diagnostik agen dan menjalankannya:

Linux

curl -sSO https://dl.google.com/cloudagents/diagnose-agents.sh
sudo bash diagnose-agents.sh

Windows

(New-Object Net.WebClient).DownloadFile("https://dl.google.com/cloudagents/diagnose-agents.ps1", "${env:UserProfile}\diagnose-agents.ps1")
Invoke-Expression "${env:UserProfile}\diagnose-agents.ps1"

Ikuti output eksekusi skrip untuk menemukan file yang menyertakan info yang dikumpulkan. Biasanya, Anda dapat menemukannya di direktori /var/tmp/google-agents di Linux dan di direktori $env:LOCALAPPDATA/Temp di Windows, kecuali jika Anda telah menyesuaikan direktori output saat menjalankan skrip.

Untuk mengetahui informasi mendetail, periksa skrip diagnose-agents.sh di Linux atau skrip diagnose-agents.ps1 di Windows.

Alat diagnostik agen untuk kebijakan penginstalan otomatis

Jika upaya menginstal Agen Ops menggunakan kebijakan OS Agen Ops gagal, Anda dapat menggunakan skrip diagnostik yang dijelaskan di bagian ini untuk melakukan proses debug. Misalnya, Anda mungkin melihat salah satu kasus berikut:

  • Penginstalan Agen Operasional gagal saat Anda menggunakan kotak centang Install Ops Agent for Monitoring and Logging untuk menginstal Agen Operasional selama pembuatan VM.
  • Status agen di dasbor Instance VM Cloud Monitoring atau tab Observability di halaman detail VM Compute Engine tetap dalam status Tertunda selama lebih dari 10 menit. Status Tertunda yang berlangsung lama dapat menunjukkan salah satu hal berikut:

    • Terjadi masalah saat menerapkan kebijakan.
    • Masalah dalam penginstalan Agen Operasional yang sebenarnya.
    • Masalah konektivitas antara VM dan Cloud Monitoring.

    Untuk beberapa masalah ini, skrip diagnostik agen umum dan pemeriksaan kondisi mungkin juga berguna.

Untuk menjalankan skrip diagnostik kebijakan, jalankan perintah berikut:

curl -sSO https://dl.google.com/cloudagents/diagnose-ui-policies.sh
bash diagnose-ui-policies.sh VM_NAME VM_ZONE

Skrip ini menampilkan informasi tentang VM yang terpengaruh dan kebijakan penginstalan otomatis terkait.

Saat mengajukan kasus pelanggan untuk agen di VM, jalankan alat diagnostik agen dan lampirkan informasi yang dikumpulkan ke kasus tersebut. Dengan memberikan informasi ini, waktu yang diperlukan untuk memecahkan masalah kasus dukungan Anda akan berkurang. Sebelum Anda melampirkan informasi ke kasus dukungan, samarkan informasi sensitif seperti sandi.

Log mandiri agen

Jika agen gagal menyerap log ke Cloud Logging, Anda mungkin harus memeriksa log agen secara lokal di VM untuk memecahkan masalah. Anda juga dapat menggunakan rotasi log untuk mengelola log mandiri agen.

Linux

Untuk memeriksa log mandiri yang ditulis ke Journald, jalankan perintah berikut:

journalctl -u google-cloud-ops-agent*

Untuk memeriksa log mandiri yang ditulis ke disk oleh modul logging, jalankan perintah berikut:

vim -M /var/log/google-cloud-ops-agent/subagents/logging-module.log

Windows

Untuk memeriksa log mandiri yang ditulis ke Windows Event Logs, jalankan perintah berikut:

Get-WinEvent -FilterHashtable @{ Logname='Application'; ProviderName='google-cloud-ops-agent*' } | Format-Table -AutoSize -Wrap

Untuk memeriksa log mandiri yang ditulis ke disk oleh modul logging, jalankan perintah berikut:

notepad "C:\ProgramData\Google\Cloud Operations\Ops Agent\log\logging-module.log"

Untuk memeriksa log dari layanan Windows Service Control Manager untuk Agen Operasional, jalankan perintah berikut:

Get-WinEvent -FilterHashtable @{ Logname='System'; ProviderName='Service Control Manager' } | Where-Object -Property Message -Match 'Google Cloud Ops Agent' | Format-Table -AutoSize -Wrap

Melihat penggunaan dan diagnostik metrik di Cloud Monitoring

Halaman Pengelolaan Metrik Cloud Monitoring memberikan informasi yang dapat membantu Anda mengontrol jumlah yang Anda belanjakan untuk metrik yang dapat ditagih tanpa memengaruhi kemampuan pengamatan. Halaman Pengelolaan Metrik melaporkan informasi berikut:

  • Volume penyerapan untuk penagihan berbasis byte dan sampel, di seluruh domain metrik dan untuk setiap metrik.
  • Data tentang label dan kardinalitas metrik.
  • Jumlah pembacaan untuk setiap metrik.
  • Penggunaan metrik dalam kebijakan pemberitahuan dan dasbor kustom.
  • Rasio error penulisan metrik.

Anda juga dapat menggunakan halaman Pengelolaan Metrik untuk mengecualikan metrik yang tidak diperlukan, sehingga menghilangkan biaya penyerapan metrik tersebut.

Untuk melihat halaman Pengelolaan Metrik, lakukan hal berikut:

  1. Di konsol Google Cloud , buka halaman  Pengelolaan metrik:

    Buka Pengelolaan metrik

    Jika Anda menggunakan kotak penelusuran untuk menemukan halaman ini, pilih hasil yang subjudulnya adalah Monitoring.

  2. Di toolbar, pilih rentang waktu Anda. Secara default, halaman Pengelolaan Metrik menampilkan informasi tentang metrik yang dikumpulkan dalam satu hari sebelumnya.

Untuk mengetahui informasi selengkapnya tentang halaman Pengelolaan Metrik, lihat Melihat dan mengelola penggunaan metrik.