Dokumen ini menjelaskan sumber informasi diagnostik yang dapat Anda gunakan untuk mengidentifikasi masalah dalam penginstalan atau pengoperasian Ops Agent.
Memverifikasi status agen menggunakan gcpdiag
Anda dapat menggunakan gcpdiag untuk melaporkan status Ops Agent di setiap VM atau seluruh fleet VM dalam project Anda, yang mengonfirmasi bahwa agen telah diinstal dan secara aktif mengirim log dan metrik. gcpdiag dapat membuat laporan status dalam beberapa format, termasuk dalam format CSV atau JSON.
Berikut adalah laporan status agen di seluruh armada dalam format CSV:
🔎 gce/ERR/2024_004: Verify Ops Agent is installed on GCE VMs and is sending logs and metrics.
gce/ERR/2024_004,projects/my-project/zones/my-location/instances/instance-1,failed,Ops Agent not installed on the VM,https://gcpdiag.dev/rules/gce/ERR/2024_004
gce/ERR/2024_004,projects/my-project/zones/my-location/instances/instance-2,skipped,VM Manager is needed for the ops agent detection. Please enable it at: https://cloud.google.com/compute/docs/manage-os#automatic and run this check again.,https://gcpdiag.dev/rules/gce/ERR/2024_004
gce/ERR/2024_004,projects/my-project/zones/my-location/instances/instance-3,skipped,VM Manager is needed for the ops agent detection. Please enable it at: https://cloud.google.com/compute/docs/manage-os#automatic and run this check again.,https://gcpdiag.dev/rules/gce/ERR/2024_004
gce/ERR/2024_004,projects/my-project/zones/my-location/instances/instance-4,ok,"Ops Agent installed on the VM, and is successfully sending logs and metrics.",https://gcpdiag.dev/rules/gce/ERR/2024_004
gce/ERR/2024_004,projects/my-project/zones/my-location/instances/instance-5,ok,"Ops Agent installed on the VM, and is successfully sending logs and metrics.",https://gcpdiag.dev/rules/gce/ERR/2024_004
Alat gcpdiag dibuat oleh dukungan Google Cloud untuk membantu Anda mendiagnosis sendiri masalah umum dalam project Google Cloud, termasuk masalah pada Ops Agent. gcpdiag adalah alat open source, bukan produk Google Cloud resmi, tetapi dikembangkan dan dikelola secara aktif oleh tim dukungan Google Cloud. Berkontribusi atau laporkan masalah di GitHub.
Sebelum memulai
gcpdiag terintegrasi dengan Cloud Shell, sehingga Anda dapat menjalankannya tanpa memerlukan penginstalan. Untuk menjalankan gcpdiag, Anda harus memenuhi prasyarat berikut terlebih dahulu:
Otorisasi: gcpdiag menggunakan kredensial default aplikasi (ADC) di Cloud Shell untuk melakukan autentikasi.
Pastikan kredensial yang digunakan dengan gcpdiag memiliki setidaknya peran berikut di project Google Cloud tempat Ops Agent berjalan:- Pelihat (
roles/viewer
) - Pelanggan Service Usage (
roles/serviceusage.serviceUsageConsumer
)
- Pelihat (
API: Untuk menggunakan gcpdiag dalam project, API berikut harus diaktifkan:
- Cloud Resource Manager API:
cloudresourcemanager.googleapis.com
- Identity and Access Management API:
iam.googleapis.com
- Cloud Logging API:
logging.googleapis.com
- Penggunaan Layanan:
serviceusage.googleapis.com
Untuk mengaktifkan API ini, jalankan perintah berikut di Cloud Shell atau command line lain:
gcloud --project=PROJECT_ID services enable \ cloudresourcemanager.googleapis.com \ iam.googleapis.com \ logging.googleapis.com \ serviceusage.googleapis.com
- Cloud Resource Manager API:
VM Manager: Aktifkan VM Manager pada tingkat gratis di instance Anda. Jika Anda menginstal Agen Operasional selama pembuatan VM atau jika kebijakan agen mengelola penginstalan Agen Operasional di instance VM, Anda telah memenuhi persyaratan untuk VM Manager.
Menjalankan gcpdiag
Perintah gcpdiag
untuk digunakan dengan Ops Agent
memiliki sintaksis dasar berikut:
gcpdiag lint --project=PROJECT_ID [--name=INSTANCE_NAME] --show-skipped --include=gce/err/2024_004 [--output=[CSV|JSON]]
- PROJECT_ID adalah ID project Google Cloud Anda.
- INSTANCE_NAME adalah nama VM Compute Engine Anda.
Gunakan opsi
--name
untuk mengkueri VM tertentu; hilangkan opsi untuk mengkueri seluruh armada. - Gunakan opsi
--output
untuk menyimpan laporan dalam file berformat CSV atau JSON; hapus opsi jika Anda tidak menginginkan file output.
Nilai opsi --include
menentukan satu atau beberapa aturan gcpdiag;
gce/ERR/2024-004
adalah aturan untuk Ops Agent.
Untuk mengetahui informasi selengkapnya tentang sintaksis perintah gcpdiag,
lihat gcpdiag - Diagnostik untuk Google Cloud Platform.
Misalnya, untuk membuat laporan seluruh armada untuk project "my-project", jalankan perintah berikut:
gcpdiag lint --project=my-project --show-skipped --include=gce/ERR/2024_004
Outputnya akan terlihat seperti berikut:
🔎 gce/ERR/2024_004: Verify Ops Agent is installed on GCE VMs and is sending logs and metrics.
- my-project/instance-1 [FAIL] Ops Agent not installed on the VM
- my-project/instance-2 [FAIL] Ops Agent not installed on the VM
- my-project/instance-3 [SKIP] Unable to confirm Ops Agent installation
VM Manager is needed for the ops agent detection. Please enable it at: https://cloud.google.com/compute/docs/manage-os#automatic and run this check again.
- my-project/instance-4 [FAIL] Ops Agent is installed, but it's failing to send both logs and metrics to Google Cloud.
Is Ops Agent sending logs? (Yes) Is Ops Agent sending metrics? (No)
- my-project/instance-5 [FAIL] Ops Agent is installed, but it's failing to send both logs and metrics to Google Cloud.
Is Ops Agent sending logs? (No) Is Ops Agent sending metrics? (No)
- my-project/instance-6 [ OK ] Ops Agent installed on the VM, and is successfully sending logs and metrics.
- my-project/instance-7 [ OK ] Ops Agent installed on the VM, and is successfully sending logs and metrics.
Untuk membuat laporan untuk instance "my-instance" di project "my-project", jalankan perintah berikut:
gcpdiag lint --project=my-project --name=my-instance --show-skipped --include=gce/err/2024_004
Outputnya akan terlihat seperti berikut:
🔎 gce/ERR/2024_004: Verify Ops Agent is installed on GCE VMs and is sending logs and metrics.
- my-project/my-instance [ OK ] Ops Agent installed on the VM, and is successfully sending logs and metrics.
Jika perintah gcpdiag
gagal dengan output yang menyerupai berikut,
pastikan Anda telah memenuhi semua prasyarat
untuk menjalankan alat.
WARNING:googleapiclient.http:Encountered 403 Forbidden with reason "PERMISSION_DENIED"
[ERROR]:can't access project my-project: Cloud Resource Manager API has not been used in project my-project before or it is disabled. Enable it by visiting https://console.developers.google.com/apis/api/cloudresourcemanager.googleapis.com/overview?project=my-project then retry. If you enabled this API recently, wait a few minutes for the action to propagate to our systems and retry..
[DEBUG]: An Http Error occurred whiles accessing projects.get
HttpError 403 when requesting https://cloudresourcemanager.googleapis.com/v3/projects/my-project?alt=json returned Cloud Resource Manager API has not been used in project my-project before or it is disabled. Enable it by visiting https://console.developers.google.com/apis/api/cloudresourcemanager.googleapis.com/overview?project=my-project then retry. If you enabled this API recently, wait a few minutes for the action to propagate to our systems and retry. Details: ...
[ERROR]:exiting program...
error getting project details
Menafsirkan output gcpdiag
Bagian ini memberikan informasi untuk membantu Anda memahami dan menggunakan laporan yang dihasilkan oleh gcpdiag.
Perintah gcpdiag menghasilkan laporan yang berisi informasi berikut:
- Indikator aturan gcpdiag yang digunakan untuk memanggil perintah.
Untuk Agen Operasional, informasi ini terlihat seperti berikut:
🔎 gce/ERR/2024_004: Verify Ops Agent is installed on GCE VMs and is sending logs and metrics
- ID hasil untuk VM tertentu dengan format PROJECT_ID/INSTANCE_ID. Untuk laporan seluruh armada, output berisi entri untuk setiap VM. Untuk laporan satu VM, output berisi satu entri.
- Status pemeriksaan. Status memiliki salah satu nilai berikut:
- Deskripsi nilai status.
Bagian berikut memberikan informasi selengkapnya tentang nilai status dan artinya.
Status: OK
Status OK
berarti Agen Operasional berjalan di VM dan mengirim log serta metrik dari VM. Laporan ini mencakup
deskripsi status berikut:
Ops Agent installed on the VM, and is successfully sending logs and metrics.
Status: FAIL
Status FAIL
berarti Agen Operasional tidak diinstal,
atau tidak mengirim log dan metrik dari VM. Deskripsi status
menunjukkan masalah yang telah terdeteksi:
- Jika Agen Operasional tidak diinstal, Anda akan melihat deskripsi status berikut:
Ops Agent not installed on the VM
- Jika Agen Operasional tidak mengirim log dan metrik dari VM, Anda akan melihat deskripsi status seperti berikut:
Agent is installed, but it's failing to send both logs and metrics to Google Cloud.
Is Ops Agent sending logs? (Yes) Is Ops Agent sending metrics? (No)
Jika Agen Operasional belum diinstal, instal Agen Operasional. Jika penginstalan gagal, masalahnya mungkin salah satu dari hal berikut:
- VM tidak memiliki akun layanan terkait. Untuk mengatasi masalah ini, lampirkan akun layanan ke VM, lalu coba instal Ops Agent lagi.
- VM memiliki salah satu agen lama (Agen Monitoring atau Agen Logging) yang sudah diinstal. Untuk mengatasi masalah ini, uninstal agen lama, lalu coba instal Ops Agent lagi.
Jika Ops Agent tidak mengirim log atau metrik dari VM, gunakan health check agen untuk error waktu mulai guna menentukan dan memperbaiki masalah.
Status: SKIP
Status SKIP
berarti gcpdiag tidak dapat menentukan
apakah Agen Operasi diinstal di VM. Laporan ini menyertakan deskripsi status
berikut:
Unable to confirm Ops Agent installation
VM Manager is needed for the ops agent detection.
Please enable it at: https://cloud.google.com/compute/docs/manage-os#automatic and run this check again.
Untuk menguji status agen, gcpdiag memerlukan
VM Manager
yang berjalan di VM Anda. Untuk mengatasi masalah ini, instal tingkat gratis VM Manager di instance Anda. Setelah menginstal, tunggu 15 menit, lalu coba jalankan kembali perintah gcpdiag
.
Pemeriksaan kesehatan agen
Versi 2.25.1 memperkenalkan health check waktu mulai untuk Agen Operasional. Saat dimulai, Ops Agent akan melakukan serangkaian pemeriksaan kondisi yang mencegah agen berjalan dengan benar. Jika mendeteksi salah satu kondisi, agen akan mencatat pesan yang menjelaskan masalah tersebut ke dalam log. Agen Operasional memeriksa hal berikut:
- Masalah konektivitas
- Ketersediaan port yang digunakan oleh agen untuk melaporkan metrik tentang dirinya sendiri
- Masalah izin
- Ketersediaan API yang digunakan oleh agen untuk menulis log atau metrik
- Masalah dalam rutinitas health check itu sendiri.
Versi 2.37.0 memperkenalkan health check runtime untuk Agen Operasional. Error ini dilaporkan ke Cloud Logging dan Error Reporting. Untuk mengetahui informasi tentang cara menemukan error runtime, lihat Menemukan error runtime.
Versi 2.46.0 memperkenalkan kode
LogPingOpsAgent
informasi. Kode ini tidak menunjukkan error.
Untuk informasi selengkapnya, lihat
Memverifikasi pengumpulan log yang berhasil.
Tabel berikut mencantumkan setiap kode pemeriksaan kesehatan dalam urutan abjad dan menjelaskan arti setiap kode. Kode yang diakhiri dengan string
Err
menunjukkan error; kode lainnya bersifat informatif.
Kode health check | Kategori | Arti | Saran |
---|---|---|---|
DLApiConnErr
|
Konektivitas |
Permintaan ke subdomain download, dl.google.com , gagal.
|
Periksa koneksi internet dan aturan firewall Anda. Untuk mengetahui informasi selengkapnya, lihat Masalah konektivitas jaringan. |
FbMetricsPortErr
|
Ketersediaan port | Port 20202, yang diperlukan untuk metrik mandiri Agen Operasional, tidak tersedia. | Pastikan port 20202 terbuka. Untuk mengetahui informasi selengkapnya, lihat Port yang diperlukan tidak tersedia. |
HcFailureErr
|
Generik | Rutinitas health check Ops Agent mengalami error internal. | Kirimkan kasus dukungan dari konsol Google Cloud. Untuk mengetahui informasi selengkapnya, lihat Mendapatkan dukungan. |
LogApiConnErr
|
Konektivitas | Permintaan ke Logging API gagal. | Periksa koneksi internet dan aturan firewall Anda. Untuk mengetahui informasi selengkapnya, lihat Masalah konektivitas jaringan. |
LogApiDisabledErr
|
API | Logging API dinonaktifkan di project Google Cloud saat ini. | Aktifkan Logging API. |
LogApiPermissionErr
|
Izin |
Akun layanan tidak memiliki peran Penulis Log
(roles/logging.logWriter ).
|
Berikan peran Penulis Log ke akun layanan. Untuk mengetahui informasi selengkapnya, lihat Agen tidak memiliki izin API. |
LogApiScopeErr
|
Izin | VM tidak memiliki cakupan akses https://www.googleapis.com/auth/logging.write. | Tambahkan cakupan https://www.googleapis.com/auth/logging.write ke VM. Untuk mengetahui informasi selengkapnya, lihat Memverifikasi cakupan akses Anda. |
LogApiUnauthenticatedErr
|
API | VM saat ini tidak dapat melakukan autentikasi ke Logging API. | Pastikan file kredensial, cakupan akses VM, dan izin Anda disiapkan dengan benar. Untuk informasi selengkapnya, lihat Memberikan otorisasi ke Agen Operasional. |
LogPingOpsAgent
|
Pesan payload informasi yang ditulis setiap 10 menit ke log ops-agent-health . Anda dapat menggunakan entri log yang dihasilkan untuk memverifikasi bahwa agen mengirim log. Pesan ini bukan
error.
|
Pesan ini diperkirakan akan muncul setiap 10 menit. Jika pesan tidak muncul selama 20 menit atau lebih, agen mungkin mengalami masalah. Untuk mengetahui informasi pemecahan masalah, lihat Memecahkan masalah Agen Operasional. | |
LogParseErr
|
Runtime | Ops Agent tidak dapat mengurai satu atau beberapa log. | Periksa konfigurasi pemroses logging yang telah Anda buat. Untuk mengetahui informasi selengkapnya, lihat Error penguraian log. |
LogPipeLineErr
|
Runtime | Pipeline logging Agen Ops gagal. | Pastikan agen memiliki akses ke file buffering; periksa apakah ada disk penuh, dan pastikan konfigurasi Ops Agent sudah benar. Untuk mengetahui informasi selengkapnya, lihat Error pipeline. |
MetaApiConnErr
|
Konektivitas | Permintaan ke server Metadata GCE, untuk membuat kueri cakupan akses VM, token OAuth, dan label resource, gagal. | Periksa koneksi internet dan aturan firewall Anda. Untuk mengetahui informasi selengkapnya, lihat Masalah konektivitas jaringan. |
MonApiConnErr
|
Konektivitas | Permintaan ke Monitoring API gagal. | Periksa koneksi internet dan aturan firewall Anda. Untuk mengetahui informasi selengkapnya, lihat Masalah konektivitas jaringan. |
MonApiDisabledErr
|
API | Monitoring API dinonaktifkan di project Google Cloud saat ini. | Aktifkan Monitoring API. |
MonApiPermissionErr
|
Izin |
Akun layanan tidak memiliki peran Monitoring Metric Writer
(roles/monitoring.metricWriter ).
|
Berikan peran Monitoring Metric Writer ke akun layanan. Untuk mengetahui informasi selengkapnya, lihat Agen tidak memiliki izin API. |
MonApiScopeErr
|
Izin | VM tidak memiliki cakupan akses https://www.googleapis.com/auth/monitoring.write. | Tambahkan cakupan https://www.googleapis.com/auth/monitoring.write ke VM. Untuk mengetahui informasi selengkapnya, lihat Memverifikasi cakupan akses Anda. |
MonApiUnauthenticatedErr
|
API | VM saat ini tidak dapat mengautentikasi ke Monitoring API. | Pastikan file kredensial, cakupan akses VM, dan izin Anda disiapkan dengan benar. Untuk informasi selengkapnya, lihat Memberikan otorisasi ke Agen Operasional. |
OtelMetricsPortErr
|
Ketersediaan port | Port 20201, yang diperlukan untuk metrik mandiri Agen Operasional, tidak tersedia. | Pastikan port 20201 terbuka. Untuk mengetahui informasi selengkapnya, lihat Port yang diperlukan tidak tersedia. |
PacApiConnErr
|
Konektivitas | Kode health check ini tidak dapat diandalkan. Kode ini dinonaktifkan di Ops Agent versi 2.46.1. | Update ke versi Agen Operasi 2.46.1 atau yang lebih baru. |
Menemukan error waktu mulai
Mulai versi 2.35.0, informasi pemeriksaan kesehatan ditulis ke log ops-agent-health
oleh Cloud Logging API (versi 2.33.0, 2.34.0 menggunakan ops-agent-health-checks
). Informasi yang sama juga ditulis ke file health-checks.log
sebagai berikut:
- Linux:
/var/log/google-cloud-ops-agent/health-checks.log
- Windows:
C:\ProgramData\Google\Cloud Operations\Ops Agent\log\health-checks.log
Anda juga dapat melihat pesan health check dengan membuat kueri status layanan Ops Agent sebagai berikut:
- Di Linux, jalankan perintah berikut:
sudo systemctl status google-cloud-ops-agent"*"
Cari pesan seperti "[Ports Check] Result: PASS". Hasil lainnya mencakup "ERROR" dan "FAIL".
- Di Windows, gunakan Event Viewer Windows. Cari pesan "Informasi", "Error", atau "Kegagalan" yang terkait dengan layanan
google-cloud-ops-agent
.
Setelah menyelesaikan masalah, Anda harus memulai ulang agen. Health check dijalankan saat agen dimulai, jadi untuk menjalankan ulang pemeriksaan, Anda harus memulai ulang agen.
Menemukan error runtime
Pemeriksaan kesehatan runtime dilaporkan ke Cloud Logging dan Error Reporting. Jika agen gagal dimulai, tetapi dapat melaporkan error sebelum gagal, Anda mungkin juga melihat error waktu mulai dilaporkan.
Untuk melihat error runtime dari Agen Operasi di Logging, lakukan hal berikut:
-
Di konsol Google Cloud, buka halaman Logs Explorer:
Jika Anda menggunakan kotak penelusuran untuk menemukan halaman ini, pilih hasil yang subjudulnya adalah Logging.
- Masukkan kueri berikut, lalu klik Run query:
log_id("ops-agent-health")
Untuk melihat error runtime dari Agen Operasional di Pelaporan Error, lakukan tindakan berikut:
-
Di konsol Google Cloud, buka halaman Pelaporan Error:
Anda juga dapat menemukan halaman ini menggunakan kotak penelusuran.
- Untuk melihat error dari Agen Operasi, filter error untuk
Ops Agent
.
Memverifikasi keberhasilan pengumpulan log
Agen Operasi versi 2.46.0 memperkenalkan
health check LogPingOpsAgent
informatif. Pemeriksaan ini menulis
pesan informasi ke ops-agent-health
setiap 10 menit.
Anda dapat menggunakan keberadaan pesan ini untuk memverifikasi bahwa Ops Agent
menulis log dengan melakukan salah satu tindakan berikut:
- Telusuri log VM tertentu untuk menemukan pesan ping menggunakan Logs Explorer.
- Periksa nilai metrik
log_entry_count
untuk VM tertentu dengan menggunakan Metrics Explorer. - Buat kebijakan pemberitahuan untuk memberi tahu
Anda jika VM tertentu tidak memperbarui metrik
log_entry_count
.
Jika salah satu opsi ini menunjukkan bahwa pesan log tidak ditransfer, Anda dapat melakukan hal berikut:
- Periksa kode error yang menunjukkan error pengaktifan atau error runtime.
- Tentukan apakah Ops Agent sudah aktif dan berjalan.
- Jalankan skrip diagnostik agen.
Untuk memeriksa status Agen Operasional di VM tertentu, Anda memerlukan ID instance VM. Untuk menemukan ID instance, lakukan hal berikut:
-
Di Konsol Google Cloud, buka halaman Instance VM:
Jika Anda menggunakan kotak penelusuran untuk menemukan halaman ini, pilih hasil yang subjudulnya adalah Compute Engine.
- Klik nama instance VM.
- Pada tab Detail, cari bagian Informasi dasar. ID instance muncul sebagai string numerik. Gunakan string ini untuk nilai INSTANCE_ID di bagian berikutnya.
Alat diagnostik agen untuk VM
Alat diagnostik agen mengumpulkan informasi proses debug lokal yang penting dari VM Anda untuk semua agen berikut: Agen Operasional, agen Logging lama, dan agen Pemantauan lama. Informasi proses debug mencakup hal-hal seperti info project, info VM, konfigurasi agen, log agen, status layanan agen, informasi yang biasanya memerlukan pekerjaan manual untuk dikumpulkan. Alat ini juga memeriksa lingkungan VM lokal untuk memastikannya memenuhi persyaratan tertentu agar agen berfungsi dengan baik, misalnya, konektivitas jaringan dan izin yang diperlukan.
Saat mengajukan kasus pelanggan untuk agen di VM, jalankan alat diagnostik agen dan lampirkan informasi yang dikumpulkan ke kasus tersebut. Dengan memberikan informasi ini, waktu yang diperlukan untuk memecahkan masalah dukungan Anda akan berkurang. Sebelum melampirkan informasi ke kasus dukungan, samarkan informasi sensitif seperti sandi.
Alat diagnostik agen harus dijalankan dari dalam VM, sehingga Anda biasanya harus menggunakan SSH ke VM terlebih dahulu. Perintah berikut mengambil alat diagnostik agen dan menjalankannya:
Linux
curl -sSO https://dl.google.com/cloudagents/diagnose-agents.sh
sudo bash diagnose-agents.sh
Windows
(New-Object Net.WebClient).DownloadFile("https://dl.google.com/cloudagents/diagnose-agents.ps1", "${env:UserProfile}\diagnose-agents.ps1")
Invoke-Expression "${env:UserProfile}\diagnose-agents.ps1"
Ikuti output eksekusi skrip untuk menemukan file yang menyertakan
info yang dikumpulkan. Biasanya, Anda dapat menemukannya di direktori /var/tmp/google-agents
di Linux dan di direktori $env:LOCALAPPDATA/Temp
di Windows,
kecuali jika Anda telah menyesuaikan direktori output saat menjalankan skrip.
Untuk mengetahui informasi selengkapnya, periksa skrip diagnose-agents.sh
di Linux atau
skrip diagnose-agents.ps1
di Windows.
Alat diagnostik agen untuk kebijakan penginstalan otomatis
Jika upaya menginstal Agen Ops menggunakan kebijakan OS Agen Ops gagal, Anda dapat menggunakan skrip diagnostik yang dijelaskan di bagian ini untuk proses debug. Misalnya, Anda mungkin melihat salah satu kasus berikut:
- Penginstalan Agen Operasional gagal saat Anda menggunakan kotak centang Install Ops Agent for Monitoring and Logging untuk menginstal Agen Operasional selama pembuatan VM.
Status agen di dasbor Instance VM Cloud Monitoring atau tab Observability di halaman detail VM Compute Engine tetap dalam status Tertunda selama lebih dari 10 menit. Status Tertunda yang berkepanjangan mungkin menunjukkan salah satu hal berikut:
- Masalah saat menerapkan kebijakan.
- Masalah dalam penginstalan Agen Operasional yang sebenarnya.
- Masalah konektivitas antara VM dan Cloud Monitoring.
Untuk beberapa masalah ini, skrip diagnostik agen dan pemeriksaan kondisi umum mungkin juga berguna.
Untuk menjalankan skrip diagnostik kebijakan, jalankan perintah berikut:
curl -sSO https://dl.google.com/cloudagents/diagnose-ui-policies.sh bash diagnose-ui-policies.sh VM_NAME VM_ZONE
Skrip ini menampilkan informasi tentang VM yang terpengaruh dan kebijakan penginstalan otomatis terkait.
Saat mengajukan kasus pelanggan untuk agen di VM, jalankan alat diagnostik agen dan lampirkan informasi yang dikumpulkan ke kasus tersebut. Dengan memberikan informasi ini, waktu yang diperlukan untuk memecahkan masalah kasus dukungan Anda akan berkurang. Sebelum melampirkan informasi ke kasus dukungan, samarkan informasi sensitif seperti sandi.
Log mandiri agen
Jika agen gagal menyerap log ke Cloud Logging, Anda mungkin harus memeriksa log agen secara lokal di VM untuk memecahkan masalah. Anda juga dapat menggunakan rotasi log untuk mengelola log mandiri agen.
Linux
Untuk memeriksa log mandiri yang ditulis ke Journald
, jalankan perintah berikut:
journalctl -u google-cloud-ops-agent*
Untuk memeriksa log mandiri yang ditulis ke disk oleh modul logging, jalankan perintah berikut:
vim -M /var/log/google-cloud-ops-agent/subagents/logging-module.log
Windows
Untuk memeriksa log mandiri yang ditulis ke Windows Event Logs
, jalankan perintah
berikut:
Get-WinEvent -FilterHashtable @{ Logname='Application'; ProviderName='google-cloud-ops-agent*' } | Format-Table -AutoSize -Wrap
Untuk memeriksa log mandiri yang ditulis ke disk oleh modul logging, jalankan perintah berikut:
notepad "C:\ProgramData\Google\Cloud Operations\Ops Agent\log\logging-module.log"
Untuk memeriksa log dari Windows Service Control Manager
untuk layanan Ops Agent, jalankan perintah berikut:
Get-WinEvent -FilterHashtable @{ Logname='System'; ProviderName='Service Control Manager' } | Where-Object -Property Message -Match 'Google Cloud Ops Agent' | Format-Table -AutoSize -Wrap
Melihat penggunaan dan diagnostik metrik di Cloud Monitoring
Halaman Pengelolaan Metrik Cloud Monitoring memberikan informasi yang dapat membantu Anda mengontrol jumlah yang Anda belanjakan untuk metrik yang dapat ditagih tanpa memengaruhi visibilitas. Halaman Pengelolaan Metrik melaporkan informasi berikut:
- Volume transfer untuk penagihan berbasis byte dan sampel, di seluruh domain metrik dan untuk setiap metrik.
- Data tentang label dan kardinalitas metrik.
- Jumlah pembacaan untuk setiap metrik.
- Penggunaan metrik dalam kebijakan pemberitahuan dan dasbor kustom.
- Rasio error penulisan metrik.
Anda juga dapat menggunakan Pengelolaan Metrik untuk mengecualikan metrik yang tidak diperlukan, sehingga menghilangkan biaya penyerapannya.
Untuk melihat halaman Pengelolaan Metrik, lakukan tindakan berikut:
-
Di konsol Google Cloud, buka halaman
Metrics management:Jika Anda menggunakan kotak penelusuran untuk menemukan halaman ini, pilih hasil yang subjudulnya adalah Monitoring.
- Di toolbar, pilih jangka waktu. Secara default, halaman Pengelolaan Metrik menampilkan informasi tentang metrik yang dikumpulkan dalam satu hari sebelumnya.
Untuk informasi selengkapnya tentang halaman Pengelolaan Metrik, lihat Melihat dan mengelola penggunaan metrik.