Dokumen ini menjelaskan sumber informasi diagnostik yang dapat Anda gunakan untuk mengidentifikasi masalah dalam penginstalan atau menjalankan Ops Agent.
Memverifikasi status agen menggunakan gcpdiag
Anda dapat menggunakan gcpdiag untuk melaporkan status Ops Agent di setiap VM atau seluruh fleet VM dalam project Anda, yang mengonfirmasi bahwa agen telah diinstal dan secara aktif mengirimkan log dan metrik. gcpdiag dapat membuat laporan status dalam beberapa format, termasuk format CSV atau JSON.
Berikut ini menunjukkan laporan status agen di seluruh armada dalam format CSV:
🔎 gce/ERR/2024_004: Verify Ops Agent is installed on GCE VMs and is sending logs and metrics.
gce/ERR/2024_004,projects/my-project/zones/my-location/instances/instance-1,failed,Ops Agent not installed on the VM,https://gcpdiag.dev/rules/gce/ERR/2024_004
gce/ERR/2024_004,projects/my-project/zones/my-location/instances/instance-2,skipped,VM Manager is needed for the ops agent detection. Please enable it at: https://cloud.google.com/compute/docs/manage-os#automatic and run this check again.,https://gcpdiag.dev/rules/gce/ERR/2024_004
gce/ERR/2024_004,projects/my-project/zones/my-location/instances/instance-3,skipped,VM Manager is needed for the ops agent detection. Please enable it at: https://cloud.google.com/compute/docs/manage-os#automatic and run this check again.,https://gcpdiag.dev/rules/gce/ERR/2024_004
gce/ERR/2024_004,projects/my-project/zones/my-location/instances/instance-4,ok,"Ops Agent installed on the VM, and is successfully sending logs and metrics.",https://gcpdiag.dev/rules/gce/ERR/2024_004
gce/ERR/2024_004,projects/my-project/zones/my-location/instances/instance-5,ok,"Ops Agent installed on the VM, and is successfully sending logs and metrics.",https://gcpdiag.dev/rules/gce/ERR/2024_004
Alat gcpdiag dibuat oleh tim Google Cloud dukungan untuk membantu Anda mendiagnosis sendiri masalah umum di project Google Cloud , termasuk masalah pada Ops Agent. gcpdiag adalah alat open source, bukan produk Google Cloudresmi, tetapi dikembangkan dan dikelola secara aktif oleh tim Google Cloud dukungan. Berkontribusi atau melaporkan masalah di GitHub.
Sebelum memulai
gcpdiag terintegrasi dengan Cloud Shell, sehingga Anda dapat menjalankannya tanpa perlu penginstalan. Untuk menjalankan gcpdiag, Anda harus memenuhi prasyarat berikut terlebih dahulu:
Otorisasi: gcpdiag menggunakan kredensial default aplikasi (ADC) di Cloud Shell untuk melakukan autentikasi.
Pastikan kredensial yang digunakan dengan gcpdiag memiliki setidaknya peran berikut di project Google Cloud tempat Agen Operasional berjalan:- Pelihat (
roles/viewer
) - Pelanggan Penggunaan Layanan (
roles/serviceusage.serviceUsageConsumer
)
- Pelihat (
API: Untuk menggunakan gcpdiag dalam project, API berikut harus diaktifkan:
- Cloud Resource Manager API:
cloudresourcemanager.googleapis.com
- Identity and Access Management API:
iam.googleapis.com
- Cloud Logging API:
logging.googleapis.com
- Penggunaan Layanan:
serviceusage.googleapis.com
Untuk mengaktifkan API ini, jalankan perintah berikut di Cloud Shell atau command line lain:
gcloud --project=PROJECT_ID services enable \ cloudresourcemanager.googleapis.com \ iam.googleapis.com \ logging.googleapis.com \ serviceusage.googleapis.com
- Cloud Resource Manager API:
VM Manager: Aktifkan VM Manager di tingkat gratis pada instance Anda. Jika Anda menginstal Agen Operasional selama pembuatan VM atau jika kebijakan agen mengelola penginstalan Agen Operasional di instance VM, Anda telah memenuhi persyaratan untuk VM Manager.
Menjalankan gcpdiag
Perintah gcpdiag
untuk digunakan dengan Agen Operasional
memiliki sintaksis dasar berikut:
gcpdiag lint --project=PROJECT_ID [--name=INSTANCE_NAME] --show-skipped --include=gce/err/2024_004 [--output=[CSV|JSON]]
- PROJECT_ID adalah ID project Google Cloud Anda.
- INSTANCE_NAME adalah nama VM Compute Engine Anda.
Gunakan opsi
--name
untuk mengkueri VM tertentu; hilangkan opsi untuk mengkueri seluruh armada. - Gunakan opsi
--output
untuk menyimpan laporan dalam file berformat CSV atau JSON; hilangkan opsi ini jika Anda tidak menginginkan file output.
Nilai opsi --include
menentukan satu atau beberapa aturan gcpdiag;
gce/ERR/2024-004
adalah aturan untuk Ops Agent.
Untuk mengetahui informasi selengkapnya tentang sintaksis perintah gcpdiag, lihat gcpdiag - Diagnostics for Google Cloud Platform.
Misalnya, untuk membuat laporan seluruh armada untuk project "my-project", jalankan perintah berikut:
gcpdiag lint --project=my-project --show-skipped --include=gce/ERR/2024_004
Outputnya akan terlihat seperti berikut:
🔎 gce/ERR/2024_004: Verify Ops Agent is installed on GCE VMs and is sending logs and metrics.
- my-project/instance-1 [FAIL] Ops Agent not installed on the VM
- my-project/instance-2 [FAIL] Ops Agent not installed on the VM
- my-project/instance-3 [SKIP] Unable to confirm Ops Agent installation
VM Manager is needed for the ops agent detection. Please enable it at: https://cloud.google.com/compute/docs/manage-os#automatic and run this check again.
- my-project/instance-4 [FAIL] Ops Agent is installed, but it's failing to send both logs and metrics to Google Cloud.
Is Ops Agent sending logs? (Yes) Is Ops Agent sending metrics? (No)
- my-project/instance-5 [FAIL] Ops Agent is installed, but it's failing to send both logs and metrics to Google Cloud.
Is Ops Agent sending logs? (No) Is Ops Agent sending metrics? (No)
- my-project/instance-6 [ OK ] Ops Agent installed on the VM, and is successfully sending logs and metrics.
- my-project/instance-7 [ OK ] Ops Agent installed on the VM, and is successfully sending logs and metrics.
Untuk membuat laporan untuk instance "my-instance" di project "my-project", jalankan perintah berikut:
gcpdiag lint --project=my-project --name=my-instance --show-skipped --include=gce/err/2024_004
Outputnya akan terlihat seperti berikut:
🔎 gce/ERR/2024_004: Verify Ops Agent is installed on GCE VMs and is sending logs and metrics.
- my-project/my-instance [ OK ] Ops Agent installed on the VM, and is successfully sending logs and metrics.
Jika perintah gcpdiag
Anda gagal dengan output yang menyerupai berikut, verifikasi bahwa Anda telah memenuhi semua prasyarat untuk menjalankan alat.
WARNING:googleapiclient.http:Encountered 403 Forbidden with reason "PERMISSION_DENIED"
[ERROR]:can't access project my-project: Cloud Resource Manager API has not been used in project my-project before or it is disabled. Enable it by visiting https://console.developers.google.com/apis/api/cloudresourcemanager.googleapis.com/overview?project=my-project then retry. If you enabled this API recently, wait a few minutes for the action to propagate to our systems and retry..
[DEBUG]: An Http Error occurred whiles accessing projects.get
HttpError 403 when requesting https://cloudresourcemanager.googleapis.com/v3/projects/my-project?alt=json returned Cloud Resource Manager API has not been used in project my-project before or it is disabled. Enable it by visiting https://console.developers.google.com/apis/api/cloudresourcemanager.googleapis.com/overview?project=my-project then retry. If you enabled this API recently, wait a few minutes for the action to propagate to our systems and retry. Details: ...
[ERROR]:exiting program...
error getting project details
Menafsirkan output gcpdiag
Bagian ini memberikan informasi untuk membantu Anda memahami dan menggunakan laporan yang dibuat oleh gcpdiag.
Perintah gcpdiag menghasilkan laporan yang berisi informasi berikut:
- Indikator aturan gcpdiag yang digunakan untuk memanggil perintah.
Untuk Agen Operasional, informasi ini terlihat seperti berikut:
🔎 gce/ERR/2024_004: Verify Ops Agent is installed on GCE VMs and is sending logs and metrics
- ID hasil untuk VM tertentu dengan format PROJECT_ID/INSTANCE_ID. Untuk laporan seluruh fleet, output berisi entri untuk setiap VM. Untuk laporan VM tunggal, output berisi satu entri.
- Status pemeriksaan. Status memiliki salah satu nilai berikut:
- Deskripsi nilai status.
Bagian berikut memberikan informasi selengkapnya tentang nilai status dan artinya.
Status: OK
Status OK
berarti Agen Operasional berjalan di VM dan mengirimkan log dan metrik dari VM. Laporan ini mencakup deskripsi status berikut:
Ops Agent installed on the VM, and is successfully sending logs and metrics.
Status: FAIL
Status FAIL
berarti Agen Operasional tidak diinstal,
atau tidak mengirimkan log dan metrik dari VM. Deskripsi status menunjukkan masalah yang telah terdeteksi:
- Jika Agen Operasional tidak diinstal, Anda akan melihat deskripsi status berikut:
Ops Agent not installed on the VM
- Jika Agen Operasional tidak mengirimkan log dan metrik dari VM, Anda akan melihat deskripsi status seperti berikut:
Agent is installed, but it's failing to send both logs and metrics to Google Cloud.
Is Ops Agent sending logs? (Yes) Is Ops Agent sending metrics? (No)
Jika Agen Operasional belum diinstal, instal Agen Operasional. Jika penginstalan gagal, masalahnya mungkin salah satu dari berikut ini:
- VM tidak memiliki akun layanan terkait. Untuk mengatasi masalah ini, lampirkan akun layanan ke VM, lalu coba menginstal Ops Agent lagi.
- VM sudah menginstal salah satu agen lama (Agen Monitoring atau Agen Logging) . Untuk mengatasi masalah ini, uninstal agen lama, lalu coba menginstal Agen Operasi lagi.
Jika Ops Agent tidak mengirimkan log atau metrik dari VM, gunakan pemeriksaan kondisi agen untuk error waktu mulai guna menentukan dan memperbaiki masalah.
Status: SKIP
Status SKIP
berarti gcpdiag tidak dapat menentukan
apakah Agen Operasional diinstal di VM. Laporan ini mencakup deskripsi status berikut:
Unable to confirm Ops Agent installation
VM Manager is needed for the ops agent detection.
Please enable it at: https://cloud.google.com/compute/docs/manage-os#automatic and run this check again.
Untuk menguji status agen, gcpdiag memerlukan VM Manager agar berjalan di VM Anda. Untuk mengatasi masalah ini, instal
tingkat gratis VM Manager di instance Anda. Setelah menginstal, tunggu 15 menit, lalu coba jalankan perintah gcpdiag
lagi.
Health check agen
Versi 2.25.1 memperkenalkan health check waktu mulai untuk Agen Operasional. Saat dimulai, Agen Operasi akan melakukan serangkaian pemeriksaan untuk kondisi yang mencegah agen berjalan dengan benar. Jika agen mendeteksi salah satu kondisi, agen akan mencatat pesan yang menjelaskan masalah tersebut. Agen Operasional memeriksa hal berikut:
- Masalah konektivitas
- Ketersediaan port yang digunakan oleh agen untuk melaporkan metrik tentang dirinya sendiri
- Masalah izin
- Ketersediaan API yang digunakan oleh agen untuk menulis log atau metrik
- Masalah dalam rutin health check itu sendiri.
Versi 2.37.0 memperkenalkan health check runtime untuk Agen Operasional. Error ini dilaporkan ke Cloud Logging dan Error Reporting. Untuk mengetahui informasi tentang cara menemukan error runtime, lihat Menemukan error runtime.
Versi 2.46.0 memperkenalkan kode LogPingOpsAgent
informasi. Kode ini tidak menunjukkan error.
Untuk mengetahui informasi selengkapnya, lihat
Memverifikasi keberhasilan pengumpulan log.
Tabel berikut mencantumkan setiap kode pemeriksaan kondisi dalam urutan abjad dan menjelaskan arti setiap kode. Kode yang diakhiri dengan string
Err
menunjukkan error; kode lainnya bersifat informatif.
Kode health check | Kategori | Arti | Saran |
---|---|---|---|
DLApiConnErr
|
Konektivitas |
Permintaan ke subdomain download, dl.google.com , gagal.
|
Periksa koneksi internet dan aturan firewall Anda. Untuk mengetahui informasi selengkapnya, lihat Masalah konektivitas jaringan. |
FbMetricsPortErr
|
Ketersediaan port | Port 20202, yang diperlukan untuk metrik mandiri Agen Operasional, tidak tersedia. | Pastikan port 20202 terbuka. Untuk mengetahui informasi selengkapnya, lihat Port yang diperlukan tidak tersedia. |
HcFailureErr
|
Generik | Rutinitas health check Ops Agent mengalami error internal. | Kirim kasus dukungan dari Google Cloud konsol. Untuk mengetahui informasi selengkapnya, lihat Mendapatkan dukungan. |
LogApiConnErr
|
Konektivitas | Permintaan ke Logging API gagal. | Periksa koneksi internet dan aturan firewall Anda. Untuk mengetahui informasi selengkapnya, lihat Masalah konektivitas jaringan. |
LogApiDisabledErr
|
API | Logging API dinonaktifkan di project Google Cloud saat ini. | Aktifkan Logging API. |
LogApiPermissionErr
|
Izin |
Akun layanan tidak memiliki peran Logs Writer
(roles/logging.logWriter ).
|
Berikan peran Penulis Log ke akun layanan. Untuk mengetahui informasi selengkapnya, lihat Agen tidak memiliki izin API. |
LogApiScopeErr
|
Izin | VM tidak memiliki cakupan akses https://www.googleapis.com/auth/logging.write. | Tambahkan cakupan https://www.googleapis.com/auth/logging.write ke VM. Untuk mengetahui informasi selengkapnya, lihat Memverifikasi cakupan akses Anda. |
LogApiUnauthenticatedErr
|
API | VM saat ini tidak dapat melakukan autentikasi ke Logging API. | Pastikan file kredensial, cakupan akses VM, dan izin Anda disiapkan dengan benar. Untuk mengetahui informasi selengkapnya, lihat Memberikan otorisasi Agen Operasional. |
LogPingOpsAgent
|
Pesan payload informasi yang ditulis setiap 10 menit ke log
ops-agent-health . Anda dapat menggunakan entri log
yang dihasilkan untuk memverifikasi bahwa agen mengirim log. Pesan ini bukan
kesalahan.
|
Pesan ini akan muncul setiap 10 menit. Jika pesan tidak muncul selama 20 menit atau lebih, agen mungkin mengalami masalah. Untuk mengetahui informasi pemecahan masalah, lihat Memecahkan masalah Agen Operasional. | |
LogParseErr
|
Runtime | Ops Agent tidak dapat mengurai satu atau beberapa log. | Periksa konfigurasi pemroses logging yang telah Anda buat. Untuk mengetahui informasi selengkapnya, lihat Error penguraian log. |
LogPipeLineErr
|
Runtime | Pipeline logging Ops Agent gagal. | Pastikan agen memiliki akses ke file buffer; periksa apakah disk penuh, dan pastikan konfigurasi Agen Operasi sudah benar. Untuk mengetahui informasi selengkapnya, lihat Error pipeline. |
MetaApiConnErr
|
Konektivitas | Permintaan ke server Metadata GCE, untuk membuat kueri cakupan akses VM, token OAuth, dan label resource, gagal. | Periksa koneksi internet dan aturan firewall Anda. Untuk mengetahui informasi selengkapnya, lihat Masalah konektivitas jaringan. |
MonApiConnErr
|
Konektivitas | Permintaan ke Monitoring API gagal. | Periksa koneksi internet dan aturan firewall Anda. Untuk mengetahui informasi selengkapnya, lihat Masalah konektivitas jaringan. |
MonApiDisabledErr
|
API | Monitoring API dinonaktifkan di project Google Cloud saat ini. | Aktifkan Monitoring API. |
MonApiPermissionErr
|
Izin |
Akun layanan tidak memiliki peran Monitoring Metric Writer
(roles/monitoring.metricWriter ).
|
Berikan peran Monitoring Metric Writer ke akun layanan. Untuk mengetahui informasi selengkapnya, lihat Agen tidak memiliki izin API. |
MonApiScopeErr
|
Izin | VM tidak memiliki cakupan akses https://www.googleapis.com/auth/monitoring.write. | Tambahkan cakupan https://www.googleapis.com/auth/monitoring.write ke VM. Untuk mengetahui informasi selengkapnya, lihat Memverifikasi cakupan akses Anda. |
MonApiUnauthenticatedErr
|
API | VM saat ini tidak dapat melakukan autentikasi ke Monitoring API. | Pastikan file kredensial, cakupan akses VM, dan izin Anda disiapkan dengan benar. Untuk mengetahui informasi selengkapnya, lihat Memberikan otorisasi Agen Operasional. |
OtelMetricsPortErr
|
Ketersediaan port | Port 20201, yang diperlukan untuk metrik mandiri Agen Operasional, tidak tersedia. | Pastikan port 20201 terbuka. Untuk mengetahui informasi selengkapnya, lihat Port yang diperlukan tidak tersedia. |
PacApiConnErr
|
Konektivitas | Kode pemeriksaan kondisi ini tidak dapat diandalkan. Kode ini dinonaktifkan di Ops Agent versi 2.46.1. | Update ke Agen Operasional versi 2.46.1 atau yang lebih baru. |
Menemukan error waktu mulai
Mulai versi 2.35.0, informasi pemeriksaan kondisi ditulis ke log ops-agent-health
oleh Cloud Logging API (versi 2.33.0, 2.34.0 menggunakan ops-agent-health-checks
). Informasi yang sama juga ditulis ke file health-checks.log
sebagai berikut:
- Linux:
/var/log/google-cloud-ops-agent/health-checks.log
- Windows:
C:\ProgramData\Google\Cloud Operations\Ops Agent\log\health-checks.log
Anda juga dapat melihat pesan health check dengan membuat kueri status layanan Agen Operasi sebagai berikut:
- Di Linux, jalankan perintah berikut:
sudo systemctl status google-cloud-ops-agent"*"
Cari pesan seperti "[Ports Check] Result: PASS". Hasil lainnya mencakup "ERROR" dan "FAIL".
- Di Windows, gunakan Event Viewer Windows. Cari pesan "Informasi", "Error", atau "Kegagalan" yang terkait dengan layanan
google-cloud-ops-agent
.
Setelah Anda mengatasi masalah, Anda harus memulai ulang agen. Health check dijalankan saat agen dimulai, jadi untuk menjalankan ulang pemeriksaan, Anda harus memulai ulang agen.
Menemukan error runtime
Pemeriksaan kondisi runtime dilaporkan ke Cloud Logging dan Error Reporting. Jika agen gagal dimulai, tetapi dapat melaporkan error sebelum gagal, Anda mungkin juga melihat error waktu mulai yang dilaporkan.
Untuk melihat error runtime dari Agen Operasional di Logging, lakukan hal berikut:
-
Di konsol Google Cloud , buka halaman Logs Explorer:
Jika Anda menggunakan kotak penelusuran untuk menemukan halaman ini, pilih hasil yang subjudulnya adalah Logging.
- Masukkan kueri berikut, lalu klik Run query:
log_id("ops-agent-health")
Untuk melihat error runtime dari Agen Operasional di Error Reporting, lakukan hal berikut:
-
Di konsol Google Cloud , buka halaman Error Reporting:
Anda juga dapat menemukan halaman ini dengan menggunakan kotak penelusuran.
- Untuk melihat error dari Agen Operasional, filter error untuk
Ops Agent
.
Memverifikasi keberhasilan pengumpulan log
Agen Operasional versi 2.46.0 memperkenalkan health check LogPingOpsAgent
informasi. Pemeriksaan ini menulis pesan informasi ke ops-agent-health
setiap 10 menit.
Anda dapat menggunakan keberadaan pesan ini untuk memverifikasi bahwa Ops Agent sedang menulis log dengan melakukan salah satu tindakan berikut:
- Telusuri log VM tertentu untuk menemukan pesan ping dengan menggunakan Logs Explorer.
- Periksa nilai metrik
log_entry_count
untuk VM tertentu menggunakan Metrics Explorer. - Buat kebijakan pemberitahuan untuk memberi tahu
Anda jika VM tertentu tidak memperbarui metrik
log_entry_count
.
Jika salah satu opsi ini menunjukkan bahwa pesan log tidak diproses, Anda dapat melakukan hal berikut:
- Periksa kode error yang menunjukkan error saat memulai atau error runtime.
- Tentukan apakah Ops Agent sudah aktif dan berjalan.
- Jalankan skrip diagnostik agen.
Untuk memeriksa status Agen Operasional di VM tertentu, Anda memerlukan ID instance VM. Untuk menemukan ID instance, lakukan hal berikut:
-
Di konsol Google Cloud , buka halaman VM instances:
Jika Anda menggunakan kotak penelusuran untuk menemukan halaman ini, pilih hasil yang subjudulnya adalah Compute Engine.
- Klik nama instance VM.
- Di tab Detail, cari bagian Informasi dasar. ID instance muncul sebagai string numerik. Gunakan string ini untuk nilai INSTANCE_ID di bagian berikutnya.
Alat diagnostik agen untuk VM
Alat diagnostik agen mengumpulkan informasi pen-debugan lokal penting dari VM Anda untuk semua agen berikut: Agen Operasional, agen Logging lama, dan agen Monitoring lama. Informasi pen-debug-an mencakup hal-hal seperti info project, info VM, konfigurasi agen, log agen, status layanan agen, informasi yang biasanya memerlukan pekerjaan manual untuk dikumpulkan. Alat ini juga memeriksa lingkungan VM lokal untuk memastikan bahwa lingkungan tersebut memenuhi persyaratan tertentu agar agen dapat berfungsi dengan baik, misalnya, konektivitas jaringan dan izin yang diperlukan.
Saat mengajukan kasus pelanggan untuk agen di VM, jalankan alat diagnostik agen dan lampirkan informasi yang dikumpulkan ke kasus tersebut. Dengan memberikan informasi ini, waktu yang diperlukan untuk memecahkan masalah kasus dukungan Anda akan berkurang. Sebelum Anda melampirkan informasi ke kasus dukungan, samarkan informasi sensitif seperti sandi.
Alat diagnostik agen harus dijalankan dari dalam VM, jadi biasanya Anda harus melakukan SSH ke VM terlebih dahulu. Perintah berikut mengambil alat diagnostik agen dan menjalankannya:
Linux
curl -sSO https://dl.google.com/cloudagents/diagnose-agents.sh
sudo bash diagnose-agents.sh
Windows
(New-Object Net.WebClient).DownloadFile("https://dl.google.com/cloudagents/diagnose-agents.ps1", "${env:UserProfile}\diagnose-agents.ps1")
Invoke-Expression "${env:UserProfile}\diagnose-agents.ps1"
Ikuti output eksekusi skrip untuk menemukan file yang menyertakan info yang dikumpulkan. Biasanya, Anda dapat menemukannya di direktori /var/tmp/google-agents
di Linux dan di direktori $env:LOCALAPPDATA/Temp
di Windows, kecuali jika Anda telah menyesuaikan direktori output saat menjalankan skrip.
Untuk mengetahui informasi mendetail, periksa skrip diagnose-agents.sh
di Linux atau skrip diagnose-agents.ps1
di Windows.
Alat diagnostik agen untuk kebijakan penginstalan otomatis
Jika upaya menginstal Agen Ops menggunakan kebijakan OS Agen Ops gagal, Anda dapat menggunakan skrip diagnostik yang dijelaskan di bagian ini untuk melakukan proses debug. Misalnya, Anda mungkin melihat salah satu kasus berikut:
- Penginstalan Agen Operasional gagal saat Anda menggunakan kotak centang Install Ops Agent for Monitoring and Logging untuk menginstal Agen Operasional selama pembuatan VM.
Status agen di dasbor Instance VM Cloud Monitoring atau tab Observability di halaman detail VM Compute Engine tetap dalam status Tertunda selama lebih dari 10 menit. Status Tertunda yang berlangsung lama dapat menunjukkan salah satu hal berikut:
- Terjadi masalah saat menerapkan kebijakan.
- Masalah dalam penginstalan Agen Operasional yang sebenarnya.
- Masalah konektivitas antara VM dan Cloud Monitoring.
Untuk beberapa masalah ini, skrip diagnostik agen umum dan pemeriksaan kondisi mungkin juga berguna.
Untuk menjalankan skrip diagnostik kebijakan, jalankan perintah berikut:
curl -sSO https://dl.google.com/cloudagents/diagnose-ui-policies.sh bash diagnose-ui-policies.sh VM_NAME VM_ZONE
Skrip ini menampilkan informasi tentang VM yang terpengaruh dan kebijakan penginstalan otomatis terkait.
Saat mengajukan kasus pelanggan untuk agen di VM, jalankan alat diagnostik agen dan lampirkan informasi yang dikumpulkan ke kasus tersebut. Dengan memberikan informasi ini, waktu yang diperlukan untuk memecahkan masalah kasus dukungan Anda akan berkurang. Sebelum Anda melampirkan informasi ke kasus dukungan, samarkan informasi sensitif seperti sandi.
Log mandiri agen
Jika agen gagal menyerap log ke Cloud Logging, Anda mungkin harus memeriksa log agen secara lokal di VM untuk memecahkan masalah. Anda juga dapat menggunakan rotasi log untuk mengelola log mandiri agen.
Linux
Untuk memeriksa log mandiri yang ditulis ke Journald
, jalankan perintah berikut:
journalctl -u google-cloud-ops-agent*
Untuk memeriksa log mandiri yang ditulis ke disk oleh modul logging, jalankan perintah berikut:
vim -M /var/log/google-cloud-ops-agent/subagents/logging-module.log
Windows
Untuk memeriksa log mandiri yang ditulis ke Windows Event Logs
, jalankan perintah berikut:
Get-WinEvent -FilterHashtable @{ Logname='Application'; ProviderName='google-cloud-ops-agent*' } | Format-Table -AutoSize -Wrap
Untuk memeriksa log mandiri yang ditulis ke disk oleh modul logging, jalankan perintah berikut:
notepad "C:\ProgramData\Google\Cloud Operations\Ops Agent\log\logging-module.log"
Untuk memeriksa log dari layanan Windows Service Control Manager
untuk Agen Operasional, jalankan perintah berikut:
Get-WinEvent -FilterHashtable @{ Logname='System'; ProviderName='Service Control Manager' } | Where-Object -Property Message -Match 'Google Cloud Ops Agent' | Format-Table -AutoSize -Wrap
Melihat penggunaan dan diagnostik metrik di Cloud Monitoring
Halaman Pengelolaan Metrik Cloud Monitoring memberikan informasi yang dapat membantu Anda mengontrol jumlah yang Anda belanjakan untuk metrik yang dapat ditagih tanpa memengaruhi kemampuan pengamatan. Halaman Pengelolaan Metrik melaporkan informasi berikut:
- Volume penyerapan untuk penagihan berbasis byte dan sampel, di seluruh domain metrik dan untuk setiap metrik.
- Data tentang label dan kardinalitas metrik.
- Jumlah pembacaan untuk setiap metrik.
- Penggunaan metrik dalam kebijakan pemberitahuan dan dasbor kustom.
- Rasio error penulisan metrik.
Anda juga dapat menggunakan halaman Pengelolaan Metrik untuk mengecualikan metrik yang tidak diperlukan, sehingga menghilangkan biaya penyerapan metrik tersebut.
Untuk melihat halaman Pengelolaan Metrik, lakukan hal berikut:
-
Di konsol Google Cloud , buka halaman
Pengelolaan metrik:Jika Anda menggunakan kotak penelusuran untuk menemukan halaman ini, pilih hasil yang subjudulnya adalah Monitoring.
- Di toolbar, pilih rentang waktu Anda. Secara default, halaman Pengelolaan Metrik menampilkan informasi tentang metrik yang dikumpulkan dalam satu hari sebelumnya.
Untuk mengetahui informasi selengkapnya tentang halaman Pengelolaan Metrik, lihat Melihat dan mengelola penggunaan metrik.