Lihat metrik

Topik ini menjelaskan cara melihat metrik hybrid Apigee di dasbor Cloud Operations.

Tentang Cloud Operations

Untuk informasi selengkapnya tentang metrik, dasbor, dan Cloud Operations, lihat:

Mengaktifkan metrik campuran

Sebelum metrik campuran dapat dikirim ke Cloud Operations, Anda harus mengaktifkan pengumpulan metrik terlebih dahulu. Lihat Mengonfigurasi pengumpulan metrik untuk prosedur ini.

Tentang nama dan label metrik campuran

Jika diaktifkan, hybrid akan otomatis mengisi metrik Cloud Operations. Awalan nama domain metrik yang dibuat oleh hybrid adalah:

apigee.googleapis.com/

Misalnya, metrik /proxy/request_count berisi jumlah total permintaan yang diterima oleh proxy API. Oleh karena itu, nama metrik di Cloud Operations adalah:

apigee.googleapis.com/proxy/request_count

Cloud Operations memungkinkan Anda memfilter dan mengelompokkan data metrik berdasarkan label. Beberapa label telah ditentukan sebelumnya, dan label lainnya ditambahkan secara eksplisit oleh hybrid. Bagian Metrik yang tersedia di bawah mencantumkan semua metrik hibrida yang tersedia dan label apa pun yang ditambahkan secara khusus untuk metrik yang dapat Anda gunakan untuk pemfilteran dan pengelompokan.

Melihat metrik

Contoh berikut menunjukkan cara melihat metrik di Cloud Operations:
  1. Buka Monitoring Metrics Explorer di browser. Atau, jika Anda sudah berada di konsol Cloud Operations, pilih Metrics Explorer.
  2. Di Find resource type and metric, temukan dan pilih metrik yang ingin Anda periksa. Pilih metrik tertentu yang tercantum di Metrik yang tersedia, atau telusuri metrik.

  3. Pilih metrik yang diinginkan.
  4. Terapkan filter. Pilihan filter untuk setiap metrik tercantum di Metrik yang tersedia.
  5. Cloud Operations menampilkan diagram untuk metrik yang dipilih.
  6. Klik Simpan.

Membuat dasbor

Dasbor adalah salah satu cara untuk melihat dan menganalisis data metrik yang penting bagi Anda. Cloud Operations menyediakan dasbor standar untuk resource dan layanan yang Anda gunakan, dan Anda juga dapat membuat dasbor kustom.

Anda menggunakan diagram untuk menampilkan metrik Apigee di dasbor kustom. Dengan dasbor kustom, Anda memiliki kontrol penuh atas diagram yang ditampilkan dan konfigurasinya. Untuk mengetahui informasi selengkapnya tentang cara membuat diagram, lihat Membuat diagram.

Contoh berikut menunjukkan cara membuat dasbor di Cloud Operations, lalu menambahkan diagram untuk melihat data metrik:

  1. Buka Monitoring Metrics Explorer di browser, lalu pilih Dashboards.
  2. Pilih + Create Dashboard.
  3. Beri nama dasbor. Misalnya: Traffic Permintaan Proxy Hybrid
  4. Klik Konfirmasi.
  5. Untuk setiap diagram yang ingin Anda tambahkan ke dasbor, ikuti langkah-langkah berikut:

    1. Di dasbor, pilih Tambahkan diagram.
    2. Pilih metrik yang diinginkan seperti yang dijelaskan di atas di bagian Melihat metrik.
    3. Selesaikan dialog untuk menentukan diagram Anda.
    4. Klik Simpan. Cloud Operations menampilkan data untuk metrik yang dipilih.

Metrik yang tersedia

Tabel berikut mencantumkan metrik untuk menganalisis traffic proxy. Untuk mengetahui informasi selengkapnya tentang setiap metrik Apigee, lihat Metrik Google Cloud.

Metrik traffic proxy, target, dan server

Open Telemetry mengumpulkan dan memproses metrik (seperti yang dijelaskan dalam Pengumpulan metrik) untuk traffic proxy, target, dan server.

Tabel berikut menjelaskan metrik yang digunakan kolektor Open Telemetry.

Nama metrik Gunakan
/proxy/request_count Jumlah permintaan ke proxy Apigee sejak sampel terakhir dicatat.
/proxy/response_count Jumlah respons yang dikirim oleh proxy API Apigee.
/proxy/latencies Distribusi latensi, yang dihitung dari waktu permintaan diterima oleh proxy Apigee hingga waktu respons dikirim dari proxy Apigee ke klien.
/proxyv2/request_count Total jumlah permintaan proxy API yang diterima.
/proxyv2/response_count Jumlah total respons proxy API yang diterima.
/proxyv2/latencies_percentile Persentil dari semua respons kebijakan API terhadap permintaan.
/target/request_count Jumlah permintaan yang dikirim ke target Apigee sejak sampel terakhir dicatat.
/target/response_count Jumlah respons yang diterima dari target Apigee sejak sampel terakhir dicatat.
/target/latencies Distribusi latensi, yang dihitung dari waktu permintaan dikirim ke target Apigee hingga waktu respons diterima oleh proxy Apigee. Waktu tidak mencakup overhead proxy Apigee API.
/targetv2/request_count Jumlah total permintaan yang dikirim ke target proxy.
/targetv2/response_count Jumlah total respons yang diterima dari target proxy.
/server/fault_count

Jumlah total error untuk aplikasi server.

Misalnya, aplikasi dapat berupa apigee-runtime, apigee-synchronizer, atau apigee-udca. Gunakan label pod_name untuk memfilter hasil menurut aplikasi.

/server/nio Ini adalah metrik pengukur yang dapat difilter menurut label state untuk mengambil detail berbagai label. Nilai mewakili operasi sistem dan I/O yang berbeda. Label seperti accepted, accepted_total, close_failed, close_success, conn_pending, connected, connected_total, max_conn, dan timeouts terkait dengan operasi socket dan koneksi. Label lainnya berkaitan dengan operasi sistem lainnya.
/server/num_threads Jumlah thread non-daemon aktif di server.
/server/request_count

Total jumlah permintaan yang diterima oleh aplikasi server.

Misalnya, aplikasi dapat berupa apigee-runtime, apigee-synchronizer, atau apigee-udca. Gunakan label pod_name untuk memfilter hasil menurut aplikasi.

/server/response_count

Total jumlah respons yang dikirim oleh aplikasi server.

Misalnya, aplikasi dapat berupa apigee-runtime, apigee-synchronizer, atau apigee-udca. Gunakan label pod_name untuk memfilter hasil menurut aplikasi.

/server/latencies

Latensi adalah latensi dalam milidetik yang diperkenalkan oleh aplikasi server.

Misalnya, aplikasi dapat berupa apigee-runtime, apigee-synchronizer, atau apigee-udca. Gunakan label pod_name untuk memfilter hasil menurut aplikasi.

/upstream/request_count

Jumlah permintaan yang dikirim oleh aplikasi server ke aplikasi upstream-nya.

Misalnya, untuk apigee-synchronizer, bidang kontrol berada di upstream. Jadi, upstream/request_count untuk apigee-synchronizer adalah metrik yang menunjukkan permintaan yang dibuat apigee-synchronizer ke panel kontrol.

/upstream/response_count

Jumlah respons yang diterima oleh aplikasi server dari aplikasi upstream-nya.

Misalnya, untuk apigee-synchronizer, bidang kontrol berada di upstream. Jadi, upstream/response_count untuk apigee-synchronizer adalah metrik yang menunjukkan permintaan yang diterima apigee-synchronizer dari panel kontrol.

/upstream/latencies

Latensi yang terjadi di aplikasi server upstream dalam milidetik.

Misalnya, untuk apigee-synchronizer, bidang kontrol berada di upstream. Jadi, upstream/latencies untuk apigee-synchronizer adalah metrik yang menunjukkan latensi dari bidang kontrol.

Metrik UDCA

Open Telemetry mengumpulkan dan memproses metrik (seperti yang dijelaskan dalam Pengumpulan metrik) untuk layanan UDCA seperti halnya untuk layanan campuran lainnya.

Tabel berikut menjelaskan metrik yang digunakan kolektor Open Telemetry dalam data metrik UDCA.

state

state

Nama metrik Gunakan
/udca/server/local_file_oldest_ts

Stempel waktu, dalam milidetik sejak awal Unix Epoch, untuk file terlama dalam set data.

Nilai ini dihitung setiap 60 detik dan tidak mencerminkan status secara real time. Jika UDCA sudah yang terbaru dan tidak ada file yang menunggu untuk diupload saat metrik ini dihitung, nilai ini akan menjadi 0.

Jika nilai ini terus meningkat, berarti file lama masih ada di disk.

/udca/server/local_file_latest_ts

Stempel waktu, dalam milidetik sejak awal Unix Epoch, untuk file terbaru di disk berdasarkan status.

Nilai ini dihitung setiap 60 detik dan tidak mencerminkan status secara real time. Jika UDCA sudah yang terbaru dan tidak ada file yang menunggu untuk diupload saat metrik ini dihitung, nilai ini akan menjadi 0.

/udca/server/local_file_count

Jumlah file di disk dalam pod pengumpulan data.

Idealnya, nilainya akan mendekati 0. Nilai tinggi yang konsisten menunjukkan bahwa file tidak diupload atau UDCA tidak dapat menguploadnya dengan cukup cepat.

Nilai ini dihitung setiap 60 detik dan tidak mencerminkan status UDCA secara real time.

/udca/server/total_latencies

Interval waktu, dalam detik, antara file data yang dibuat dan file data yang berhasil diupload.

Bucket akan berukuran 100 md, 250 md, 500 md, 1 dtk, 2 dtk, 4 dtk, 8 dtk, 16 dtk, 32 dtk, dan 64 dtk.

Histogram untuk total latensi dari waktu pembuatan file hingga waktu upload berhasil.

/udca/server/upload_latencies

Total waktu, dalam detik, yang dihabiskan UDCA untuk mengupload file data.

Bucket akan berukuran 100 md, 250 md, 500 md, 1 dtk, 2 dtk, 4 dtk, 8 dtk, 16 dtk, 32 dtk, dan 64 dtk.

Metrik ini akan menampilkan histogram untuk total latensi upload, termasuk semua panggilan upstream.

/udca/upstream/http_error_count

Jumlah total error HTTP yang dialami UDCA. Metrik ini berguna untuk membantu menentukan bagian dependensi eksternal UDCA yang gagal dan alasannya.

Error ini dapat muncul untuk berbagai layanan (getDataLocation, Cloud storage, Token generator) dan untuk berbagai set data (seperti api dan trace) dengan berbagai kode respons.

/udca/upstream/http_latencies

Latensi upstream layanan, dalam detik.

Bucket akan berukuran 100 md, 250 md, 500 md, 1 dtk, 2 dtk, 4 dtk, 8 dtk, 16 dtk, 32 dtk, dan 64 dtk.

Histogram untuk latensi dari layanan upstream.

/udca/upstream/uploaded_file_sizes

Ukuran file yang diupload ke layanan Apigee, dalam byte.

Bucket akan berukuran 1 KB, 10 KB, 100 KB, 1 MB, 10 MB, 100 MB, dan 1 GB.

Histogram untuk ukuran file menurut set data, organisasi, dan lingkungan.

/udca/upstream/uploaded_file_count Jumlah file yang diupload UDCA ke layanan Apigee.

Perhatikan bahwa:

  • Nilai set data event harus terus bertambah.
  • Nilai set data api harus terus meningkat jika org/env memiliki traffic yang konstan.
  • Nilai set data trace akan meningkat saat Anda menggunakan alat pelacakan Apigee untuk men-debug atau memeriksa permintaan.
/udca/disk/used_bytes

Ruang yang ditempati oleh file data di disk pod pengumpulan data, dalam byte.

Peningkatan nilai ini dari waktu ke waktu:

  • ready_to_upload menyiratkan bahwa agen tertinggal.
  • failed menyiratkan bahwa file menumpuk di disk dan tidak diupload. Nilai ini dihitung setiap 60 detik.
/udca/server/pruned_file_count Jumlah file yang telah dihapus karena Time To Life (TTL)-nya melebihi nilai minimum yang ditetapkan. Set data dapat mencakup API, rekaman aktivitas, dan lainnya, dan statusnya dapat berupa UPLOADED, FAILED, atau DISCARDED.
/udca/server/retry_cache_size

Jumlah file, berdasarkan set data, yang dicoba diupload ulang oleh UDCA.

Setelah 3 percobaan ulang untuk setiap file, UDCA akan memindahkan file ke subdirektori /failed dan menghapusnya dari cache ini. Peningkatan nilai ini dari waktu ke waktu menyiratkan bahwa cache tidak dihapus, yang terjadi saat file dipindahkan ke subdirektori /failed setelah 3 percobaan ulang.

Metrik Cassandra

Open Telemetry mengumpulkan dan memproses metrik (seperti yang dijelaskan dalam Pengumpulan metrik) untuk Cassandra seperti halnya untuk layanan campuran lainnya.

Tabel berikut menjelaskan metrik yang digunakan kolektor Open Telemetry dalam data metrik Cassandra.

Nama metrik (tidak termasuk domain) Gunakan
/cassandra/process_max_fds Jumlah maksimum deskriptor file terbuka.
/cassandra/process_open_fds Buka deskripsi file.
/cassandra/jvm_memory_pool_bytes_max Penggunaan memori maksimum JVM untuk kumpulan.
/cassandra/jvm_memory_pool_bytes_init Penggunaan memori awal JVM untuk kumpulan.
/cassandra/jvm_memory_bytes_max Penggunaan memori maksimum heap JVM.
/cassandra/process_cpu_seconds_total Waktu CPU pengguna dan sistem yang dihabiskan dalam hitungan detik.
/cassandra/jvm_memory_bytes_used Penggunaan memori heap JVM.
/cassandra/compaction_pendingtasks Kompresi yang luar biasa untuk sstables Cassandra. Lihat Pengompresian untuk mengetahui informasi selengkapnya.
/cassandra/jvm_memory_bytes_init Penggunaan memori awal heap JVM.
/cassandra/jvm_memory_pool_bytes_used Penggunaan memori kumpulan JVM.
/cassandra/jvm_memory_pool_bytes_committed Penggunaan memori yang di-commit oleh kumpulan JVM.
/cassandra/clientrequest_latency Latensi permintaan baca dalam rentang persentil ke-75 dalam mikrodetik.
/cassandra/jvm_memory_bytes_committed Penggunaan memori yang di-commit heap JVM.

Menggunakan metrik Cassandra

Apigee merekomendasikan metrik berikut sebagai metrik penting untuk dipantau di database Cassandra Anda:

  • Rasio permintaan Cassandra: Gunakan metrik ini untuk memantau rasio permintaan baca dan tulis cassandra.
    Metrik: apigee.googleapis.com/cassandra/clientrequest_latency
    Label resource: project_id, location, cluster_name, namespace_name, pod_name, container_name
    Label metrik: scope, unit

    Gunakan label ini untuk memfilter resource tertentu atau untuk mengelompokkan.

    Untuk memantau frekuensi permintaan baca cassandra, terapkan filter berikut.

    Filter: metric.scope == 'Read'
    metric.unit == 'OneMinuteRate'

    Untuk memantau rasio permintaan tulis cassandra, terapkan filter berikut.

    Filter: metric.scope == 'Write'
    metric.unit == 'OneMinuteRate'
  • Latensi permintaan Cassandra: Gunakan metrik ini untuk memantau latensi permintaan baca dan tulis cassandra. Ini adalah metrik yang sama dengan rasio permintaan, apigee.googleapis.com/cassandra/clientrequest_latency dengan filter yang berbeda diterapkan.

    Untuk memantau latensi permintaan baca cassandra, terapkan filter berikut.

    Filter: metric.scope == 'Read'
    metric.unit == '99thPercentile' atau '95thPercentile' atau '75thPercentile'

    Untuk memantau latensi permintaan tulis cassandra, terapkan filter berikut.

    Filter: metric.scope == 'Write'
    metric.unit == '99thPercentile' atau '95thPercentile' atau '75thPercentile'
  • Pemakaian permintaan CPU pod Cassandra
    Metrik: kubernetes.io/container/cpu/request_utilization (GKE on Google Cloud)
    kubernetes.io/anthos/container/cpu/request_utilization (Google Distributed Cloud)
    Label resource: project_id, location, cluster_name, namespace_name, pod_name, container_name

    Gunakan label ini untuk memfilter resource tertentu atau untuk mengelompokkan.

  • Penggunaan volume data Cassandra
    Metrik: kubernetes.io/pod/volume/utilization (GKE on Google Cloud)
    kubernetes.io/anthos/pod/volume/utilization (Google Distributed Cloud)
    Label resource: project_id, location, cluster_name, namespace_name, pod_name
    Label metrik: volume_name

    Gunakan label ini untuk memfilter resource tertentu atau untuk mengelompokkan.

Rekomendasi untuk menskalakan cluster Cassandra

Panduan berikut dapat berfungsi sebagai cluster yang direkomendasikan untuk keputusan menskalakan cluster Cassandra Anda. Secara umum, jika permintaan baca atau tulis secara konsisten menunjukkan latensi persentil ke-99 atau latensi terus meningkat, dan Anda melihat lonjakan penggunaan permintaan CPU yang sesuai dan kecepatan permintaan baca atau tulis, cluster Cassandra Anda dapat dianggap mengalami tekanan. Sebaiknya pertimbangkan untuk menskalakan cluster. Untuk informasi selengkapnya, lihat Menskalakan Cassandra

MetrikAmbang batasDurasi pemicu
kubernetes.io/pod/volume/utilization85%5 mnt
kubernetes.io/container/cpu/request_utilization85%3 mnt
Read request Latency 99thPercentile5 dtk3 mnt
Write request Latency 99thPercentile5 dtk3 mnt