Lihat metrik

Topik ini menjelaskan cara melihat metrik hybrid Apigee dalam Dasbor Cloud Operations.

Tentang Cloud Operations

Untuk informasi lebih lanjut tentang metrik, dasbor, dan Cloud Operations, lihat:

Mengaktifkan metrik campuran

Sebelum metrik campuran dapat dikirim ke Cloud Operations, Anda harus terlebih dahulu mengaktifkan pengumpulan metrik. Lihat Mengonfigurasi pengumpulan metrik untuk prosedur ini.

Tentang nama dan label metrik campuran

Saat diaktifkan, sistem hybrid akan otomatis mengisi metrik Cloud Operations. Awalan nama domain metrik yang dibuat oleh campuran adalah:

apigee.googleapis.com/

Misalnya, metrik /proxyv2/request_count berisi jumlah total permintaan yang diterima oleh proxy API. Oleh karena itu, nama metrik dalam Cloud Operations adalah:

apigee.googleapis.com/proxyv2/request_count

Cloud Operations memungkinkan Anda memfilter dan grup data metrik berdasarkan label. Beberapa label telah ditetapkan sebelumnya, dan lainnya ditambahkan secara eksplisit oleh campuran. Bagian Metrik yang tersedia di bawah mencantumkan semua metrik campuran yang tersedia metrik dan label apa pun yang ditambahkan secara khusus untuk metrik yang dapat digunakan untuk memfilter dan mengelompokkan.

Melihat metrik

Contoh berikut menunjukkan cara melihat metrik di Cloud Operations:
  1. Buka Monitoring Metrics Explorer di browser. Atau, jika Anda sudah berada dalam Konsol Cloud Operations, pilih Metrics Explorer.
  2. Di Find resource type and metric, cari dan pilih metrik yang ingin Anda periksa. Pilih metrik tertentu yang tercantum di Metrik yang tersedia, atau telusuri metrik.

  3. Pilih metrik yang diinginkan.
  4. Terapkan filter. Pilihan filter untuk setiap metrik tercantum di Metrik yang tersedia.
  5. Cloud Operations menampilkan diagram untuk metrik yang dipilih.
  6. Klik Simpan.

Membuat sebuah {i>dashboard<i}

Dasbor adalah salah satu cara bagi Anda untuk melihat dan menganalisis data metrik yang penting bagi Anda. Cloud Operations menyediakan dasbor standar untuk resource dan layanan yang Anda gunakan, dan Anda juga dapat membuat dasbor kustom.

Anda menggunakan diagram untuk menampilkan metrik Apigee di dasbor kustom. Dengan dasbor kustom, Anda memiliki kontrol penuh di atas diagram yang ditampilkan dan konfigurasinya. Untuk informasi selengkapnya tentang cara membuat diagram, lihat Membuat diagram.

Contoh berikut menunjukkan cara membuat dasbor di Cloud Operations, lalu menambahkan diagram untuk melihat data metrik:

  1. Buka Monitoring Metrics Explorer di browser, lalu pilih Dasbor.
  2. Pilih + Create Dashboard.
  3. Beri nama dasbor. Misalnya: Traffic Permintaan Proxy Hybrid
  4. Klik Confirm.
  5. Untuk setiap diagram yang ingin Anda tambahkan ke dasbor, ikuti langkah-langkah berikut:

    1. Di dasbor, pilih Tambahkan diagram.
    2. Pilih metrik yang diinginkan seperti yang dijelaskan di atas dalam Metrik penayangan.
    3. Selesaikan dialog untuk menentukan diagram Anda.
    4. Klik Simpan. Cloud Operations menampilkan data untuk metrik yang dipilih.

Metrik yang tersedia

Tabel berikut mencantumkan metrik untuk menganalisis traffic proxy.

Metrik traffic proxy, target, dan server

Layanan Prometheus mengumpulkan dan memproses metrik (seperti yang dijelaskan dalam Pengumpulan metrik) untuk {i>proxy<i}, target, dan lalu lintas server.

Tabel berikut menjelaskan metrik dan label yang digunakan Prometheus. Label ini digunakan dalam entri log metrik.

Nama metrik Label Gunakan
/proxyv2/request_count method Jumlah total permintaan proxy API yang diterima.
/proxyv2/response_count method response_code Jumlah total respons proxy API yang diterima.
/proxyv2/latencies_percentile method Persentil semua respons kebijakan API terhadap permintaan.
/targetv2/request_count method

target_type

target_endpoint

Jumlah total permintaan yang dikirim ke target proxy.
/targetv2/response_count method

response_code

target_type

target_endpoint

Jumlah total respons yang diterima dari target proxy.
/server/fault_count source

Jumlah total kesalahan untuk aplikasi server.

Misalnya, aplikasi dapat berupa apigee-runtime, apigee-synchronizer, atau apigee-udca. Gunakan label pod_name untuk memfilter hasil menurut aplikasi.

/server/nio state Jumlah soket yang terbuka.
/server/num_threads Jumlah thread non-daemon yang aktif di server.
/server/request_count method

type

Jumlah total permintaan yang diterima oleh aplikasi server.

Misalnya, aplikasi dapat berupa apigee-runtime, apigee-synchronizer, atau apigee-udca. Gunakan label pod_name untuk memfilter hasil menurut aplikasi.

/server/response_count method

response_code
type

Jumlah total respons yang dikirim oleh aplikasi server.

Misalnya, aplikasi dapat berupa apigee-runtime, apigee-synchronizer, atau apigee-udca. Gunakan label pod_name untuk memfilter hasil menurut aplikasi.

/server/latencies method

response_code
type

Latensi adalah latensi dalam milidetik yang diperkenalkan oleh aplikasi server.

Misalnya, aplikasi dapat berupa apigee-runtime, apigee-synchronizer, atau apigee-udca. Gunakan label pod_name untuk memfilter hasil menurut aplikasi.

/upstream/request_count method

type

Jumlah permintaan yang dikirim oleh aplikasi server ke aplikasi upstream-nya.

Misalnya, untuk apigee-synchronizer, bidang kontrolnya adalah upstream. Jadi, upstream/request_count untuk apigee-synchronizer adalah metrik yang menunjukkan permintaan yang dibuat apigee-synchronizer ke bidang kontrol.

/upstream/response_count method

response_code

type

Jumlah respons yang diterima oleh aplikasi server dari aplikasi upstreamnya.

Misalnya, untuk apigee-synchronizer, bidang kontrolnya adalah upstream. Jadi, upstream/response_count untuk apigee-synchronizer adalah metrik yang menunjukkan permintaan yang diterima apigee-synchronizer dari bidang kontrol.

/upstream/latencies method

response_code
type

Latensi yang timbul di aplikasi server upstream dalam milidetik.

Misalnya, untuk apigee-synchronizer, bidang kontrolnya adalah upstream. Jadi, upstream/latencies untuk apigee-synchronizer adalah metrik yang menunjukkan latensi dari bidang kontrol.

Metrik UDCA

Layanan Prometheus mengumpulkan dan memproses metrik (seperti yang dijelaskan dalam Pengumpulan metrik) untuk Layanan UDCA seperti halnya layanan hybrid lainnya.

Tabel berikut menjelaskan metrik dan label yang digunakan Prometheus dalam Data metrik UDCA. Label ini digunakan dalam entri log metrik.

Nama metrik Label Gunakan
/udca/server/local_file_oldest_ts dataset

state

Stempel waktu, dalam milidetik sejak dimulainya Unix Epoch, untuk file terlama dalam set data.

Hal ini dihitung setiap 60 detik dan tidak mencerminkan status secara real time. Jika UDCA adalah versi terbaru dan tidak ada file yang menunggu untuk diupload saat metrik ini dihitung, nilai ini akan menjadi 0.

Jika nilai ini terus meningkat, file lama masih ada di disk.

/udca/server/local_file_latest_ts dataset

state

Stempel waktu, dalam milidetik sejak dimulainya Unix Epoch, untuk file terbaru pada disk berdasarkan status.

Hal ini dihitung setiap 60 detik dan tidak mencerminkan status secara real time. Jika UDCA adalah versi terbaru dan tidak ada file yang menunggu untuk diupload saat metrik ini dihitung, nilai ini akan menjadi 0.

/udca/server/local_file_count dataset

state

Jumlah jumlah file pada disk di pod pengumpulan data.

Idealnya, nilainya akan mendekati 0. Nilai tinggi yang konsisten menunjukkan bahwa file tidak diupload atau UDCA tidak dapat menguploadnya dengan cukup cepat.

Nilai ini dihitung setiap 60 detik dan tidak mencerminkan status UDCA secara real time.

/udca/server/total_latencies dataset

Interval waktu, dalam detik, antara file data yang sedang dibuat dan file data yang berhasil diupload.

Bucket akan berdurasi 100 md, 250 md, 500 md, 1 dtk, 2 dtk, 4 dtk, 8 dtk, 16 dtk, 32 dtk, dan 64 dtk.

Histogram untuk latensi total dari waktu pembuatan file hingga waktu upload yang berhasil.

/udca/server/upload_latencies dataset

Total waktu, dalam detik, yang dihabiskan UDCA untuk mengupload file data.

Bucket akan berdurasi 100 md, 250 md, 500 md, 1 dtk, 2 dtk, 4 dtk, 8 dtk, 16 dtk, 32 dtk, dan 64 dtk.

Metrik akan menampilkan histogram untuk total latensi upload, termasuk semua panggilan upstream.

/udca/upstream/http_error_count service

dataset

response_code

Jumlah total error HTTP yang ditemukan UDCA. Metrik ini berguna untuk membantu menentukan bagian mana dari dependensi eksternal UDCA yang gagal dan apa alasannya.

Error ini dapat muncul untuk berbagai layanan (getDataLocation, Cloud storage, Token generator) dan untuk berbagai set data (seperti api dan trace) dengan berbagai kode respons.

/udca/upstream/http_latencies service

dataset

Latensi upstream layanan, dalam detik.

Bucket akan berdurasi 100 md, 250 md, 500 md, 1 dtk, 2 dtk, 4 dtk, 8 dtk, 16 dtk, 32 dtk, dan 64 dtk.

Histogram untuk latensi dari layanan upstream.

/udca/upstream/uploaded_file_sizes dataset

Ukuran file yang diupload ke layanan Apigee, dalam byte.

Bucket akan berukuran 1KB, 10KB, 100KB, 1MB, 10MB, 100MB, dan 1GB.

Histogram untuk ukuran file berdasarkan {i>dataset<i}, organisasi, dan lingkungan.

/udca/upstream/uploaded_file_count dataset Jumlah file yang diupload UDCA ke layanan Apigee.

Perlu diingat bahwa:

  • Nilai set data event harus menyimpan berkembang.
  • Nilai set data api harus menyimpan berkembang jika org/env memiliki traffic yang konstan.
  • Nilai set data trace akan meningkat saat Anda menggunakan alat rekaman aktivitas Apigee untuk men-debug atau memeriksa permintaan.
/udca/disk/used_bytes dataset

state

Ruang yang ditempati oleh file data pada disk pod pengumpulan data, dalam byte.

Peningkatan nilai ini dari waktu ke waktu:

  • ready_to_upload menyiratkan bahwa agen tersebut tertinggal.
  • failed menyiratkan file menumpuk {i>disk<i} dan tidak sedang diupload. Nilai ini dihitung setiap 60 detik.
/udca/server/pruned_file_count dataset

state

Jumlah file yang telah dihapus karena Time To Life (TTL) melebihi batas yang ditetapkan. Set data dapat mencakup API, rekaman aktivitas, dan lainnya, serta status dapat berupa UPLOADED, FAILED, atau DISCARDED.
/udca/server/retry_cache_size dataset

Hitungan jumlah file, berdasarkan set data, yang coba diupload oleh UDCA.

Setelah 3 kali percobaan ulang untuk setiap file, UDCA memindahkan file ke subdirektori /failed dan menghapusnya dari cache ini. Peningkatan nilai ini dari waktu ke waktu menyiratkan bahwa cache tidak dihapus, yang terjadi saat file dipindahkan ke subdirektori /failed setelah 3 kali percobaan ulang.

Metrik Cassandra

Layanan Prometheus mengumpulkan dan memproses metrik (seperti yang dijelaskan dalam Pengumpulan metrik) untuk Cassandra seperti halnya layanan hybrid lainnya.

Tabel berikut menjelaskan metrik dan label yang digunakan Prometheus dalam data metrik Cassandra. Label ini digunakan dalam entri log metrik.

Nama metrik (tidak termasuk domain) Label Gunakan
/cassandra/process_max_fds Jumlah maksimum deskriptor file yang terbuka.
/cassandra/process_open_fds Buka deskriptor file.
/cassandra/jvm_memory_pool_bytes_max pool Penggunaan memori maksimum JVM untuk gabungan.
/cassandra/jvm_memory_pool_bytes_init pol Penggunaan memori awal JVM untuk kumpulan tersebut.
/cassandra/jvm_memory_bytes_max area Penggunaan memori maksimum heap JVM.
/cassandra/process_cpu_seconds_total Waktu CPU pengguna dan sistem yang dihabiskan dalam detik.
/cassandra/jvm_memory_bytes_used area Penggunaan memori heap JVM.
/cassandra/compaction_pendingtasks unit Pemadatan luar biasa untuk mobil stabil Cassandra. Lihat Pemadatan untuk mengetahui informasi selengkapnya.
/cassandra/jvm_memory_bytes_init area Penggunaan memori awal heap JVM.
/cassandra/jvm_memory_pool_bytes_used pool Penggunaan memori gabungan JVM.
/cassandra/jvm_memory_pool_bytes_committed pool Kumpulan penggunaan memori yang di-commit JVM.
/cassandra/clientrequest_latency scope

unit

Latensi permintaan baca dalam rentang persentil ke-75 dalam mikrodetik.
/cassandra/jvm_memory_bytes_committed area Penggunaan memori yang di-commit JVM.

Menggunakan metrik Cassandra

Apigee merekomendasikan metrik berikut sebagai penting untuk dipantau database Cassandra Anda:

  • Rasio permintaan Cassandra: Gunakan metrik ini untuk memantau permintaan baca dan tulis cassandra besar.
    Metrik: apigee.googleapis.com/cassandra/clientrequest_latency
    Label resource: project_id, location, cluster_name, namespace_name, pod_name, container_name
    Label metrik: scope, unit

    Gunakan label ini untuk memfilter resource tertentu atau untuk pengelompokan.

    Untuk memantau rasio permintaan baca cassandra, terapkan filter berikut.

    Filter: metric.scope == 'Read'
    metric.unit == 'OneMinuteRate'

    Untuk memantau rasio permintaan penulisan cassandra, terapkan filter berikut.

    Filter: metric.scope == 'Write'
    metric.unit == 'OneMinuteRate'
  • Latensi permintaan Cassandra: Gunakan metrik ini untuk memantau operasi baca dan tulis cassandra latensi permintaan. Ini adalah metrik yang sama dengan rasio permintaan, apigee.googleapis.com/cassandra/clientrequest_latency dengan filter berbeda diterapkan.

    Untuk memantau latensi permintaan baca cassandra, terapkan filter berikut.

    Filter:
    metric.scope == 'Read' metric.unit == '99thPercentile' atau '95thPercentile' atau '75thPercentile'

    Untuk memantau latensi permintaan tulis cassandra, terapkan filter berikut.

    Filter:
    metric.scope == 'Write' metric.unit == '99thPercentile' atau '95thPercentile' atau '75thPercentile'
  • Pemanfaatan permintaan CPU pod Cassandra
    Metrik: kubernetes.io/container/cpu/request_utilization (GKE)
    kubernetes.io/anthos/container/cpu/request_utilization (Anthos)
    Label resource: project_id, location, cluster_name, namespace_name, pod_name, container_name

    Gunakan label ini untuk memfilter resource tertentu atau untuk pengelompokan.

  • Pemanfaatan volume data Cassandra
    Metrik: kubernetes.io/pod/volume/utilization (GKE)
    kubernetes.io/anthos/pod/volume/utilization (Anthos)
    Label resource: project_id, location, cluster_name, namespace_name, pod_name
    Label metrik: volume_name

    Gunakan label ini untuk memfilter resource tertentu atau untuk pengelompokan.

Rekomendasi untuk penskalaan gugus Cassandra

Panduan berikut dapat berfungsi sebagai cluster yang direkomendasikan untuk keputusan penskalaan Gugus Cassandra. Secara umum, jika permintaan baca atau tulis secara konsisten menampilkan latensi persentil ke-99 atau latensinya cenderung meningkat secara terus-menerus, dan Anda akan melihat lonjakan permintaan CPU dengan lonjakan penggunaan dan tingkat permintaan baca atau tulis, cluster Cassandra dapat sedang merasa tertekan. Sebaiknya pertimbangkan untuk meningkatkan skala cluster. Untuk informasi selengkapnya, lihat Menskalakan Cassandra

MetrikAmbang batasDurasi pemicu
kubernetes.io/pod/volume/utilization85%5 mnt
kubernetes.io/container/cpu/request_utilization85%3 mnt
Read request Latency 99thPercentile5 dtk3 mnt
Write request Latency 99thPercentile5 dtk3 mnt