Topik ini menjelaskan cara melihat metrik hybrid Apigee di dasbor Cloud Operations.
Tentang Cloud Operations
Untuk informasi selengkapnya tentang metrik, dasbor, dan Cloud Operations, lihat:
Mengaktifkan metrik campuran
Sebelum metrik campuran dapat dikirim ke Cloud Operations, Anda harus mengaktifkan pengumpulan metrik terlebih dahulu. Lihat Mengonfigurasi pengumpulan metrik untuk prosedur ini.
Tentang nama dan label metrik campuran
Jika diaktifkan, sistem hybrid akan otomatis mengisi metrik Cloud Operations. Awalan nama domain pada metrik yang dibuat dengan sistem hybrid adalah:
apigee.googleapis.com/
Misalnya, metrik /proxy/request_count
berisi jumlah total permintaan yang diterima oleh proxy API. Oleh karena itu, nama metrik di Cloud Operations adalah:
apigee.googleapis.com/proxy/request_count
Cloud Operations dapat Anda gunakan untuk memfilter dan mengelompokkan data metrik berdasarkan label. Beberapa label sudah ditentukan sebelumnya, dan yang lainnya ditambahkan secara eksplisit dengan campuran. Bagian Metrik yang tersedia di bawah ini mencantumkan semua metrik campuran yang tersedia dan label apa pun yang ditambahkan secara khusus untuk metrik yang dapat Anda gunakan untuk pemfilteran dan pengelompokan.
Melihat metrik
Contoh berikut menunjukkan cara melihat metrik dalam Cloud Operations:- Buka Monitoring Metrics Explorer di browser. Atau, jika Anda sudah berada di konsol Cloud Operations, pilih Metrics Explorer.
Di bagian Find resource type and metric, cari dan pilih metrik yang ingin Anda periksa. Pilih metrik tertentu yang tercantum di Metrik yang tersedia, atau telusuri metrik.
- Pilih metrik yang diinginkan.
- Terapkan filter. Pilihan filter untuk setiap metrik tercantum di Metrik yang tersedia.
- Cloud Operations menampilkan diagram untuk metrik yang dipilih.
- Klik Save.
Membuat {i>dashboard<i}
Dasbor adalah salah satu cara untuk melihat dan menganalisis data metrik yang penting bagi Anda. Cloud Operations menyediakan dasbor standar untuk resource dan layanan yang Anda gunakan. Anda juga dapat membuat dasbor kustom.
Anda menggunakan diagram untuk menampilkan metrik Apigee di dasbor kustom. Dengan dasbor kustom, Anda memiliki kontrol penuh atas diagram yang ditampilkan dan konfigurasinya. Untuk informasi selengkapnya tentang cara membuat diagram, lihat Membuat diagram.
Contoh berikut menunjukkan cara membuat dasbor di Cloud Operations, lalu menambahkan diagram untuk melihat data metrik:
- Buka Monitoring Metrics Explorer di browser, lalu pilih Dashboards.
- Pilih + Buat Dasbor.
- Beri nama dasbor. Misalnya: Traffic Permintaan Proxy Hybrid
- Klik Confirm.
Untuk setiap diagram yang ingin Anda tambahkan ke dasbor, ikuti langkah-langkah berikut:
- Di dasbor, pilih Tambahkan diagram.
- Pilih metrik yang diinginkan seperti yang dijelaskan di atas di bagian Melihat metrik.
- Lengkapi dialog untuk menentukan diagram Anda.
- Klik Save. Cloud Operations menampilkan data untuk metrik yang dipilih.
Metrik yang tersedia
Tabel berikut mencantumkan metrik untuk menganalisis traffic proxy.
Metrik traffic proxy, target, dan server
Buka Telemetry akan mengumpulkan dan memproses metrik (seperti yang dijelaskan dalam Pengumpulan metrik) untuk traffic proxy, target, dan server.
Tabel berikut menjelaskan metrik dan label yang digunakan kolektor Open Telemetry. Label ini digunakan dalam entri log metrik.
Nama metrik | Label | Gunakan |
---|---|---|
/proxy/request_count |
method |
Jumlah permintaan ke proxy Apigee sejak sampel terakhir direkam. |
/proxy/response_count |
method
|
Jumlah respons yang dikirim oleh proxy API Apigee. |
/proxy/latencies |
method |
Distribusi latensi, yang dihitung sejak permintaan diterima oleh proxy Apigee hingga saat respons dikirim dari proxy Apigee ke klien. |
/proxyv2/request_count |
method |
Jumlah total permintaan proxy API yang diterima. |
/proxyv2/response_count |
method
|
Jumlah total respons proxy API yang diterima. |
/proxyv2/latencies_percentile |
method |
Persentil semua respons kebijakan API terhadap permintaan. |
/target/request_count |
method
|
Jumlah permintaan yang dikirim ke target Apigee sejak sampel terakhir dicatat. |
/target/response_count |
method
|
Jumlah respons yang diterima dari target Apigee sejak sampel terakhir dicatat. |
/target/latencies |
method
|
Distribusi latensi, yang dihitung sejak permintaan dikirim ke target Apigee hingga respons diterima oleh proxy Apigee. Waktu tidak termasuk overhead proxy API Apigee. |
/targetv2/request_count |
method
|
Jumlah total permintaan yang dikirim ke target proxy. |
/targetv2/response_count |
method
|
Jumlah total respons yang diterima dari target proxy. |
/server/fault_count |
source |
Jumlah total kesalahan untuk aplikasi server. Misalnya, aplikasinya dapat berupa |
/server/nio |
state |
Jumlah soket yang terbuka. |
/server/num_threads |
Jumlah thread non-daemon yang aktif di server. | |
/server/request_count |
method
|
Jumlah total permintaan yang diterima oleh aplikasi server. Misalnya, aplikasinya dapat berupa |
/server/response_count |
method
|
Jumlah total respons yang dikirim oleh aplikasi server. Misalnya, aplikasinya dapat berupa |
/server/latencies |
method
|
Latensi adalah latensi dalam milidetik yang diperkenalkan oleh aplikasi server. Misalnya, aplikasinya dapat berupa |
/upstream/request_count |
method
|
Jumlah permintaan yang dikirim oleh aplikasi server ke aplikasi upstreamnya. Misalnya, untuk |
/upstream/response_count |
method
|
Jumlah respons yang diterima oleh aplikasi server dari aplikasi upstreamnya. Misalnya, untuk |
/upstream/latencies |
method
|
Latensi yang terjadi di aplikasi server upstream dalam milidetik. Misalnya, untuk |
Metrik UDCA
Open Telemetry mengumpulkan dan memproses metrik (seperti yang dijelaskan dalam Pengumpulan metrik) untuk layanan UDCA seperti yang dilakukan pada layanan hybrid lainnya.
Tabel berikut menjelaskan metrik dan label yang digunakan kolektor Open Telemetry dalam data metrik UDCA. Label ini digunakan dalam entri log metrik.
Nama metrik | Label | Gunakan |
---|---|---|
/udca/server/local_file_oldest_ts |
dataset
|
Stempel waktu, dalam milidetik sejak awal Unix Epoch, untuk file terlama dalam set data. Jumlah ini dihitung setiap 60 detik dan tidak mencerminkan status secara real time. Jika UDCA sudah versi terbaru dan tidak ada file yang menunggu untuk diupload saat metrik ini dihitung, nilai ini akan menjadi 0. Jika nilai ini terus meningkat, file lama masih berada di disk. |
/udca/server/local_file_latest_ts |
dataset
|
Stempel waktu, dalam milidetik sejak awal Unix Epoch, untuk file terbaru pada disk berdasarkan status. Jumlah ini dihitung setiap 60 detik dan tidak mencerminkan status secara real time. Jika UDCA sudah versi terbaru dan tidak ada file yang menunggu untuk diupload saat metrik ini dihitung, nilai ini akan menjadi 0. |
/udca/server/local_file_count |
dataset
|
Hitungan jumlah file pada disk di pod pengumpulan data. Idealnya, nilainya akan mendekati 0. Nilai tinggi yang konsisten menunjukkan bahwa file tidak diupload atau UDCA tidak dapat menguploadnya dengan cukup cepat. Nilai ini dihitung setiap 60 detik dan tidak mencerminkan status UDCA secara real time. |
/udca/server/total_latencies |
dataset |
Interval waktu, dalam detik, antara file data yang dibuat dan file data yang berhasil diupload. Bucket akan menjadi 100 md, 250 md, 500 md, 1 dtk, 2 dtk, 4 dtk, 8 dtk, 16 dtk, 32 dtk, dan 64 dtk. Histogram untuk total latensi dari waktu pembuatan file hingga waktu upload yang berhasil. |
/udca/server/upload_latencies |
dataset |
Total waktu, dalam detik, yang dihabiskan oleh UDCA untuk mengupload file data. Bucket akan menjadi 100 md, 250 md, 500 md, 1 dtk, 2 dtk, 4 dtk, 8 dtk, 16 dtk, 32 dtk, dan 64 dtk. Metrik akan menampilkan histogram untuk total latensi upload, termasuk semua panggilan upstream. |
/udca/upstream/http_error_count |
service
|
Total jumlah error HTTP yang ditemui UDCA. Metrik ini berguna untuk membantu menentukan bagian mana dari dependensi eksternal UDCA yang gagal dan alasannya. Error ini dapat muncul untuk berbagai layanan (
|
/udca/upstream/http_latencies |
service
|
Latensi upstream layanan, dalam detik. Bucket akan menjadi 100 md, 250 md, 500 md, 1 dtk, 2 dtk, 4 dtk, 8 dtk, 16 dtk, 32 dtk, dan 64 dtk. Histogram untuk latensi dari layanan upstream. |
/udca/upstream/uploaded_file_sizes |
dataset |
Ukuran file yang diupload ke layanan Apigee, dalam byte. Bucket akan berukuran 1KB, 10KB, 100KB, 1MB, 10MB, 100MB, dan 1GB. Histogram untuk ukuran file menurut set data, organisasi, dan lingkungan. |
/udca/upstream/uploaded_file_count |
dataset |
Jumlah file yang diupload UDCA ke layanan Apigee.
Perlu diingat bahwa:
|
/udca/disk/used_bytes |
dataset
|
Ruang yang ditempati oleh file data di disk pod pengumpulan data, dalam byte. Peningkatan nilai ini dari waktu ke waktu:
|
/udca/server/pruned_file_count |
dataset
|
Jumlah file yang telah dihapus karena Time To Life (TTL) melebihi batas yang ditetapkan.
Set data dapat mencakup API, rekaman aktivitas, dan lainnya, dan statusnya dapat berupa UPLOADED ,
FAILED , atau DISCARDED .
|
/udca/server/retry_cache_size |
dataset |
Hitungan jumlah file, menurut set data, yang coba diupload oleh UDCA. Setelah 3 kali percobaan ulang untuk setiap file, UDCA akan memindahkan file ke subdirektori |
Metrik Cassandra
Open Telemetry mengumpulkan dan memproses metrik (seperti yang dijelaskan dalam Pengumpulan metrik) untuk Cassandra seperti yang dilakukannya pada layanan hybrid lainnya.
Tabel berikut menjelaskan metrik dan label yang digunakan kolektor Open Telemetry dalam data metrik Cassandra. Label ini digunakan dalam entri log metrik.
Nama metrik (tidak termasuk domain) | Label | Gunakan |
---|---|---|
/cassandra/process_max_fds |
Jumlah maksimum deskriptor file yang terbuka. | |
/cassandra/process_open_fds |
Buka deskriptor file. | |
/cassandra/jvm_memory_pool_bytes_max |
pool |
Penggunaan memori maksimum JVM untuk kumpulan. |
/cassandra/jvm_memory_pool_bytes_init |
pol |
Penggunaan memori awal JVM untuk kumpulan. |
/cassandra/jvm_memory_bytes_max |
area |
Penggunaan memori maksimum heap JVM. |
/cassandra/process_cpu_seconds_total |
Waktu CPU pengguna dan sistem yang dihabiskan dalam detik. | |
/cassandra/jvm_memory_bytes_used |
area |
Penggunaan memori heap JVM. |
/cassandra/compaction_pendingtasks |
unit |
Pemadatan luar biasa untuk stable Cassandra. Lihat Pemadatan untuk selengkapnya. |
/cassandra/jvm_memory_bytes_init |
area |
Penggunaan memori awal heap JVM. |
/cassandra/jvm_memory_pool_bytes_used |
pool |
Penggunaan memori kumpulan JVM. |
/cassandra/jvm_memory_pool_bytes_committed |
pool |
Penggunaan memori gabungan JVM. |
/cassandra/clientrequest_latency |
scope
|
Latensi permintaan baca dalam rentang persentil ke-75 dalam mikrodetik. |
/cassandra/jvm_memory_bytes_committed |
area |
Penggunaan memori heap JVM. |
Menggunakan metrik Cassandra
Apigee merekomendasikan metrik berikut sebagai hal yang penting untuk dipantau untuk database Cassandra Anda:
- Rasio permintaan Cassandra: Gunakan metrik ini untuk memantau rasio permintaan baca dan tulis cassandra.
Metrik: apigee.googleapis.com/cassandra/clientrequest_latency
Label resource: project_id
,location
,cluster_name
,namespace_name
,pod_name
,container_name
Label metrik: scope
,unit
Gunakan label ini untuk memfilter resource tertentu atau untuk pengelompokan.
Untuk memantau rasio permintaan baca cassandra, terapkan filter berikut.
Filter: metric.scope == 'Read'
metric.unit == 'OneMinuteRate'
Untuk memantau rasio permintaan tulis cassandra, terapkan filter berikut.
Filter: metric.scope == 'Write'
metric.unit == 'OneMinuteRate'
- Latensi permintaan Cassandra: Gunakan metrik ini untuk memantau latensi permintaan baca dan tulis cassandra. Ini adalah metrik yang sama dengan rasio permintaan,
apigee.googleapis.com/cassandra/clientrequest_latency
dengan berbagai filter yang diterapkan.Untuk memantau latensi permintaan baca cassandra, terapkan filter berikut.
Filter: metric.scope == 'Read'
metric.unit == '99thPercentile'
atau'95thPercentile'
atau'75thPercentile'
Untuk memantau latensi permintaan tulis cassandra, terapkan filter berikut.
Filter: metric.scope == 'Write'
metric.unit == '99thPercentile'
atau'95thPercentile'
atau'75thPercentile'
- Penggunaan permintaan CPU pod Cassandra
Metrik: kubernetes.io/container/cpu/request_utilization (GKE)
kubernetes.io/anthos/container/cpu/request_utilization (Anthos)
Label resource: project_id
,location
,cluster_name
,namespace_name
,pod_name
,container_name
Gunakan label ini untuk memfilter resource tertentu atau untuk pengelompokan.
- Penggunaan volume data Cassandra
Metrik: kubernetes.io/pod/volume/utilization (GKE)
kubernetes.io/anthos/pod/volume/utilization (Anthos)
Label resource: project_id
,location
,cluster_name
,namespace_name
,pod_name
Label metrik: volume_name
Gunakan label ini untuk memfilter resource tertentu atau untuk pengelompokan.
Rekomendasi untuk menskalakan cluster Cassandra
Panduan berikut dapat berfungsi sebagai cluster yang direkomendasikan untuk membuat keputusan menskalakan cluster Cassandra. Secara umum, jika permintaan baca atau tulis secara konsisten menunjukkan latensi persentil ke-99 atau latensi cenderung naik secara terus-menerus, dan Anda melihat lonjakan yang sesuai dalam lonjakan penggunaan permintaan CPU serta kecepatan permintaan baca atau tulis, cluster Cassandra Anda dapat dianggap berada di bawah tekanan. Sebaiknya pertimbangkan untuk meningkatkan skala cluster. Untuk mengetahui informasi selengkapnya, lihat Penskalaan Cassandra
Metrik | Ambang batas | Durasi pemicu |
---|---|---|
kubernetes.io/pod/volume/utilization | 85% | 5 mnt |
kubernetes.io/container/cpu/request_utilization | 85% | 3 mnt |
Read request Latency 99thPercentile | 5 dtk | 3 mnt |
Write request Latency 99thPercentile | 5 dtk | 3 mnt |