Metrik dan periode penyelarasan

Flow Analyzer menganalisis data Log Aliran VPC yang disimpan dalam format data. Data log berisi kolom dasar, yang merupakan kolom inti dari setiap data log, dan kolom metadata, yang memberikan informasi selengkapnya. Data log untuk memantau alur traffic terdiri dari tiga komponen utama:

  • Informasi fasilitas
  • Jenis metrik
  • Deret waktu

Informasi fasilitas

Data log mencakup data berikut tentang resource:

Jenis metrik

Data log mencakup data untuk jenis metrik berikut:

  • Byte yang dikirim: berisi informasi tentang volume payload dan tidak menyertakan header. Nilai metrik ini dapat nol karena beberapa paket hanya memiliki header dan tidak menyertakan payload apa pun.
  • Paket yang dikirim: menunjukkan jumlah paket yang dikirim dari sumber ke tujuan.

Data deret waktu mentah

Jumlah data metrik mentah dalam satu deret waktu dapat sangat besar, dan biasanya ada banyak deret waktu yang terkait dengan jenis metrik. Untuk menganalisis seluruh kumpulan data guna menemukan kesamaan, tren, atau pencilan, beberapa pemrosesan harus dilakukan pada deret waktu dalam kumpulan. Jika tidak, ada terlalu banyak data yang perlu dipertimbangkan.

Untuk memperkenalkan sampling dan agregasi contoh di halaman ini, gunakan sejumlah kecil deret waktu hipotetis. Misalnya, diagram berikut menunjukkan data mentah selama beberapa menit untuk jenis metrik byte per detik:

Data deret waktu mentah.
Data deret waktu mentah (klik untuk memperbesar).

Data deret waktu mentah harus dimanipulasi sebelum dapat dianalisis, dan analisis sering kali melibatkan pengambilan sampel data dan menggabungkan beberapa data. Halaman ini menjelaskan dua teknik utama untuk menyaring data mentah:

  • Sampling, yang menghapus sebagian data dari pertimbangan. Google Cloud melakukan sampling dan menggunakan data yang diperlukan dari data log untuk melakukan operasi seperti yang ditunjukkan dalam kueri.
  • Agregasi, yang menggabungkan beberapa bagian data menjadi kumpulan yang lebih kecil berdasarkan dimensi yang Anda tentukan.

Sampling dan agregasi adalah alat yang efektif untuk membantu mengidentifikasi pola yang menarik dan menyoroti tren atau outlier dalam data, di antara hal lainnya.

Memahami periode perataan

Langkah pertama dalam menggabungkan data deret waktu adalah penyesuaian. Penyelarasan membuat deret waktu baru tempat data mentah diregulasi secara berkala sehingga dapat digabungkan dengan deret waktu yang diselaraskan lainnya. Perataan menghasilkan deret waktu dengan data yang berjarak teratur.

Penyelarasan melibatkan dua langkah:

  1. Membagi deret waktu menjadi interval waktu reguler, yang juga disebut bucketing data. Interval ini disebut periode penyelarasan.
  2. Menghitung satu nilai metrik untuk titik dalam periode penyelarasan. Anda memilih cara penghitungan satu titik tersebut; Anda dapat menjumlahkan semua nilai, atau menghitung rata-ratanya, atau menggunakan nilai maksimum.

Diagram berikut menunjukkan cara periode perataan digunakan untuk mengelompokkan data dalam waktu mulai dan waktu berakhir.

Periode perataan.
Periode perataan (klik untuk memperbesar).

Diagram berikut menunjukkan hasil penggunaan periode penyelarasan lima menit dengan langkah-langkah berikut:

  1. Membuat periode perataan dengan interval waktu lima menit.
  2. Menghitung satu nilai metrik menggunakan jumlah nilai metrik dari data mentah.
Periode penyelarasan lima menit.
Periode penyelarasan lima menit (klik untuk memperbesar).

Perincian

Jika Anda mengetahui bahwa sesuatu terjadi dalam rentang beberapa menit, dan ingin mempelajari lebih lanjut, sebaiknya gunakan periode satu menit untuk penyesuaian.

Jika Anda tertarik untuk mempelajari tren dalam jangka waktu yang lebih lama, periode penyesuaian yang lebih besar mungkin lebih sesuai. Periode perataan yang besar biasanya tidak berguna untuk melihat kondisi anomali jangka pendek, seperti lonjakan singkat dalam traffic. Jika Anda menggunakan, misalnya, periode perataan beberapa minggu, adanya anomali dalam periode tersebut masih dapat dideteksi, tetapi data yang diselaraskan mungkin terlalu umum untuk banyak membantu.

Untuk durasi waktu yang besar, periode penyelarasan yang lebih kecil tidak akan membantu. Misalnya, jika Anda memilih penyelarasan 1 menit untuk periode 30 hari, Flow Analyzer akan menghasilkan lebih dari 43.000 titik data. Karena 43.000 titik data 10 kali lebih banyak dari piksel layar 4K, Anda tidak dapat melihat semua detail dan beberapa opsi dinonaktifkan untuk durasi waktu yang lama.

Opsi perataan

Opsi perataan mencakup penjumlahan nilai, atau menemukan nilai maksimum, minimum, atau rata-rata, menemukan nilai persentil yang dipilih, menghitung nilai, dan lainnya. Dengan menggunakan Flow Analyzer, Anda dapat menggunakan berbagai agregasi metrik sebagai opsi penyelarasan.

Jika Anda memilih Byte yang dikirim sebagai jenis metrik dan Sumber dan tujuan sebagai agregasi traffic, opsi berikut akan tersedia.

  • Total traffic
  • Rasio traffic rata-rata
  • Rasio traffic median
  • Rasio traffic P95
  • Rasio traffic maksimum

Jika Anda memilih Paket yang dikirim sebagai jenis metrik dan Sumber dan tujuan sebagai agregasi traffic, opsi berikut akan tersedia.

  • Paket gabungan
  • Kecepatan paket rata-rata
  • Rasio paket median
  • Tarif paket P95
  • Kecepatan paket maksimum

Diagram berikut menunjukkan hasil penggunaan dua opsi penyelarasan total traffic dan rata-rata traffic rate.

Total dan rata-rata traffic.
Total dan rata-rata traffic (klik untuk memperbesar).

Menggunakan periode penyelarasan

Anda dapat menggunakan opsi Periode perataan untuk menggabungkan aliran traffic ke dalam interval waktu durasi yang dipilih. Anda dapat memperbesar grafik lebih lanjut dan melihat detail spesifik, jika diperlukan.

Langkah selanjutnya