Flow Analyzer analiza los datos de los registros de flujo de VPC almacenados en un formato de registro. Los registros contienen campos base, que son los campos principales de cada registro, y campos de metadatos, que proporcionan más información. Los registros de registro para supervisar los flujos de tráfico constan de tres componentes principales:
- Información del recurso
- Tipos de métricas
- Series temporales
Información del recurso
Los registros de registro incluyen los siguientes datos sobre los recursos:
- Detalles de la conexión
- Datos del denunciante
- Detalles de GKE
- Detalles de la instancia
- Detalles geográficos
- Detalles de la VPC
Tipos de métricas
Los registros de registro incluyen datos de los siguientes tipos de métricas:
- Bytes enviados: Contiene información sobre los volúmenes de carga útil y no incluye encabezados. El valor de esta métrica puede ser cero porque algunos paquetes solo tienen encabezados y no incluyen ninguna carga útil.
- Paquetes enviados: Indica la cantidad de paquetes que se enviaron desde el origen hacia el destino.
Datos de series temporales sin procesar
La cantidad de datos sin procesar de una métrica temporal puede ser enorme y, por lo general, hay muchas series temporales asociadas con un tipo de métrica. Para analizar todo el conjunto de datos en busca de comunes, tendencias o valores atípicos, se debe realizar un procesamiento sobre las series temporales del conjunto. De lo contrario, hay demasiados datos para considerar.
Para ingresar el muestreo y la agregación de los ejemplos de esta página, usa una pequeña cantidad de series temporales hipotéticas. Por ejemplo, en el siguiente diagrama, se muestran algunos minutos de datos sin procesar para el tipo de métrica de bytes por segundo:
Los datos de series temporales sin procesar deben manipularse antes de que se puedan analizar y el análisis a menudo implica tomar muestras de los datos y agruparlos. En esta página, se describen dos técnicas principales para definir mejor los datos sin procesar:
- Muestreo, que quita algunos datos Google Cloud realiza el muestreo y usa los datos necesarios de los registros para realizar operaciones como se indica en las consultas.
- Agregación, que combina múltiples fragmentos de datos en un conjunto más pequeño junto con las dimensiones que especifiques
El muestreo y la agregación son herramientas potentes para identificar patrones interesantes y destacar tendencias o valores atípicos en los datos, entre otras cosas.
Información sobre el período de alineación
El primer paso para agregar datos de series temporales es el alineamiento. La alineación crea una nueva serie temporal en la que se normalizan los datos sin procesar a fin de que se puedan combinar con otras series temporales alineadas. La alineación produce series temporales con datos espaciados con regularidad.
La alineación implica dos pasos:
- Dividir las series temporales en intervalos de tiempo regulares, también llamado agrupamiento de datos. El intervalo se denomina período de alineación.
- Calcular un solo valor de métrica para los puntos en el período de alineación. Tú eliges cómo se calcula ese punto único, puedes sumar todos los valores, calcular su promedio, o usar la máxima.
En el siguiente diagrama, se muestra cómo se usa el período de alineación para bucket los datos dentro de la hora de inicio y la hora de finalización.
En el siguiente diagrama, se muestra el resultado de usar un período de alineación de cinco minutos con los siguientes pasos:
- Crear un período de alineación de cinco minutos
- Calcular el valor único de la métrica con la suma de los valores de la métrica de los datos sin procesar
Nivel de detalle
Si sabes que algo sucedió en un lapso de un par de minutos y deseas obtener más información, probablemente quieras usar un período de un minuto para la alineación.
Si te interesa explorar las tendencias durante períodos más largos, un período de alineación mayor puede ser más apropiado. Por lo general, los períodos de alineación prolongados no son útiles para ver condiciones anómalas a corto plazo, como aumentos repentinos breves en el tráfico. Si usas, por ejemplo, un período de alineación de varias semanas, la existencia de una anomalía en ese período aún puede ser detectable, pero los datos alineados pueden ser demasiado generales para ser de gran ayuda.
Para duraciones grandes, no es útil un período de alineación más pequeño. Por ejemplo, si seleccionas una alineación de 1 minuto para un período de 30 días, Flow Analyzer genera más de 43,000 datos. Dado que 43,000 datos son 10 veces más que los píxeles de la pantalla 4K, no puedes ver todos los detalles y algunas opciones están inhabilitadas durante largos períodos.
Opciones de alineación
Las opciones de alineación incluyen la suma de los valores o la búsqueda del valor máximo, mínimo o promedio de los valores, la búsqueda de un valor de percentil de elección, el recuento de valores, etc. Con Flow Analyzer, puedes usar varias agregaciones de métricas como opciones de alineación.
Si seleccionas Bytes enviados como el tipo de métrica y Fuente y destino como la agregación de tráfico, estarán disponibles las siguientes opciones.
- Tráfico total
- Tasa de tráfico promedio
- Tasa mediana de tráfico
- Tasa de tráfico P95
- Tasa máxima de tráfico
Si seleccionas Paquetes enviados como el tipo de métrica y Fuente y destino como la agregación de tráfico, estarán disponibles las siguientes opciones.
- Agregar paquetes
- Tasa promedio de paquetes
- Tasa mediana de paquetes
- Tasa de paquetes P95
- Tasa máxima de paquetes
En el siguiente diagrama, se muestra el resultado de usar dos opciones de alineación de tráfico total y tasa de tráfico promedio.
Cómo usar el período de alineación
Puedes usar la opción Período de alineación para agregar los flujos de tráfico en intervalos de tiempo de la duración seleccionada. Si es necesario, puedes acercar el gráfico y ver los detalles específicos.
¿Qué sigue?
- Cómo analizar flujos de tráfico
- Habilita Análisis de registros
- Cómo configurar un bucket central
- Ejecuta pruebas de conectividad desde Flow Analyzer
- Supervisa tus flujos de tráfico
- Cómo solucionar problemas de datos en Flow Analyzer