O Analisador de fluxo analisa os dados dos registros de fluxo de VPC armazenados em um formato de registro. Os registros contêm campos básicos, que são os campos principais de cada registro, e campos de metadados, que fornecem mais informações. Os registros de log para monitorar fluxos de tráfego consistem em três componentes principais:
- Informações do recurso
- Tipos de métricas
- Série temporal
Informações do recurso
Os registros de log incluem os seguintes dados sobre os recursos:
- Detalhes da conexão
- Dados do informante
- Detalhes do GKE
- Detalhes da instância
- Detalhes geográficos
- Detalhes da VPC
Tipos de métricas
Os registros de registro incluem dados para os seguintes tipos de métrica:
- Bytes enviados: contém informações sobre os volumes de payload e não inclui cabeçalhos. Esse valor de métrica pode ser zero porque alguns pacotes têm apenas cabeçalhos e não incluem payloads.
- Pacotes enviados:indica o número de pacotes enviados da origem para o destino.
Dados brutos de séries temporais
A quantidade de dados brutos de métricas em uma única série temporal pode ser enorme, e geralmente há muitas séries temporais associadas a um tipo de métrica. Para analisar todo o conjunto de dados em busca de semelhanças, tendências ou valores atípicos, é necessário fazer algum processamento na série temporal do conjunto. Caso contrário, há muitos dados a serem considerados.
Para introduzir a amostragem e a agregação dos exemplos nesta página, use um pequeno número de série temporal hipotéticas. Por exemplo, o diagrama a seguir mostra alguns minutos de dados brutos para o tipo de métrica bytes por segundo:
Os dados brutos de séries temporais precisam ser manipulados antes de serem analisados, e a análise geralmente envolve a amostragem dos dados e a agregação de alguns deles. Esta página descreve duas técnicas principais para refinar dados brutos:
- Amostragem, que remove alguns dos dados da consideração. O Google Cloud faz a amostragem e usa os dados necessários dos registros de log para realizar operações conforme indicado nas consultas.
- Agregação, que combina vários dados em um conjunto menor ao longo das dimensões especificadas.
A amostragem e a agregação são ferramentas poderosas para ajudar a identificar padrões interessantes e destacar tendências ou valores atípicos nos dados, entre outras informações.
Noções básicas sobre o período de alinhamento
A primeira etapa na agregação de dados de série temporal é o alinhamento. O alinhamento cria uma nova série temporal em que os dados brutos são regularizados no tempo para que sejam combinados com outras séries temporais alinhadas. O alinhamento produz séries temporais com dados regularmente espaçados.
O alinhamento envolve duas etapas:
- Dividir a série temporal em intervalos de tempo regulares, também chamados de agrupamento por classes dos dados. Esse intervalo é chamado de período de alinhamento.
- Calcular um único valor de métrica para os pontos no período de alinhamento. Você escolhe como esse ponto único é calculado. É possível somar todos os valores, calcular a média deles ou usar o valor máximo.
O diagrama a seguir mostra como o período de alinhamento é usado para agrupar os dados entre o horário de início e o horário de término.
O diagrama a seguir mostra o resultado do uso de um período de alinhamento de cinco minutos com as seguintes etapas:
- Criação de um período de alinhamento de cinco minutos.
- Calcular o valor de uma única métrica usando a soma dos valores da métrica dos dados brutos.
Granularidade
Se você sabe que algo aconteceu dentro de um período de alguns minutos e quer se aprofundar, é recomendável usar um período de um minuto para o alinhamento.
Se você estiver interessado em analisar tendências em períodos mais longos, um período de alinhamento maior poderá ser mais apropriado. Períodos de alinhamento grandes normalmente não são úteis para analisar condições anômalas de curto prazo, como picos curtos no tráfego. Se você usar, por exemplo, um período de alinhamento de várias semanas, a existência de uma anomalia nesse período ainda poderá ser detectada, mas os dados alinhados podem ser muito gerais para ajudar bastante.
Para períodos de tempo grandes, um período de alinhamento menor não é útil. Por exemplo, se você selecionar um alinhamento de 1 minuto para um período de 30 dias, o Analisador de fluxo vai gerar mais de 43.000 pontos de dados. Como 43.000 pontos de dados são 10 vezes maiores que os pixels de exibição de 4K,não é possível conferir todos os detalhes, e algumas opções são desativadas para períodos de tempo grandes.
Opções de alinhamento
As opções de alinhamento incluem somar os valores ou encontrar o máximo, o mínimo ou a média dos valores, encontrar um valor percentual escolhido, contar os valores e outros. Com o Flow Analyzer, você pode usar várias agregações de métricas como opções de alinhamento.
Se você selecionar Bytes enviados como o tipo de métrica e Origem e destino como a agregação de tráfego, as opções a seguir estarão disponíveis.
- Tráfego total
- Taxa de tráfego média
- Taxa de tráfego mediana
- Taxa de tráfego P95
- Taxa de tráfego máxima
Se você selecionar Pacotes enviados como o tipo de métrica e Origem e destino como a agregação de tráfego, as opções a seguir estarão disponíveis.
- Pacotes agregados
- Taxa média de pacotes
- Taxa de pacotes mediana
- Taxa de pacotes P95
- Taxa máxima de pacotes
O diagrama a seguir mostra o resultado do uso de duas opções de alinhamento de tráfego total e taxa média de tráfego.
Como usar o período de alinhamento
Você pode usar a opção Período de alinhamento para agregar os fluxos de tráfego em intervalos de tempo da duração selecionada. Você pode aumentar o zoom no gráfico e ver os detalhes específicos, se necessário.
A seguir
- Analisar fluxos de tráfego
- Ativar a Análise de dados de registros
- Configurar um bucket central
- Executar testes de conectividade no Flow Analyzer
- Monitorar seus fluxos de tráfego
- Resolver problemas de dados no Flow Analyzer