Amostragem de trace

Neste documento, apresentamos o conceito de amostragem, que se refere ao os dados de um período são enviados ao Cloud Trace. Quando os dados de um período é enviado ao Cloud Trace, esse período é amostrado. Quando os dados de cada intervalo em um rastro são registrados, o rastro é concluído. No entanto, rastreia frequentemente não têm períodos porque cada componente instrumentado em um rastreamento distribuído sistema decide independentemente se deve ou não registrar período em que ele está sendo processado.

Embora cada componente decida se o período processamento é uma amostra, essa decisão pode ser influenciada pela a decisão de amostragem. Por exemplo, suponha que cada componente tenha uma regra que diga "se a extensão pai for amostrada, então sample a extensão atual. Caso contrário, sample 50% das extensões". Nesse cenário, o seguinte é verdadeiro:

  • O período raiz determina se todos os períodos no trace são amostrados.
  • Quando o período raiz é amostrado, todos os períodos no trace são amostrados. Portanto, até que o trace seja concluído.

Os componentes podem transmitir a decisão de amostragem para o filho usando o contexto. Por exemplo, no World Wide Web Consortium (W3C) Cabeçalho traceparent, a sinalização sampled armazena a decisão de amostragem do elemento pai.

Não confunda a amostragem com a propagação de contexto. Amostragem se refere se um componente registra dados sobre um período. Propagação de contexto refere-se a se as informações sobre o período, como o ID do período, são passados para os componentes filhos.

Estratégias de amostragem

As decisões de amostragem podem ser baseadas na cabeça ou na cauda. Na amostragem com base na cabeça, a decisão de amostragem é feita quando a solicitação é recebida pelo componente que processa o período. Na amostragem baseada em cauda, a decisão de amostragem é adiada até que todo o trace esteja disponível.

Você pode encontrar a frase "amostragem de 100%" na documentação de sistemas de rastreamento distribuído. Essa frase pode ser aplicada a um trace componente. Quando aplicado a um trace, significa que todos os períodos foram amostrados, ou equivalente, que o trace está concluído. Quando aplicada a um componente, isso significa que o componente cria amostras de cada período que processa.

Amostragem com base na cabeça

Os samplers baseados em cabeça geralmente são configurados para sempre amostrar intervalos ou usar uma estratégia de amostragem probabilística:

  • Com configurações sempre de exemplo, todos os componentes que podem gravar dados de trace, coletar amostras dos períodos que eles de desenvolvimento de software. O ideal é que todos os traces estejam concluídos, e, portanto, você tem as informações necessárias para solucionar falhas. Esse tipo de configuração pode fazer com que você exceda cotas, ou os limites de custo de armazenamento.

  • Com a amostragem probabilística, nem todos os períodos são amostrados. O comportamento real dessa abordagem depende na implementação do componente. Em algumas implementações, todos os períodos têm a mesma probabilidade de amostragem. Em outros, a decisão de amostragem do elemento pai influencia se um período é amostrado.

Os traces podem não conter todos os períodos. Isso pode ser esperado devido ao uso de amostragem probabilística ou pode ser devido à cota ou a componentes que processam uma solicitação, mas não fazem a amostragem do período.

Amostragem baseada na cauda

O Cloud Trace não oferece suporte à amostragem baseada em cauda. As decisões de amostragem precisam ser feitas nos componentes que enviam dados para o Cloud Trace.

Se você quiser usar a amostragem baseada na cauda, use um intermediário servidor que recebe informações de rastreamento, que redireciona dados para o Cloud Trace depois de tomar uma decisão de amostragem. Por exemplo, é possível usar o Coletor do OpenTelemetry com o Processador de amostragem de cauda para tomar uma decisão de amostragem atrasada.

Se você planeja usar a amostragem de cauda, considere o seguinte:

  • É necessário armazenar todos os períodos em um trace antes de decidir sobre a amostragem. Portanto, talvez você precise de uma grande quantidade de armazenamento temporário ou gerar outras despesas gerais.
  • Em geral, todos os componentes que podem gerar períodos de trace precisam ser coordenados. Normalmente, os desenvolvedores que usam o OpenTelemetry encaminham todos os spans para o mesmo coletor com o mesmo ID de rastreamento.

Amostragem e serviços do Google Cloud

Cada serviço do Google Cloud toma as próprias decisões de amostragem, e nem todos os serviços do Google Cloud fazem amostragem. Ou seja, um serviço pode nunca enviar para o Cloud Trace.

Quando um serviço do Google Cloud oferece suporte à amostragem, esse serviço normalmente implementa o seguinte:

  • Uma taxa de amostragem padrão.
  • Um mecanismo para usar a decisão de amostragem do pai como uma dica para saber se a amostragem do intervalo é necessária.
  • Taxa de amostragem máxima.

Para solicitar que um serviço do Google Cloud adicione suporte à amostragem, use o Google Issue Tracker.

A seguir