Trace 샘플링

이 문서에서는, 스팬의 데이터가 Cloud Trace로 전송되었는지 여부를 나타내는 샘플링 개념에 대해 소개합니다. 스팬의 데이터가 Cloud Trace로 전송되면 해당 스팬이 샘플링되었다고 합니다. 한 trace에서 모든 스팬의 데이터가 기록되면 trace가 완료됩니다. 하지만 분산 trace 시스템의 각 계측 구성요소가 처리 중인 스팬을 기록할지 여부를 독립적으로 결정하므로 trace에는 스팬이 누락되는 경우가 종종 있습니다.

각 구성요소는 처리 중인 스팬의 샘플링 여부를 자체적으로 결정하지만 상위 요소의 샘플링 결정에 영향을 받을 수 있습니다. 예를 들어 모든 구성요소에 '상위 스팬이 샘플링되면 현재 스팬을 샘플링하고 그렇지 않으면 스팬의 50%를 샘플링한다'라는 규칙이 있다고 가정합니다. 이 시나리오에서는 다음 사항이 적용됩니다.

  • 루트 스팬은 trace의 모든 스팬이 샘플링되는지 여부를 결정합니다.
  • 루트 스팬이 샘플링되면 trace에 있는 모든 스팬이 샘플링됩니다. 따라서 trace가 완료됩니다.

구성요소는 컨텍스트를 사용하여 샘플링 결정을 하위 사용자에게 전달할 수 있습니다. 예를 들어 월드 와이드 웹 컨소시엄(W3C) traceparent 헤더에서 sampled 플래그는 상위 요소의 샘플링 결정을 저장합니다.

샘플링을 컨텍스트 전파와 혼동하지 않도록 주의하세요. 샘플링은 구성요소가 스팬에 대한 데이터를 기록하는지 여부를 말합니다. 컨텍스트 전파는 스팬 ID와 같은 스팬 관련 정보가 하위 구성요소에 전달되었는지 여부를 나타냅니다.

샘플링 전략

샘플링 결정은 헤드 기반 또는 테일 기반일 수 있습니다. 헤드 기반 샘플링에서는 스팬을 처리하는 구성요소에서 요청을 수신하면 샘플링이 결정됩니다. 테일 기반 샘플링에서는 전체 trace를 사용할 수 있을 때까지 샘플링 결정이 지연됩니다.

분산 추적 시스템 문서에 '100% 샘플링'이라는 문구가 표시될 수 있습니다. 이 문구는 trace 또는 구성요소에 적용될 수 있습니다. trace에 적용하면 모든 스팬이 샘플링되었거나 상응하는 trace가 완료되었다는 의미입니다. 구성요소에 적용하면 구성요소가 처리하는 모든 스팬이 샘플링됩니다.

헤드 기반 샘플링

헤드 기반 샘플러는 일반적으로 항상 스팬을 샘플링하거나 확률적 샘플링 전략을 사용하도록 구성됩니다.

  • 항상 샘플 구성을 사용하면 서비스가 스팬되고 trace 데이터를 작성할 수 있는 모든 구성요소가 처리하는 스팬을 샘플링합니다. 이상적으로는 모든 trace가 완료되면 오류 문제 해결에 필요한 정보를 얻을 수 있습니다. 이러한 유형의 구성은 quotas 또는 스토리지 비용 한도 초과의 원인이 될 수 있습니다.

  • 확률적 샘플링을 사용하면 모든 스팬이 샘플링되지 않습니다. 이 접근 방식의 실제 동작은 구성요소 구현에 따라 다릅니다. 일부 구현에서는 모든 스팬이 샘플링될 가능성이 동일합니다. 나머지에서는 상위 요소의 샘플링 결정이 스팬의 샘플링 여부에 영향을 줍니다.

trace에 모든 스팬이 포함되지 않을 수 있습니다. 이는 확률적 샘플링을 사용하기 때문이거나 할당량 또는 요청을 처리하지만 스팬을 샘플링하지 않는 구성요소 때문일 수 있습니다.

꼬리 기반 샘플링

Cloud Trace는 꼬리 기반 샘플링을 지원하지 않습니다. 샘플링 결정은 Cloud Trace로 데이터를 전송하는 구성요소에서 이루어져야 합니다.

꼬리 기반 샘플링을 사용하려면 샘플링 결정을 한 후 Cloud Trace로 데이터를 중계하는 추적 정보를 수신하는 중개 서버를 사용하면 됩니다. 예를 들어 꼬리 샘플링 프로세서와 함께 OpenTelemetry Collector를 사용해 지연된 샘플링 결정을 내릴 수 있습니다.

꼬리 샘플링을 사용하려는 경우 다음 사항을 고려하세요.

  • 샘플링을 결정하기 전에 모든 스팬을 trace에 저장해야 합니다. 따라서 대량의 임시 스토리지가 필요하거나 다른 오버헤드가 발생할 수 있습니다.
  • 일반적으로 trace용 스팬을 생성할 수 있는 모든 구성요소는 조정되어야 합니다. 일반적으로 OpenTelemetry를 사용하는 개발자는 동일한 trace ID의 모든 스팬을 동일한 수집기로 라우팅합니다.

샘플링 및 Google Cloud 서비스

각 Google Cloud 서비스는 모든 Google Cloud 서비스 샘플이 아닌 자체 샘플링 결정을 내립니다. 즉, 서비스가 Cloud Trace로 데이터를 전송하지 않을 수 있습니다.

Google Cloud 서비스에서 샘플링을 지원하는 경우 해당 서비스는 일반적으로 다음을 구현합니다.

  • 기본 샘플링 레이트.
  • 상위 샘플링 결정을 스팬 샘플링 여부에 대한 힌트로 사용하는 메커니즘입니다.
  • 최대 샘플링 레이트.

Google Cloud 서비스에 샘플링 지원을 추가하도록 요청하려면 Google Issue Tracker를 사용하세요.

다음 단계