개념

이 문서에서는 Timeseries Insights API에서 사용하는 일반적인 개념을 살펴보고 이러한 항목이 무엇을 나타내는지 알기 쉽게 설명하도록 하겠습니다.

이벤트

이벤트는 시계열과 함께 Timeseries Insights API가 작동하는 원시 입력입니다. 개념적으로는 일부 에이전트 (예: 클라이언트 또는 뉴스 기사의 게시)에서 이루어지는 작업 또는 관찰 (예: 온도 센서 읽기, CPU 사용량의 CPU 사용량)을 통해 machine)의 전체 버전을 가져옵니다.

이벤트에는 다음이 포함됩니다.

  • 다양한 측정기준의 값 집합으로, 라벨 또는 숫자 측정값과 같은 이벤트를 설명하는 속성을 나타냅니다.
  • 이벤트가 발생한 시간을 나타내는 타임스탬프입니다. 이 타임스탬프는 이벤트를 시계열에 배치할 때 사용됩니다.
  • 그룹 ID입니다.

측정기준

측정기준은 데이터 세트에 있는 이벤트의 속성 유형과 취할 수 있는 값의 도메인입니다. 측정기준은 다음과 같습니다.

  • 범주형 이 측정기준의 이벤트 속성은 제한되거나 유한한 값 중 하나(일반적으로 문자열)를 보유할 수 있습니다. 예를 들어 뉴스 기사가 있는 데이터세트의 국가 또는 게시자 이름, 프로덕션 모니터링 데이터가 포함된 데이터 세트의 머신 이름 등이 있습니다.
  • 숫자로 되어 있습니다. 이벤트의 측정 또는 일반적인 숫자 속성입니다. 예: 뉴스 기사의 페이지 조회수, CPU 사용량 또는 프로덕션 모니터링 데이터의 오류 수입니다.

데이터 세트

데이터세트는 이벤트 모음입니다.

그룹

동일한 그룹 ID를 지정하여 이벤트를 그룹화할 수 있습니다 (Event.group_id 참조).

그룹의 목적은 동일 그룹의 이벤트 간 상관관계를 계산하는 것이지만 현재 API 버전에서는 이 기능이 노출되지 않습니다. 예를 들어 데이터세트에 모니터링 데이터 (예: CPU%, RAM 등)가 있는 경우 그룹은 한 프로세스에서 모든 모니터링 데이터를 보유할 수 있습니다. 이 경우 최종적으로 CPU 시간의 증가는 이전 시점의 바이너리 버전 업데이트와 같은 다른 이벤트와 상관관계가 있음을 감지할 수 있습니다.

확실하지 않거나 이러한 유형의 상관관계를 계산하는 데 관심이 없다면 각 이벤트에 전역적으로 고유한 그룹 ID가 있어야 합니다.

슬라이스

슬라이스는 일부 카테고리 측정기준에서 값이 동일한 데이터세트의 모든 이벤트 하위 집합입니다.

예를 들어 국제적인 소매업체에서 판매하는 데이터 세트가 있고 각 이벤트는 판매가 발생한 국가, 제품 이름, { 101}이 제품을 제공한 회사의 이름 이 예에서 슬라이스의 예: 특정 제품의 모든 판매, 특정 회사에서 판매하는 모든 제품의 판매 국가

시계열

시계열은 크기가 조절된 이벤트 시퀀스로, 동일한 크기의 시간 버킷에 배치됩니다. 다음 값을 입력으로 계산합니다.

  • 따라서 슬라이스에 있는 모든 이벤트가 발생합니다.
  • 시계열이 시작되는 시간 간격과 종료 시간입니다. 특정 QueryDataSetRequest의 한도는 [tested_interval.start_time - forecast_params.forecast_history, tested_interval.start_time + tested_interval.length]입니다. 시계열을 구성할 때 이 한도 내에서 Event.event_time가 있는 슬라이스의 이벤트만 선택합니다.
  • 시계열의 각 시간 버킷의 길이입니다. 주어진 QueryDataSetRequest의 경우 이 길이는 tested_interval.length와 같습니다.
  • 이벤트의 집계 방법입니다. 현재 Google에서 지원하는 두 가지 집계 방법이 있습니다. 이벤트를 계산하거나 모든 이벤트에 있는 숫자 측정기준을 합산하는 작업 (forecast_params.aggregated_dimension으로 지정)이 있습니다.

예측

지정된 시계열의 미래 값을 예측하는 프로세스입니다.

홀드아웃

홀드아웃은 예측 모델의 성능을 평가하는 데 사용되는 시계열 (일반적으로 마지막 5~10%)의 마지막 부분입니다. 홀드아웃 기간 동안 예측 오류가 더 많을 경우 예측 경계를 확장하여 예측 신뢰도를 줄입니다.

호라이즌

ForecastParams.horizon_time 필드를 통해 테스트 간격부터 시간 범위까지 시계열의 값을 예측합니다.

테스트 간격

테스트 간격(QueryDataSetRequest.tested_interval)은 이전 시간 간격과 비교할 때 예기치 않은 값이 있는 데이터 세트의 모든 슬라이스를 감지하려는 시간 간격입니다. 계열

이상

예측 후 테스트 간격 내에 구성 가능한 예상 범위를 벗어나는 예측된 값이 있는 경우 슬라이스가 이상점으로 표시되었습니다. 임계값.

다음 단계