시각화의 예측

예측을 사용하면 분석가가 새로운 Explore 쿼리나 기존 Explore 쿼리에 데이터 예측을 추가하여 특정 데이터 포인트를 예측하고 모니터링할 수 있습니다. 예측 탐색 결과 및 시각화를 대시보드에 추가하고 Look으로 저장할 수 있습니다. 삽입 Looker 콘텐츠에서도 예측 결과 및 시각화를 만들고 볼 수 있습니다.

예측을 만들 수 있는 권한이 있는 경우 데이터를 예측할 수 있습니다.

예측 결과 만들기 및 표시 방법

예측 기능은 탐색의 데이터 테이블에 있는 데이터 결과를 사용하여 미래의 데이터 포인트를 계산합니다. 예측 계산에는 탐색 쿼리에 표시된 결과만 포함됩니다. 행 제한으로 인해 표시되지 않은 결과는 포함되지 않습니다. 예측을 계산하는 데 사용되는 알고리즘에 대한 자세한 내용은 이 페이지의 ARIMA 알고리즘 섹션을 참조하세요.

예측 결과는 기존 Explore 시각화의 연속으로 표시되며 구성된 시각화 설정이 적용됩니다. 예측된 데이터 포인트와 예측되지 않은 데이터 포인트는 다음과 같은 방식으로 구분됩니다.

  1. 지원되는 카티전 차트에서 예측된 데이터 포인트는 밝은 음영이나 점선으로 렌더링하여 예측되지 않은 데이터 포인트와 구분됩니다.
  2. 지원되는 텍스트 및 표 차트 유형에서 예측된 데이터 포인트에는 기울임꼴로 표시되고 별표가 추가됩니다.

예측된 데이터는 예측된 데이터 포인트 위에 커서를 놓으면 나타나는 팁에서도 명시적으로 식별됩니다.

다음 섹션에서 설명하는 것처럼 특정 유형의 시각화만 예측 데이터를 지원합니다.

ARIMA 알고리즘

예측은 ARIMA(AutoRegressive Integrated Moving Average) 알고리즘을 활용하여 예측에 입력되는 데이터와 가장 일치하는 방정식을 만듭니다. 데이터에 가장 일치하는 데이터를 찾기 위해 Looker는 일련의 초기 변수로 ARIMA를 실행하고, 초기 변수의 변형 목록을 만들며, 이러한 변형으로 ARIMA를 다시 실행합니다. 변형 중 입력 데이터에 더 적합한 방정식을 만드는 변형이 있는 경우 Looker에서 해당 변형을 새 초기 변수로 사용하고 평가되는 추가 변형을 만듭니다. 최상의 변수가 식별되거나 모든 옵션 또는 할당된 컴퓨팅 시간이 소진될 때까지 Looker는 이 프로세스를 계속 반복합니다.

이 프로세스는 수백 세대에 걸친 개인이 상위 변수별로 1~10개의 자손을 만들고(부모를 기반으로 한 변수의 변형) 최고의 생존 능력을 발휘하는 자손을 살리는 유전 알고리즘으로 간주할 수 있습니다. Looker가 유전 알고리즘 접근 방식에서 ARIMA를 여러 번 호출하는 방식을 AutoARIMA라고 합니다.

AutoARIMA에 대한 자세한 내용은 pmdarima 사용자 가이드auto_arima 사용 팁 섹션을 참조하세요. Looker가 AutoARIMA를 실행하는 데 사용하는 라이브러리는 아니지만 pmdarima는 프로세스 및 사용되는 여러 변수에 대한 최상의 설명을 제공합니다.

지원되는 시각화 유형

다음과 같은 카티전 시각화 유형이 예측 데이터 렌더링을 지원합니다.

다음과 같은 텍스트 및 테이블 차트 유형이 예측 데이터 렌더링을 지원합니다.

커스텀 시각화를 비롯한 다른 시각화 유형은 현재 예측 데이터를 렌더링할 수 없습니다.

예측의 Explore 쿼리 요구사항

예측을 만들려면 Explore가 다음 요구사항을 충족해야 합니다.

  • 측정기준 채우기가 사용 설정된 정확한 측정기준(기간 측정기준이어야 함)을 포함해야 합니다.
  • 하나 이상의 측정값 또는 커스텀 측정값을 포함합니다(예측에는 최대 5개 측정값 또는 커스텀 측정값을 포함할 수 있음).
  • 기간 측정기준으로 내림차순 결과 정렬

고려사항

다음은 예측을 위해 새 Explore 쿼리를 만들거나 기존 Explore 쿼리에 예측을 추가할 때 고려해야 할 추가 기준입니다.

  • 피벗이전 요구사항이 충족되면 피벗된 Explore에서 예측을 수행할 수 있습니다.
  • 행 합계 및 소계행 합계 및 소계는 예측 값을 포함하지 않습니다. 예기치 않은 숫자가 만들어질 수 있으므로 소계 또는 행 합계를 예측에 사용하지 않는 것이 좋습니다.
  • 불완전한 기간을 포함하는 필터 — 정확한 예상을 위해 불완전한 기간 동안 Explore에 데이터가 포함될 때 Explore 필터전체 기간 로직에서만 예측을 사용해야 합니다. 예를 들어 사용자가 Explore에서 지난 3개월 동안의 데이터를 표시하도록 필터링한 상태에서 한 달 동안의 데이터를 미래로 예측하는 경우, Explore에는 현재 완료되지 않은 달의 데이터가 포함됩니다. 예측은 불완전한 데이터를 계산에 통합하고 더 신뢰할 수 없는 결과를 표시합니다. 대신 Explore에 불완전한 기간이 포함된 경우(예: Explore에 이번 달의 불완전한 월별 데이터가 포함된 경우) 지난 3개월이 아니라 지난 3개월 전체와 같은 필터 논리를 사용하여 보다 정확한 예측을 보장합니다.
  • 테이블 계산 — 하나 이상의 예측된 측정항목을 기반으로 하는 테이블 계산은 예측에 자동으로 포함됩니다.
  • 행 한도 — 예측 행을 포함하여 전체 데이터 테이블에 행 한도가 적용되는 방식을 알아봅니다.

추가 도움말 및 문제 해결 리소스는 이 페이지의 일반적인 문제 및 유의사항 섹션을 참고하세요.

일반적으로 행 수가 많은 데이터 세트와 예측 길이가 짧을수록 예측 정확도가 높아집니다.

예측 메뉴 옵션

Explore 시각화 탭에 있는 예측 메뉴의 옵션을 사용하여 예측 데이터를 맞춤설정할 수 있습니다. 예측 메뉴에는 다음 옵션이 포함됩니다.

필드 선택

필드 선택 드롭다운 메뉴에 예측에 사용할 수 있는 Explore 쿼리의 측정값 또는 커스텀 측정값이 표시됩니다. 최대 5개의 측정값 또는 커스텀 측정값을 선택할 수 있습니다.

기간

길이 옵션은 데이터 값을 예측할 행 수 또는 시간을 나타냅니다. 예측 기간 간격은 Explore 쿼리의 기간 측정기준에 따라 자동으로 채워집니다.

일반적으로 행 수가 많은 데이터 세트와 예측 길이가 짧을수록 예측 정확도가 높아집니다.

예측 간격

예측 간격 옵션을 사용하면 분석가가 예측의 불확실성을 표현함으로써 정확성을 지원할 수 있습니다. 사용 설정하면 예측 간격 옵션을 통해 예측된 데이터 값의 경계를 선택할 수 있습니다. 예를 들어 예측 간격이 95% 이면 예측 측정값이 예측의 상한값과 하한값 사이에 속할 가능성이 95%입니다.

선택한 예측 간격이 클수록 상한 및 하한이 넓어집니다.

계절성

계절성 옵션을 사용하면 분석가가 예측에서 알려진 주기 또는 반복 데이터 추세를 설명할 수 있으며, 주기의 데이터 행 수를 참조할 수 있습니다. 예를 들어 탐색 데이터 테이블에 시간당 1개의 행이 있고 데이터가 매일 순환되는 경우 계절성은 24입니다.

기본 예측 설정으로 Looker는 Explore에서 날짜 측정기준을 참조하고 가능한 여러 계절성 주기를 스캔하여 최종 예측과 가장 일치하는 항목을 찾습니다. 예를 들어 시간별 데이터를 사용할 때 Looker는 일, 주, 4주 계절성 주기를 시도할 수 있습니다. Looker는 측정기준의 빈도도 고려합니다. 측정기준이 6시간 기간을 나타낼 경우 Looker는 하루에 4개의 행만 있음을 알 수 있으며 그에 따라 계절성도 조정합니다.

일반적인 사용 사례의 경우 자동 옵션을 사용하면 특정 데이터 세트에 가장 적합한 계절성을 감지할 수 있습니다. 데이터 세트의 특정 주기를 알고 있는 경우 커스텀 옵션을 사용하면 예측의 개별 측정에 대해 주기를 구성하는 행 수를 지정할 수 있습니다.

여러 측정의 데이터 값을 예측할 때 각 측정에 대해 다음을 제외한 다른 계절성 옵션을 선택할 수 있습니다. 계절성 드롭다운 메뉴에는 다음과 같은 몇 가지 옵션이 있습니다.

계절성 옵션을 사용 설정하지 않은 경우에도 예측은 기본적으로 자동 계절성 옵션을 예측에 적용합니다.

자동

자동 계절성 옵션을 사용하면 Looker가 일별, 시간별, 월간 등 여러 일반적인 계절성 기간에서 데이터에 가장 적합한 옵션을 선택합니다.

맞춤

데이터 세트의 각 계절이나 주기를 구성하는 특정 행 수를 알고 있으면 기간 필드에 숫자를 지정할 수 있습니다. 데이터가 특정 행 수로 순환되는 것을 알고 있으면 커스텀을 선택하는 것이 유용할 수 있습니다.

월 단위로 순환되지만 더 세부적인 표현이 필요한 데이터를 다루는 경우(예: Explore에서 날짜 또는 세부사항 사용) 일반적으로 4주 또는 30일 기간이 월별 주기에 해당합니다.

없음

계절성은 예측의 강력한 구성요소입니다. 그러나 입력 데이터에 따라 항상 권장되지는 않습니다. 데이터에 예측 가능한 주기가 없는 경우, 계절성을 사용 설정하면 알고리즘이 패턴을 찾은 후 거짓 패턴을 예측에 적용하려고 시도할 때 예측이 부정확해질 수 있습니다. 이로 인해 모호한 예측이 발생할 수 있습니다.

여러 측정항목의 데이터 값을 예측하고 한두 개에만 계절성을 사용 설정하려는 경우 계절성을 사용 설정하지 않으려는 모든 측정값에 없음을 선택하면 됩니다.

예측 만들기

권한이 있는 사용자만 예측을 만들 수 있습니다.

예측을 만들려면 다음 단계를 따르세요.

  1. Explore가 예측 요구사항을 충족하는지 확인합니다. 예를 들어 사용자가 사용자 생성 월, 사용자 수, 주문 수가 정렬된 Explore 쿼리에 대한 예측을 만들려고 합니다. 이 예측은 사용자가 만든 월을 기준으로 내림차순 정렬됩니다. 결과는 2019년 12월까지의 데이터를 표시합니다.

  2. Explore 시각화 탭에서 예측을 클릭하여 예측 메뉴를 엽니다.

  3. 필드 선택 드롭다운 메뉴를 클릭하여 예측할 최대 5개의 측정값 또는 커스텀 측정값을 선택합니다. 이 예에서 사용자는 사용자 수주문 수를 선택합니다.

  4. 기간 필드에 예측하려는 향후 기간을 입력합니다. 이 예에서 사용자는 6개월을 입력합니다.

  5. 선택적으로 예측 간격 또는 계절성 스위치를 클릭하여 두 함수 중 하나를 사용 설정하고 관련 옵션을 맞춤설정합니다. 이 예에서 사용자는 두 옵션을 사용 설정하지 않았습니다.

  6. x 옆의 메뉴 탭에서 x를 클릭하여 설정을 저장하고 메뉴를 종료합니다.

  7. 실행을 클릭하여 Explore 쿼리를 다시 실행합니다. (예측을 변경한 후 Explore를 다시 실행해야 합니다.)

이제 Explore 결과 및 시각화에 지정된 시간 동안의 예측 값이 표시됩니다. 지정된 옵션을 사용하면 Explore 예에 2020년 1월부터 2020년 6월까지 6개월 동안 사용자 수주문 수에 대한 예측 데이터가 표시됩니다.

예측 계산은 데이터 정렬 순서에 따라 달라지므로 예측 쿼리가 실행되면 정렬이 사용 중지됩니다.

예측 수정

권한이 있는 사용자만 예측을 수정할 수 있습니다.

예측을 수정하려면 다음 안내를 따르세요.

  1. 필요에 따라 Explore 쿼리를 수정하여 다른 측정 또는 기간 필드를 추가하거나 삭제합니다. Explore가 예측 요구사항을 충족하는지 확인합니다.
  2. Explore 시각화 탭에서 예측을 클릭하여 예측 메뉴를 엽니다.
  3. 필드 선택 드롭다운 메뉴를 클릭하여 예측 필드를 변경합니다. 예측 필드를 삭제하려면 다음 안내를 따르세요.
    • 펼쳐진 필드 선택 드롭다운 메뉴에서 예측 필드 옆에 있는 상자를 클릭하여 예측에서 필드를 삭제합니다.
    • 또는 접힌 x 메뉴에서 필드 이름 옆에 있는 x를 클릭합니다.
  4. 기간 필드에서 원하는 대로 향후 예측하도록 지정된 기간을 수정합니다.
  5. 선택적으로 예측 간격 또는 계절성 스위치를 클릭하여 두 함수 중 하나를 사용 설정하고 관련 옵션을 맞춤설정합니다.
    • 예측 간격 또는 계절성이 이미 사용 설정된 경우 맞춤설정이 표시됩니다. 원하는 대로 커스텀 설정을 수정하거나 스위치를 선택하여 예측에서 함수를 삭제합니다.
  6. x 옆의 메뉴 탭에서 x를 클릭하여 설정을 저장하고 메뉴를 종료합니다.
  7. 실행을 클릭하여 Explore 쿼리를 다시 실행합니다. (예측을 변경한 후 Explore를 다시 실행해야 합니다.)

이제 Explore 결과와 시각화에 수정된 예측이 표시됩니다. 예측 계산은 데이터 정렬 순서에 따라 달라지므로 예측 쿼리가 실행되면 정렬이 사용 중지됩니다.

예측 삭제

권한이 있는 사용자만 예측을 삭제할 수 있습니다.

Explore에서 예측을 삭제하려면 다음 안내를 따르세요.

  1. Explore 시각화 탭에서 예측을 클릭하여 예측 메뉴를 엽니다.
  2. 예측 메뉴 상단에서 지우기를 클릭합니다.

쿼리가 자동으로 다시 실행되어 예측이 적용되지 않은 결과가 생성됩니다.

일반적인 문제 및 유의사항

정확성

예측 정확성은 입력 데이터에 따라 달라집니다. Looker의 AutoARIMA를 구현하면 입력 데이터에서 미묘한 차이를 성공적으로 결합하는 매우 정확한 예측을 수행할 수 있습니다. 또한 알고리즘이 입력 데이터에서 이상한 패턴을 포착하여 예측에서 과도하게 강조하기도 합니다. 예측을 최대한 활용하려면 충분한 데이터가 제공되었는지, 데이터가 최대한 정확한지 확인하세요.

예측을 생성할 수 없습니다.

예측을 생성할 수 없는 타당한 이유가 있습니다. 이는 일반적으로 입력 데이터 양이 너무 적거나 요청된 예측 길이가 너무 큰 경우에 발생합니다. 두 요소 중 하나에 대한 특정 제한은 없으며 특정 예측 길이에 대한 필요한 입력 데이터의 정확한 비율은 없습니다. 분산 및 예측 불가능한 입력 데이터가 많을수록 AutoARIMA 알고리즘이 일치 항목을 찾기가 더 어려워집니다. 예측을 생성하는 가장 효과적인 방법은 정리된 입력 데이터 양을 늘리고, 계절성 설정이 올바른지 확인하며, 예측 길이를 필요한 수준으로 줄이는 것입니다. 예측 간격 옵션을 사용하면 낮은 간격을 선택하는 것이 도움이 될 수 있습니다.

입력 데이터 정리에는 다음이 포함될 수 있습니다.

  • 데이터가 포함되지 않은 기간의 선행 또는 후행 행 자르기
  • 더 큰 날짜 측정기준을 선택하여 데이터 세트의 노이즈 줄이기
  • 예측에 도움이 되지 않는 필터 이상점 변경

쿼리 결과가 예측 없이 반환되었고 모호한 오류 발생

이 오류가 발생해서는 안 됩니다. 발생하는 경우 예측 구성에서 측정값을 삭제한 다음 다시 추가합니다.

예측이 표시되지만 명백하게 잘못되었거나 도움이 되지 않음

이 경우 가장 좋은 방법은 입력 데이터를 추가하고 최대한 많이 정리한 후 커스텀 계절성(데이터의 특정 주기를 알고 있는 경우)을 설정하거나 없음을 함께 선택함으로써 계절성 옵션을 사용 중지하는 것입니다.

입력 데이터 정리에는 다음 태스크가 포함될 수 있습니다.

  • 데이터가 포함되지 않은 기간의 선행 또는 후행 행 자르기
  • 더 큰 날짜 측정기준을 선택하여 데이터 세트의 노이즈 줄이기
  • 예측에 도움이 되지 않는 필터 이상점 변경