Google Cloud 아키텍처 프레임워크의 안정성 요소에 있는 이 원칙은 사용자 환경을 평가한 후 발견된 사항을 안정성 목표 및 측정항목에 매핑하는 데 도움이 됩니다.
이 원칙은 안정성의 중점 영역 범위 지정과 관련이 있습니다.
원칙 개요
관측성 도구는 대량의 데이터를 제공하지만 모든 데이터가 사용자에게 미치는 영향과 직접적으로 관련되는 것은 아닙니다. 예를 들어 CPU 사용량이 많거나 서버 작업이 느려지거나 태스크가 비정상 종료될 수 있습니다. 하지만 이러한 문제가 사용자 환경에 영향을 미치지 않으면 서비스 중단으로 간주되지 않습니다.
사용자 환경을 측정하려면 내부 시스템 동작과 사용자 대상 문제를 구분해야 합니다. 사용자 요청의 성공률과 같은 측정항목에 집중합니다. CPU 사용량과 같은 서버 중심 측정항목에만 의존하지 마세요. 서비스의 안정성에 대해 혼동을 야기하는 결론을 내릴 수 있습니다. 진정한 안정성이란 사용자가 애플리케이션이나 서비스를 일관되게 효과적으로 사용할 수 있다는 것을 의미합니다.
권장사항
사용자 환경을 효과적으로 측정하려면 다음 섹션의 권장사항을 고려하세요.
사용자 환경 측정
서비스의 안정성을 정확하게 파악하려면 사용자의 실제 경험을 반영하는 측정항목에 우선순위를 두세요. 예를 들어 사용자의 쿼리 성공률, 애플리케이션 지연 시간, 오류율을 측정합니다.
이 데이터는 사용자의 기기 또는 브라우저에서 직접 수집하는 것이 좋습니다. 이러한 직접적인 데이터 수집이 불가능하다면 측정 지점을 시스템에서 사용자로부터 점점 더 멀리 이동합니다. 예를 들어 부하 분산기 또는 프런트엔드 서비스를 측정 지점으로 사용할 수 있습니다. 이 접근 방식을 사용하면 문제가 사용자에게 심각한 영향을 미치기 전에 문제를 파악하고 해결할 수 있습니다.
사용자 여정 분석
사용자가 시스템과 상호작용하는 방식을 파악하려면 Cloud Trace와 같은 추적 도구를 사용하면 됩니다. 애플리케이션을 통한 사용자 여정을 따라가면 사용자 경험을 저하시킬 수 있는 병목 현상과 지연 시간 문제를 찾을 수 있습니다. Cloud Trace는 서비스 아키텍처의 각 홉에 대한 자세한 성능 데이터를 캡처합니다. 이 데이터를 사용하면 성능 문제를 더 효율적으로 식별하고 해결하여 더 안정적이고 만족스러운 사용자 환경을 제공할 수 있습니다.