지속적인 최적화

Last reviewed 2024-09-25 UTC

Google Cloud 아키텍처 프레임워크의 비용 최적화 요소에 있는 이 원칙은 끊임없이 변화하고 진화하는 비즈니스 목표에 따라 클라우드 배포 비용을 최적화하는 데 도움이 되는 권장사항을 제공합니다.

비즈니스가 성장하고 발전함에 따라 클라우드 워크로드는 리소스 요구사항과 사용 패턴의 변화에 적응해야 합니다. 클라우드 지출에서 최대한의 가치를 얻으려면 비용 효율성을 유지하면서 비즈니스 목표를 계속 지원해야 합니다. 이를 위해서는 지속적인 개선 및 최적화에 중점을 둔 사전 예방적이며 적응적인 접근 방식이 필요합니다.

원칙 개요

비용을 지속적으로 최적화하려면 클라우드 환경을 사전에 모니터링하고 분석하여 현재 요구사항을 충족하도록 적절하게 조정해야 합니다. 최종 사용자 환경에 직접적인 영향을 미치고, 비즈니스 목표와 일치하며, 지속적인 개선을 위한 통계를 제공하는 핵심성과지표 (KPI)에 모니터링 노력을 집중하세요. 이 접근 방식을 사용하면 비효율성을 파악하고 해결하고, 변화하는 요구사항에 적응하며, 클라우드 지출을 전략적 비즈니스 목표에 지속적으로 맞출 수 있습니다. 포괄적인 관찰 가능성과 비용 효율성 간에 균형을 유지하려면 리소스 사용량 모니터링의 비용과 이점을 이해하고 적절한 프로세스 개선 및 최적화 전략을 사용하세요.

권장사항

Google Cloud 환경을 효과적으로 모니터링하고 비용을 지속적으로 최적화하려면 다음 권장사항을 고려하세요.

비즈니스와 관련성 높은 측정항목에 집중

효과적인 모니터링은 비즈니스와 고객에게 가장 중요한 측정항목을 파악하는 것으로 시작됩니다. 이러한 측정항목에는 다음이 포함됩니다.

  • 사용자 환경 측정항목: 지연 시간, 오류율, 처리량, 고객 만족도 측정항목은 애플리케이션을 사용할 때 최종 사용자의 환경을 이해하는 데 유용합니다.
  • 비즈니스 결과 측정항목: 수익, 고객 증가, 참여도를 리소스 사용량과 연관시켜 비용 최적화 기회를 파악할 수 있습니다.
  • DevOps Research & Assessment (DORA) 측정항목: 배포 빈도, 변경 리드 타임, 변경 실패율, 복원 시간과 같은 측정항목은 소프트웨어 제공 프로세스의 효율성과 안정성에 대한 유용한 정보를 제공합니다. 이러한 측정항목을 개선하면 생산성을 높이고, 다운타임을 줄이고, 비용을 최적화할 수 있습니다.
  • 사이트 안정성 엔지니어링 (SRE) 측정항목: 오류 예산을 사용하면 팀에서 허용 가능한 수준의 서비스 중단을 수치화하고 관리할 수 있습니다. 오류 예산은 신뢰도에 대한 명확한 기대치를 설정하여 팀이 안전 마진을 알고 더 자신 있게 혁신하고 변경사항을 배포할 수 있도록 지원합니다. 이러한 사전 예방적 접근 방식은 혁신과 안정성 간의 균형을 유지하여 심각한 서비스 중단 또는 장기적인 다운타임과 관련된 과도한 운영 비용을 방지하는 데 도움이 됩니다.

리소스 최적화를 위한 관측 가능성 사용

다음은 관측성을 사용하여 클라우드 배포에서 리소스 병목 현상과 사용되지 않는 리소스를 식별하기 위한 권장사항입니다.

  • 리소스 사용률 모니터링: 리소스 사용률 측정항목을 사용하여 사용률이 낮은 Google Cloud 리소스를 식별합니다. 예를 들어 CPU 및 메모리 사용률과 같은 측정항목을 사용하여 유휴 VM 리소스를 식별합니다. Google Kubernetes Engine (GKE)의 경우 비용 분석비용 관련 최적화 측정항목을 자세히 확인할 수 있습니다. Google Cloud VMware Engine의 경우 리소스 사용률을 검토하여 CUD, 스토리지 소비, ESXi 적절한 크기 조정을 최적화합니다.
  • 클라우드 권장사항 사용: Active Assist는 클라우드 운영을 최적화하는 데 도움이 되는 지능형 도구의 포트폴리오입니다. 이러한 도구는 비용을 절감하고 성능을 높이며 보안을 강화하고 지속 가능성 중심의 결정을 내릴 수 있는 실행 가능한 권장사항을 제공합니다. 예를 들어 VM 크기 조정 통계를 사용하면 리소스 할당을 최적화하고 불필요한 지출을 방지할 수 있습니다.
  • 리소스 사용량과 성능의 상관관계 분석: 리소스 사용량과 애플리케이션 성능 간의 관계를 분석하여 사용자 환경에 영향을 주지 않으면서 비용이 더 저렴한 리소스로 다운그레이드할 수 있는지 확인합니다.

문제 해결 요구사항과 비용의 균형 맞추기

자세한 관측 가능성 데이터는 문제를 진단하고 해결하는 데 도움이 될 수 있습니다. 그러나 과도한 양의 관측 가능성 데이터를 저장하거나 불필요한 데이터를 외부 모니터링 도구로 내보내면 불필요한 비용이 발생할 수 있습니다. 효율적인 문제 해결을 위해 다음 권장사항을 고려하세요.

  • 문제 해결을 위한 충분한 데이터 수집: 모니터링 솔루션이 문제가 발생할 때 효율적으로 진단하고 해결할 수 있는 충분한 데이터를 수집해야 합니다. 이 데이터에는 다양한 수준의 세부사항이 포함된 로그, 트레이스, 측정항목이 포함될 수 있습니다.
  • 샘플링 및 집계 사용: 샘플링 및 집계 기법을 사용하여 상세 데이터의 필요성과 비용 고려사항의 균형을 유지합니다. 이 접근 방식을 사용하면 과도한 스토리지 비용 없이 대표적인 데이터를 수집할 수 있습니다.
  • 모니터링 도구 및 서비스의 가격 책정 모델 이해: 다양한 모니터링 솔루션을 평가하고 프로젝트의 구체적인 요구사항, 예산, 사용 패턴에 맞는 옵션을 선택합니다. 선택할 때는 데이터 양, 보관 요구사항, 필수 기능과 같은 요소를 고려하세요.
  • 모니터링 구성 정기 검토: 불필요한 측정항목이나 로그를 삭제하여 과도한 데이터 수집을 방지합니다.

역할에 맞게 데이터 수집을 조정하고 역할별 보관 정책 설정

다양한 역할의 구체적인 데이터 요구사항을 고려하세요. 예를 들어 개발자는 주로 트레이스 및 애플리케이션 수준 로그에 액세스해야 할 수 있지만 IT 관리자는 시스템 로그 및 인프라 측정항목에 집중할 수 있습니다. 데이터 수집을 조정하면 불필요한 저장용량 비용을 줄이고 관련 없는 정보로 사용자를 과도하게 몰아붙이지 않을 수 있습니다.

또한 각 역할의 요구사항과 규제 요구사항에 따라 보관 정책을 정의할 수 있습니다. 예를 들어 개발자는 더 짧은 기간 동안 자세한 로그에 액세스해야 할 수 있지만, 재무 분석가에게는 장기 데이터가 필요할 수 있습니다.

규제 및 규정 준수 요구사항 고려

특정 업계에서는 규제 요구사항에 따라 데이터를 보관해야 합니다. 법적 및 재정적 위험을 방지하려면 모니터링 및 데이터 보관 관행이 관련 규정을 준수하는 데 도움이 되는지 확인해야 합니다. 동시에 비용 효율성도 유지해야 합니다. 다음 권장사항을 고려하세요.

  • 업계 또는 지역의 구체적인 데이터 보관 요구사항을 확인하고 모니터링 전략이 이러한 요구사항을 충족하는지 확인합니다.
  • 감사 및 규정 준수 요구사항을 충족하면서 스토리지 비용을 최소화할 수 있도록 적절한 데이터 보관처리 및 검색 메커니즘을 구현합니다.

스마트 알림 구현

알림을 사용하면 문제를 적시에 감지하고 해결할 수 있습니다. 하지만 사용자에게 정보를 제공하는 접근 방식과 알림으로 사용자를 압도하는 접근 방식 간에 균형을 유지해야 합니다. 지능형 알림 시스템을 설계하면 비즈니스 영향이 더 큰 중요한 문제를 우선적으로 처리할 수 있습니다. 다음 권장사항을 고려하세요.

  • 고객에게 영향을 미치는 문제에 우선순위 지정: 웹사이트 중단, 느린 응답 시간, 거래 실패와 같이 고객 경험에 직접적인 영향을 미치는 문제에 대해 빠르게 트리거되는 알림을 설계합니다.
  • 임시 문제에 맞게 조정: 적절한 임곗값과 지연 메커니즘을 사용하여 고객에게 영향을 미치지 않는 임시 문제 또는 자체 복구 시스템 문제에 대한 불필요한 알림을 방지합니다.
  • 알림 심각도 맞춤설정: 매우 중요 알림과 중요하지 않은 알림을 구분하여 가장 긴급한 문제에 즉시 대응할 수 있습니다.
  • 알림 채널을 현명하게 사용: 알림의 심각도와 긴급도에 따라 알림 알림에 적절한 채널 (이메일, SMS, 페이징)을 선택합니다.