MLOps란 무엇인가요?

MLOps(머신러닝 작업)은 데이터 과학자와 엔지니어가 머신러닝(ML) 수명 주기를 더 효율적으로 관리할 수 있도록 하는 일련의 관행입니다.

머신러닝의 개발 및 운영 간 격차를 메우는 것이 목표입니다. MLOps의 목표는 ML 모델의 개발, 테스트, 배포를 일관적이고 신뢰할 수 있는 방식으로 수행하도록 보장하는 것입니다.

점점 더 많은 조직이 ML 모델을 사용하여 중요한 비즈니스 결정을 내리면서 MLOps가 점점 더 중요해지고 있습니다.

MLOps 정의

MLOps는 머신러닝 작업을 의미하며 개발부터 배포 및 모니터링까지 머신러닝 수명 주기에 대한 관리 프로세스를 나타냅니다. 여기에는 다음과 같은 태스크가 포함됩니다.

  • 실험 추적: 실험 및 결과를 추적하여 최적 모델을 식별합니다.
  • 모델 배포: 모델을 프로덕션에 배포하고 애플리케이션에서 액세스할 수 있도록 설정합니다.
  • 모델 모니터링: 모델을 모니터링하여 문제 또는 성능 저하를 감지합니다.
  • 모델 재학습: 새로운 데이터로 모델을 재학습하여 성능을 향상시킵니다.

MLOps는 프로덕션 환경에서 머신러닝 모델의 신뢰성, 확장성, 유지보수 성능을 보장하기 위해 필수적입니다.

MLOps의 중요성

MLOps는 ML 수명 주기를 관리하고 ML 모델의 개발, 배포 및 유지보수가 효율적으로 수행되었는지 확인하기 위해 필수적입니다. MLOps가 없으면 조직에 다음과 같은 여러 과제가 발생할 수 있습니다.

오류 위험 증가: 수동 프로세스로 인해 ML 수명 주기에서 오류와 비일관성이 발생할 수 있으며, 이는 ML 모델의 정확성과 신뢰성에 영향을 미칠 수 있습니다.

확장성 부족: ML 모델 및 데이터 세트 크기와 복잡성이 증가함에 따라 수동 프로세스 관리가 까다로워져서 ML 운영을 효과적으로 확장하기 어려울 수 있습니다.

효율성 감소: 수동 프로세스의 소요 시간과 비효율성이 증가하여 ML 모델의 개발 및 배포가 느려질 수 있습니다.

협업 부족: 수동 프로세스로 인해 데이터 과학자, 엔지니어, 운영팀의 효과적인 공동작업이 어려워져 사일로와 커뮤니케이션 단절로 이어질 수 있습니다.

MLOps는 ML 수명 주기의 자동화 및 관리를 위한 프레임워크와 도구 집합을 제공하여 이러한 과제를 해결합니다. 이를 통해 조직은 보다 효율적이고, 안정적이고, 확장 가능한 방식으로 ML 모델의 개발, 배포 및 유지보수를 수행할 수 있습니다.

MLOps의 이점

MLOps는 이를 도입하는 조직에게 다음과 같은 여러 이점을 제공합니다.

  • 효율성 향상: MLOps는 ML 수명 주기를 자동화 및 효율화하여 ML 모델의 개발, 배포, 유지보수에 필요한 시간과 노력을 줄여줍니다.
  • 확장성 향상: MLOps를 사용하는 조직은 ML 운영을 보다 효과적으로 확장하여 대규모 데이터 세트와 보다 복잡한 모델을 처리할 수 있습니다.
  • 안정성 향상: MLOps는 프로덕션 환경에서 ML 모델의 안정성 및 정확성을 보장하여 오류 및 불일치 위험을 줄여줍니다.
  • 공동 작업 개선: MLOps는 데이터 과학자, 엔지니어, 운영 팀이 효율적으로 협업할 수 있도록 공통의 프레임워크와 도구 집합을 제공합니다.
  • 비용 절감: MLOps는 ML 수명 주기를 자동화 및 최적화하고 수동 개입 요구를 없앰으로써 조직의 비용 절감에 도움을 줄 수 있습니다.

MLOps와 DevOps의 차이점은 무엇인가요?

DevOps는 조직이 소프트웨어 개발과 운영 팀 간의 격차를 메울 수 있게 도와주는 일련의 방법입니다. MLOps는 ML 모델의 요구사항을 구체적으로 해결하는 이와 유사한 일련의 방법입니다.

MLOps와 DevOps 사이에는 다음과 같은 몇 가지 주요 차이점이 있습니다.

  • 범위: DevOps는 소프트웨어 개발 수명 주기에 중점을 두고 MLOps는 ML 수명 주기에 중점을 둡니다.
  • 복잡성: ML 모델은 기존의 소프트웨어 애플리케이션보다 복잡한 경우가 많으며, 개발 및 배포를 위해 특별한 도구와 기법이 필요합니다.
  • 데이터: ML 모델은 데이터에 의존해서 학습 및 추론을 수행하므로 데이터 관리 및 처리를 위한 추가적인 과제가 발생합니다.
  • 규제: ML 모델에는 개발 및 배포 프로세스에 영향을 줄 수 있는 규제 요구사항이 적용될 수 있습니다.

이러한 차이점에도 불구하고 MLOps와 DevOps는 협업, 자동화, 지속적인 개선의 중요성과 같은 몇 가지 공통 원칙을 공유합니다. DevOps 관행을 도입한 조직은 MLOps를 구현할 때 이러한 관행을 활용하는 경우가 많습니다.

MLOps의 기본 구성요소

MLOps는 ML 수명 주기를 관리하기 위해 함께 작동하는 다음과 같은 여러 구성요소로 구성됩니다.

탐색적 데이터 분석(EDA)

EDA는 ML 모델 학습에 사용되는 데이터를 탐색하고 이해하는 프로세스입니다. 여기에는 다음과 같은 태스크가 포함됩니다.

  • 데이터 시각화: 데이터를 시각화하여 패턴, 추세, 이상점 식별
  • 데이터 정리: 중복되었거나 잘못된 데이터 삭제 및 누락된 값 처리
  • 특성 추출: 원시 데이터를 ML 모델과 관련이 있는 유용한 특성으로 변환

데이터 준비 및 특성 추출

데이터 준비와 특성 추출은 MLOps 프로세스에서 중요한 단계입니다. 데이터 준비에는 모델 학습에 적합하도록 원시 데이터를 정리, 변환, 형식 지정하는 과정이 포함됩니다.

특성 추출에는 원시 데이터에서 모델 학습과 더 관련성 있고 유용한 새로운 특성을 만드는 작업이 포함됩니다. 이러한 단계는 고품질 데이터로 ML 모델을 학습하고 정확한 예측을 수행할 수 있도록 보장하기 위해 필수적입니다.

모델 학습 및 미세 조정

모델 학습 및 조정에는 가능한 최선의 성능을 얻기 위해 미리 준비된 데이터로 ML 모델을 학습하고 하이퍼매개변수를 최적화하는 과정이 포함됩니다.

모델 학습 및 조정을 위한 일반적인 태스크는 다음과 같습니다.

  • 올바른 ML 알고리즘 선택: 특정 문제 및 데이터 세트에 올바른 ML 알고리즘 선택
  • 모델 학습: 학습 데이터로 ML 모델 학습
  • 모델 조정: 성능 개선을 위해 ML 모델의 하이퍼매개변수 조정
  • 모델 평가: 테스트 데이터로 ML 모델의 성능 평가

모델 검토 및 거버넌스

모델 검토 및 거버넌스는 책임감 있는 방식으로 그리고 윤리적으로 ML 모델을 개발 및 배포할 수 있도록 보장합니다.

  • 모델 검증: ML 모델이 원하는 성능 및 품질 표준을 충족하는지 확인하기 위해 ML 모델 검증
  • 모델 공정성: ML 모델이 편향이나 차별을 나타내지 않는지 확인
  • 모델 해석 가능성: ML 모델이 이해 및 설명 가능한지 확인
  • 모델 보안: ML 모델이 공격으로부터 안전하게 보호되는지 확인

모델 추론 및 서빙

모델 추론 및 서빙에는 학습된 ML 모델을 프로덕션에 배포하고 애플리케이션 및 최종 사용자가 사용할 수 있도록 제공하는 과정이 포함됩니다.

  • 모델 배포: ML 모델을 프로덕션 환경에 배포
  • 모델 서빙: 애플리케이션 및 최종 사용자에 의한 추론에 ML 모델 제공
  • 모델 모니터링: 프로덕션 환경에서 ML 모델의 성능 및 동작 모니터링

모델 모니터링

모델 모니터링에는 프로덕션에서 ML 모델의 성능과 동작을 지속적으로 모니터링하는 작업이 포함됩니다. 태스크에는 다음이 포함될 수 있습니다.

  • 모델 성능 추적: 정확성, 정밀도, 재현율과 같은 측정항목을 추적하여 ML 모델의 성능 평가
  • 모델 드리프트 감지: 데이터 또는 환경의 변화로 인해 시간이 지남에 따라 ML 모델의 성능이 저하되는 시점 감지
  • 모델 문제 파악: 편향, 과적합, 과소적합 등 ML 모델의 성능에 영향을 줄 수 있는 문제 식별

자동화된 모델 재학습

자동화된 모델 재학습에는 성능이 저하되거나 새 데이터가 제공되었을 때 ML 모델을 재학습하는 과정이 포함됩니다. 자동화된 모델 재학습에는 다음이 포함됩니다.

  • 모델 재학습 트리거: 모델 성능 저하 또는 새 데이터의 가용성과 같은 특정 조건이 충족되면 재학습 프로세스 트리거
  • 모델 재학습: 최신 데이터를 사용하여 ML 모델을 재학습시키고 프로덕션의 모델 업데이트
  • 재학습된 모델 평가: 재학습된 모델의 성능 평가 및 원하는 성능 표준 충족 여부 확인

Google Cloud로 비즈니스 문제 해결

신규 고객에게는 Google Cloud에서 사용할 수 있는 $300의 무료 크레딧이 제공됩니다.
Google Cloud 영업 전문가에게 고유한 문제에 대해 자세히 논의해 보세요.

다음 단계 수행

$300의 무료 크레딧과 20여 개의 항상 무료 제품으로 Google Cloud에서 빌드하세요.

Google Cloud
  • ‪English‬
  • ‪Deutsch‬
  • ‪Español‬
  • ‪Español (Latinoamérica)‬
  • ‪Français‬
  • ‪Indonesia‬
  • ‪Italiano‬
  • ‪Português (Brasil)‬
  • ‪简体中文‬
  • ‪繁體中文‬
  • ‪日本語‬
  • ‪한국어‬
콘솔
Google Cloud