MLOps(머신러닝 작업)은 데이터 과학자와 엔지니어가 머신러닝(ML) 수명 주기를 더 효율적으로 관리할 수 있도록 하는 일련의 관행입니다.
머신러닝의 개발 및 운영 간 격차를 메우는 것이 목표입니다. MLOps의 목표는 ML 모델의 개발, 테스트, 배포를 일관적이고 신뢰할 수 있는 방식으로 수행하도록 보장하는 것입니다.
점점 더 많은 조직이 ML 모델을 사용하여 중요한 비즈니스 결정을 내리면서 MLOps가 점점 더 중요해지고 있습니다.
MLOps는 머신러닝 작업을 의미하며 개발부터 배포 및 모니터링까지 머신러닝 수명 주기에 대한 관리 프로세스를 나타냅니다. 여기에는 다음과 같은 태스크가 포함됩니다.
MLOps는 프로덕션 환경에서 머신러닝 모델의 신뢰성, 확장성, 유지보수 성능을 보장하기 위해 필수적입니다.
MLOps는 ML 수명 주기를 관리하고 ML 모델의 개발, 배포 및 유지보수가 효율적으로 수행되었는지 확인하기 위해 필수적입니다. MLOps가 없으면 조직에 다음과 같은 여러 과제가 발생할 수 있습니다.
오류 위험 증가: 수동 프로세스로 인해 ML 수명 주기에서 오류와 비일관성이 발생할 수 있으며, 이는 ML 모델의 정확성과 신뢰성에 영향을 미칠 수 있습니다.
확장성 부족: ML 모델 및 데이터 세트 크기와 복잡성이 증가함에 따라 수동 프로세스 관리가 까다로워져서 ML 운영을 효과적으로 확장하기 어려울 수 있습니다.
효율성 감소: 수동 프로세스의 소요 시간과 비효율성이 증가하여 ML 모델의 개발 및 배포가 느려질 수 있습니다.
협업 부족: 수동 프로세스로 인해 데이터 과학자, 엔지니어, 운영팀의 효과적인 공동작업이 어려워져 사일로와 커뮤니케이션 단절로 이어질 수 있습니다.
MLOps는 ML 수명 주기의 자동화 및 관리를 위한 프레임워크와 도구 집합을 제공하여 이러한 과제를 해결합니다. 이를 통해 조직은 보다 효율적이고, 안정적이고, 확장 가능한 방식으로 ML 모델의 개발, 배포 및 유지보수를 수행할 수 있습니다.
MLOps는 이를 도입하는 조직에게 다음과 같은 여러 이점을 제공합니다.
DevOps는 조직이 소프트웨어 개발과 운영 팀 간의 격차를 메울 수 있게 도와주는 일련의 방법입니다. MLOps는 ML 모델의 요구사항을 구체적으로 해결하는 이와 유사한 일련의 방법입니다.
MLOps와 DevOps 사이에는 다음과 같은 몇 가지 주요 차이점이 있습니다.
이러한 차이점에도 불구하고 MLOps와 DevOps는 협업, 자동화, 지속적인 개선의 중요성과 같은 몇 가지 공통 원칙을 공유합니다. DevOps 관행을 도입한 조직은 MLOps를 구현할 때 이러한 관행을 활용하는 경우가 많습니다.
MLOps는 ML 수명 주기를 관리하기 위해 함께 작동하는 다음과 같은 여러 구성요소로 구성됩니다.
EDA는 ML 모델 학습에 사용되는 데이터를 탐색하고 이해하는 프로세스입니다. 여기에는 다음과 같은 태스크가 포함됩니다.
데이터 준비와 특성 추출은 MLOps 프로세스에서 중요한 단계입니다. 데이터 준비에는 모델 학습에 적합하도록 원시 데이터를 정리, 변환, 형식 지정하는 과정이 포함됩니다.
특성 추출에는 원시 데이터에서 모델 학습과 더 관련성 있고 유용한 새로운 특성을 만드는 작업이 포함됩니다. 이러한 단계는 고품질 데이터로 ML 모델을 학습하고 정확한 예측을 수행할 수 있도록 보장하기 위해 필수적입니다.
모델 학습 및 조정에는 가능한 최선의 성능을 얻기 위해 미리 준비된 데이터로 ML 모델을 학습하고 하이퍼매개변수를 최적화하는 과정이 포함됩니다.
모델 학습 및 조정을 위한 일반적인 태스크는 다음과 같습니다.
모델 검토 및 거버넌스는 책임감 있는 방식으로 그리고 윤리적으로 ML 모델을 개발 및 배포할 수 있도록 보장합니다.
모델 추론 및 서빙에는 학습된 ML 모델을 프로덕션에 배포하고 애플리케이션 및 최종 사용자가 사용할 수 있도록 제공하는 과정이 포함됩니다.
모델 모니터링에는 프로덕션에서 ML 모델의 성능과 동작을 지속적으로 모니터링하는 작업이 포함됩니다. 태스크에는 다음이 포함될 수 있습니다.
자동화된 모델 재학습에는 성능이 저하되거나 새 데이터가 제공되었을 때 ML 모델을 재학습하는 과정이 포함됩니다. 자동화된 모델 재학습에는 다음이 포함됩니다.