CAHPTER 01 : 왜 지금이고 도전과제는 무엇인가
머신러닝 운영(Machine Learning Operations, MLOps은 조직과 비즈니스 리더들이 장기적 가치를 창출하고 데이터 사이언스, 머신러닝 및 AI를 주도할 때 리스크를 제거하는 데 도움이 되는 프로세스다.
1.1 MLOps와 도전 과제 정의하기
MLOps의 핵심은 머신러닝 모델 생애주기 관리의 표준화 및 간소화다.
머신러닝 모델 생애주기를 규모있게 관리하기 어려운 세 가지 주요 이유는 다음과 같다.
- 많은 의존성: 데이터는 지속적으로 변화하고, 비즈니스 요구사항도 변경된다.
- 동일한 언어를 사용하지 않은 이해 관계자들
- 소프트웨어 개발을 모르는 데이터 과학자
데이터는 항상 변화한다. 즉, 머신러닝 모델은 지속적으로 학습하고 새로운 입력에 적응한다.
1.2 리스트를 경함하기 위한 MLOps
지속적인 성능 모니터링과 조정이 운영에 필수적이다.
MLOps는 안전하고 신뢰할 수 있게 수행 하도록 보장해 주고, 머신러닝 모델 활용으로 인한 리스크를 경감해 준다.
1.2.1 리스크 평가
MLOps를 리스크를 경감하기 위한 방안으로써 검토할 때 아래와 같은 사항을 분석해야 한다.
- 특정 기간 동안 모델을 사용할 수 없는 리스크
- 특정 표본에 대해 잘못된 예측을 반환하는 리스크
- 시간이 지남에 따라 모델 정확도나 공정성이 떨어지는 리스크
- 모델을 유지보수하기 위한 기술이 손실될 리스크
리스크 평가의 기준은 보통 두 가지로서, 리스크의 발생확률과 영향도다.
이 두 가지 조합이 바로 리스크의 심각도이다.
1.2.2 리스트 경감
예측 모델은 학습한 데이터의 품질이 곧 모델의 품질이기 때문이다.
즉, 학습 데이터가 상용 환경을 충분히 반영하기 않았다면 모델은 상용 환경에서 좋은 성능을 보일 수 없다.
상용 환경이 바뀌면 모델의 성능이 급격히 저하되는 경우도 많다.
또 다른 주요한 리스크 요소는 머신러닝 모델의 성능이 작동 중인 상용 환경에 대단히 민감하게 영향을 받는다는 점이다.
소프트웨어나 운영체계의 버전도 상용 환경의 요소에 해당한다.
MLOps는 비즈니스에 치명적일 수 있는 잠재적 리스크를 줄이는 데 필수적인 요소가 된다.
MLOps를 기반으로 한 모니터링이 필수적이다.
1.2.3 책임 있는 AI를 위한 MLOps
의도
모델이 목적에 맞게 설계되고 작동하도록 보장하는 것
책무
기업 내 모든 AI 업무에 대한 중앙 통제 및 관리, 감사를 의미한다.
즉, 무언가 잘못되었을 때, 파이프라인의 어느 지점에서 발생하는지 쉽게 찾을 수 있어야 한다.
1.3 확장을 위한 MLOps
다음은 최소한의 MLOps 실천사례이다.
- 버전을 추적하고, 특히 설계 단계에서는 실험을 함께 수행하라.
- 다시 학습한 모델이 이전 버전보다 나은지 여부를 확인하라. 그리고 더 나은 모델을 상용에 배포하라.
- 모델 성능이 상용 환경에서 저하되지 않도록 하라. 매일 혹은 매월 정지적으로 확인하라.
본 글은 데이터이쿠의 < MLOps 도입 가이드 - 기업에서 머신러닝 모델을 가장 효율적을 운영하는 방법>을 읽고
중요하다고 생각되는 부분을 정리한 것 입니다.
https://product.kyobobook.co.kr/detail/S000001810502
'AI > MLOps' 카테고리의 다른 글
MLOps 개념과 필요성 : MLOps의 핵심 기능 (0) | 2023.04.08 |
---|