본문 바로가기
정보

데이터 분석 프로젝트 관리 방안

by Sunnyspotho 2024. 10. 15.

분석과제 관리를 위한 5가지 영역

과제 형태로 도출된 분석기회는 프로젝트를 통해서 그 가치를 증명 고 목표를 달성해야 합니다. 분석프로젝트는 다른 프로젝트 유형처럼 범위, 일정,  품질,관리, 리스크, 의사소통 등 영역별 관리가 수행되어야 할 뿐 아니라 다양한 데이터에 기 
반한 분석기법을 적용하는 특성 때문에 가지의 주요 속성을 고려한 추가적인 관리가 필요합니다. 분석과제관리에는 Data size, Data Complexity, Speed, Analytic Complexity, Accuracy&Precision 다섯 가지 항목으로 나눌 수 있습니다. 먼저 Data Size입니다. 분석하고자 하는 데이터의 양을 고려한 관리 방안 수립이 필요합니다. 하둡 환경에서의 엄청난 데이터양을 기반으로 분석하는 것과 기존 정형 데이터베이스에 있는 시간당 생성되는 데이터를 분석할 때의 관리방식은 차이가 날 수밖에 없습니다. 다음은 Data Complexity입니다. BI (Business Intelligence) 프로젝트처럼 정형 데이터가 분석 마트로 구성되어 있는 상태에서 분석을 하는 것과 달리 텍스트, 오디오, 비디오 등의 비정형 데이터 및 다양한 시스템에 산재되어 있는 원천 데이터들을 통합해서 분석 프로젝트를 진행할 때는, 초기 데이터의 확보와 통합뿐 아니라 해당 데이터에 잘 적용될 수 있는 분석 모델의 선정 등에 대한 사전 고려가 필요합니다. 다음은 Speed입니다. 분석결과가 도출되었을 때 이를 활용하는 시나리오 측면에서의 속도를 고려해야 합니다. 일 단위, 주 단위 실적의 경우에는 배치(Batch) 형태로 작업되어도 무방하지만 실시간으로 사기(Fraud)를 탐지하거나 고객에게 개인화된 상품과 서비스를 추천하는 경우에는 분석 모델의 적용 및 계산이 실시간으로 수행되어야 하기 때문에 프로젝트 수행 시 분석 모델의 성능 및 속도를 고려한 개발 및 테스트가 수행되어야 합니다. 4번째로 Analytic Complexity입니다. 분석 모델의 정확도와 복잡도는 트레이드오프 관계가 존재합니다. 분석 모델이 복잡할수록 정확도는 올라가지만 해석이 어려워지는 단점이 존재하므로 이에 대한 기준점을 사전에 정의해 두어야 합니다. 고객의 신용을 평가하는 마케팅 시나리오에서 분석모델을 활용하여 신용점수가 낮게 나올 때 어떠한 변수에 기인했는지를 모델에서 설명해 줄 수 없으면 영업, 마케팅 직원 입장에서는 해당 고객과의 소통이 어려워지는 단점이 존재하므로, 해석이 가능하면서도 정확도를 올릴 수 있는 최적모델을 찾는 방안을 사전에 모색해야 합니다. 마지막으로 Accuracy & Precision입니다. Accuracy는 모델과 실제 값 사이의 차이가 적다는 정확도를 의미하고 Precision은 모델을 지속적으로 반복했을 때의 편차의 수준으로써 일관적으로 동일한 결과를 제시한다는 것을 의미합니다. 분석의 활용적인 측면에서는 Accuracy가 중요하며, 안정성 측면에서는 Precision이 중요합니다. 그러나 Accuracy와 Precision은 트레이트오프가 되는 경우가 많기 때문에 모델의 해석 및 적용 시 사전에 고려해야 합니다.

분석 프로젝트 특성의 개요

분석가의 목표는 분석의 정확도를 높이는 것이지만 프로젝트의 관점에서는 도출된 분석 과제를 잘 구현하여 원하는 결과를 얻고 사용자가 원활하게 활용할 수 있도록 전체적인 과정을 고려해야하기 때문에 개별적인 분석 업무 수행뿐만 아니라 전반적인 프로젝트 관리 또한 중요합니다. 분석가의 입장은 데이터의 원천을 다루는 데이터 영역과 결과를 활용할 비즈니스 영역의 중간에서 분석 모델을 통한 조율을 수행하는 조정자의 역할이 핵심이 됩니다. 특히 분석 프로젝트에서는 데이터 영역과 비즈니스 영역의 현황을 이해하고 프로젝트의 목표인 분석의 정확도 달성과 결과에 대한 가치 이해를 전달하는 조정자로서의 분석가의 역할이 중요합니다. 조정자로서의 분석가가 해당 프로젝트의 관리자까지 겸임하게 되는 경우가 대부분이므로, 프로젝트 관리방안에 대한 이해와 주요 관리 포인트를 사전에 숙지하는 것이 필수적입니다. 분석 프로젝트는 도출된 결과의 재해석을 통한 지속적인 반복 및 정교화가 수행되는 경우가 대부분이므로 프로토타이핑 방식의 애자일 Agile) 프로젝트 관리방식에 대한 고려도 필요합니다. 데이터 분석의 지속적인 반복 및 개선을 통하여 의도했던 결과에 더욱 가까워지는 형태로 프로젝트가 진행될 수 있도록 적절한 관리 방안 수립이 사전에 필요합니다.