비교적 큰 데이터 분석 시 고려할 사항들
아래와 같은 상황에서 주의하며 진행해야 할 프로세스에 대한 배운 바를 정리함
비교적 데이터가 커서 처리 실수로 인한 작업 시간 손실이 큰 경우 함께 작업해야 하기 때문에 멤버간 커뮤니케이션이 중요한 경우 시스템 개발이 아닌 데이터 분석 보고서 작성이 프로젝트 목적인 경우
고려할 점들
전처리 후 최종 분석용 데이터의 공유 및 Freezing 명확화: 서로 다른 데이터에 근거해서 작업할 경우 롤백 어려움 전처리 후 최종 분석용 데이터의 확정 철저 : 데이터 오류 및 추출 조건에 맞게 구성되었는지를 검토. 모든 재앙이 시작되는 지점. 아무리 강조해도 지나치지 않음. 최종 전달 가치가 문서이므로 맥락과 Insight 도출이 핵심이 되어야 하고, 이 점에 대해서 참여자들이 잘 공유하고 업무의 방향을 잡을 수 있도록 해야 함 데이터의 분포 확인이 우선적
* 계속 업데이트 예정
이 글은 2013년 01월 10일 Thu. 16시에 작성하였습니다.