분석방법론#CRISP-DM#데이터분석#KDD
-
■ 분석방법론 - CRISP-DM데이터분석이론 2020. 2. 7. 22:44
CRISP-DM 분석방법론 배경 CRISP-DM 분석방법론은 1996년 ESPRIT의 프로젝트에서 시작되었으며, 주요 5개업체 (Daimler-Chrysler,SPSS,NCR,Teradata,OHRA)가 주도하였다. 2002년 2004년 2007년 2014년 설문조사에서 CRISP-DM 분석 방법론은 데이터 마이너들이 사용하는 최고의 방법론 이었다. 또한 표준 방법론이었던 SEMMA보다 3~4배 많이 사용하였다. 단계 CRISP-DM 분석방법론은 그림에 보이는 것처럼 크게 4가지 단계를 구조화하고 있다. 가장위의 레벨인 단계(Phases)는 프로세스 그룹을 통하여 완성된 개별 산출물이 생성된다. 단계는 여러개의 일반화 테스크(Generic Tasks)를 가지며 기본적으로 테스크는 단계를 구성하는 단위이며..