분류 전체보기
-
네트워크가 뭘까? 네트워크 기초 용어정의네트워크 기초 2020. 3. 15. 16:47
아무래도 이 글을 들어오신 대부분의 분들은 컴퓨터 네트워크에 관하여 궁금하기 때문에 들어오셨을 겁니다. 앞으로의 내용은 컴퓨터 네트워크에 관련되어 설명하는 글이니 참고하시고 재밌게 봐주세요. 우선 네트워크를 알려면 항상 단어의 정의 먼저 알아야 된다고 생각합니다. 네트워크란 무엇인가? 네트워크(network) : net (망) + work(일) , 즉 여러가지가 연결되어 조직적이고 효율적으로 움직일 수 있도록 만든 체계입니다. 네트워크라는 뜻은 컴퓨터 용어로 많이 등장하지만 사람과 사람, 도로와 철도, 물류 네트워크, 항만 네트워크 등 다양한 분야에서도 쓰이는 용어입니다. 하지만 컴퓨터와 컴퓨터 사이의 연결을 컴퓨터 네트워크라고 하며 이쪽(?) 분야에서 많이 등장하는 단어이기에 흔히 컴퓨터 네트워크를 네..
-
■ 분석방법론 - CRISP-DM데이터분석이론 2020. 2. 7. 22:44
CRISP-DM 분석방법론 배경 CRISP-DM 분석방법론은 1996년 ESPRIT의 프로젝트에서 시작되었으며, 주요 5개업체 (Daimler-Chrysler,SPSS,NCR,Teradata,OHRA)가 주도하였다. 2002년 2004년 2007년 2014년 설문조사에서 CRISP-DM 분석 방법론은 데이터 마이너들이 사용하는 최고의 방법론 이었다. 또한 표준 방법론이었던 SEMMA보다 3~4배 많이 사용하였다. 단계 CRISP-DM 분석방법론은 그림에 보이는 것처럼 크게 4가지 단계를 구조화하고 있다. 가장위의 레벨인 단계(Phases)는 프로세스 그룹을 통하여 완성된 개별 산출물이 생성된다. 단계는 여러개의 일반화 테스크(Generic Tasks)를 가지며 기본적으로 테스크는 단계를 구성하는 단위이며..
-
■ 분석방법론 - KDD데이터분석이론 2020. 2. 7. 22:36
KDD 분석 방법론 배경 Knowledge Discovery in Data base의 약자. Usama M. Fayyad(미국의 데이터사이언티스트,1965) 에 의해 고안된 분석방법론 중 하나로 데이터로부터 통계적 패턴과 규칙, 지식 습득 등을 하기 위해 활용할 수 있도록 정리된 데이터 마이닝이라고도 한다. 응용분야 데이터 마이닝, 기계학습(Machine Learning) ,패턴분석, 시각화 등. 분석 과정 1) 데이터 셋 선택(Selection) 비즈니스 도메인에 대한 이해와 프로젝트 목표 설정이 필수이다. 데이터베이스나 원시 데이터에서 분석에 필요한 데이터를 선택하는 단계이다. 데이터 마이닝에 필요한 목표데이터를 구성한다. 2) 전처리(Preprocessing) 추출한 데이터 셋에 있는 잡음과 이상치..
-
데이터베이스 활용(데이터베이스가 쓰이는 곳)(Database Uses)Database 2020. 2. 4. 19:52
데이터 베이스 활용 OLTP(갱신위주)- 호스트 컴퓨터와 온라인으로 접속된 여러 단말 간의 처리 형태. 여러 단말에서 보내온 메세지에 따라 호스트 컴퓨터가 데이터베이스를 엑세스하고, 바로 처리 결과를 돌려보내는 형태이다. 데이터 베이스를 수시로 변경하는 프로세싱이다.(주문입력시스템, 재고관리시스템) OLAP(조회위주) - 정보 위주의 분석 처리. 다양한 비즈니스 관점에서 쉽고 빠르게 다차원적인 데이터에 접근하여 의사 결정에 활용할 수 잇는 정보를 얻을 수 있게 해주는 기술이다. OLTP에서 처리된 트랜잭션 데이터를 분석해서 제품의 (판매 추이, 구매 성향파악, 재무 회계 분석) 등 을 프로세싱하는 것이다. CRM(고객관계관리) - 기업이 고객과 관련된 내, 외부 자료를 분석, 통합하여 고객 중심 자원을 ..
-
데이터(Data Definition) 와 DIKW데이터분석이론 2020. 2. 4. 14:57
데이터(Data)란? 정의 데이터는 라틴어 'Datum' 의 복수형인 'Data'에서 유래 했다. Datum : 자료 1. 컴퓨터가 처리할 수 있는 정성적, 정량적 데이터 포함 자료 2. 관찰이나 조사를 통하여 얻은 사실 3. 이론을 세우는 데 기초가 되는 사실. 또는 바탕이 되는 자료 4. 하나의 객체로서 의미뿐 아니라 다른 객체와의 관계 속에서 가치를 갖는 것 여기서 핵심은 데이터는 자료라는 것이다. 이 자료들을 가공하여 얻은 것이 정보가 된다. DIKW D(Data) : 데이터, 개별 데이터로는 의미가 있을 수도 없을 수도 있는 객관적인 사실 I(Information) : 정보, 데이터의 가공, 처리와 데이터간 연관속에서 의미가 도출된 것 K(Knowledge) : 지식, 정보를 구조화하여 의미있는..
-
빅데이터를 분석하는 방법과 순서(분석방법론)데이터분석이론 2020. 1. 16. 18:14
오늘은 빅데이터를 어떤 순서로 분석을 해나가면 되는지 공부해보았는데요, 빅데이터를 분석하는 단계는 크게 5단계가 있습니다. 단계별로 요약하였으니 구체적인 내용은 다음 블로그를 통하여 올리겠습니다. 먼저, 분석 기획을 해야 합니다. 분석 기획 단계는 비지니스 도메인(요소)과 문제점을 인식하고, 분석 계획과 프로젝트 수행계획을 세우는 단계입니다. 그 다음은 데이터 준비단계입니다. 데이터 준비 단계는 비지니스 요구사항과 필요한 데이터를 정의해 나가는 단계이라고 할 수 있습니다. 그 후 중요하고 시간도 많이 소비되는 데이터 분석단계입니다. 데이터 분석단계에서 정의한 소스 데이터를 분석용 데이터 집합으로 나누고, 다양한 데이터 마이닝 기법과 알고리즘을 이용하여 데이터를 분석하는 단계입니다. 이 과정에서는 데이터가..