01 데이터 수집의 이해
데이터 수집의 필요성
- 데이터의 수집 및 활용 능력에 따라 개인, 기업, 국가의 경쟁력이 결정
- 데이터 수집의 정의
- 단순히 데이터를 모으는 행위를 넘어, 수집된 데이터를
분석에 적합한 형태로 준비하는 과정
- 분석 목적에 적합한 유효한 데이터를 탐색
- 데이터를 수집할 수 있는 적절한 방법을 선택
- 데이터의 정확성을 유지할 수 있는 형식 및 주기 등을 결정
- 비즈니스, 연구, 일상생활, IT 서비스 등 사회 전 분야에서 의사결정을 위해 데이터 분석 결과를 활용
데이터의 품질
- 데이터 수집의 어려움
- 데이터 양의 문제
- 데이터 다양성의 문제
- 정확성과 일관성 문제
- 좋은 데이터의 조건
- 신뢰할 수 있는 결과를 도출하기 위해서는 충분한 데이터의
양 뿐만 아니라 품질이 중요 (즉, 개별적인 데이터의 정확성과 일관성도 판단도 필요)
- ISO 8000는 데이터 품질을 평가하는 기준 제시
- 정확성, 완전성, 일관성, 유효성, 적시성, 상호운영성
02 데이터의 유형
데이터의 유형 3가지 ( 정형, 비정형 반정형 )