데이터분석
빅데이터(BigData) 의미와 특징
미완wonder
2022. 11. 14. 23:35
Big Data
- 의미: 기존의 데이터베이스(DB) 관리 도구의 데이터 수집, 저장, 관리, 분석 역량을 넘어서는 데이터
- 발생 배경: 디지털 기기 보급과 SNS 부상 등
- 특징
앞에서부터 3V가 기본이지만 데이터로부터 가치를 얻어내는 것이 중요해진 후 5V까지, 최근에는 7V까지도 특징으로 언급하곤 함.
- volume = 크기
일반적으로 수십 TB, PB이상의 범위. - variety = 다양성
데이터 정형화 정도의 다양성(3가지)- 정형(structured) 데이터
: 고정된 필드에 저장. 일정한 형식. ex) excel 파일등의 테이블 형태의 데이터 - 반정형(semi-structured) 데이터
: 고정된 필드는 아니지만 메타데이터나 구조정보 (XML or HTML) 등. 일정한 구조는 없으나 구조파악 가능 데이터. - 비정형(unstructured) 데이터
: 고정된 필드에 저장 안 함. 최근 급증하는 데이트로 사진, 동영상, 메신저, 위치정보 등의 내용.
- 정형(structured) 데이터
- velocity = 속도
빠른 증가속도와 사용 속도. 실시간 처리의 중요성 증가. - veracity = 진실성
분석할만한 가치를 확인하기 위해 데이터의 신뢰성과 타당성 확인. - value = 가치
데이터로부터 인사이트를 얻어낼 수 있는가. - validity = 정확성
진실성과 비슷한 개념. - volatility = 휘발성
- volume = 크기
참고.
모두를 위한 R데이터 분석 입문
전공수업