data mining(데이터 마이닝)
- 의미
- 대량의 데이터로부터 규칙이나 패턴을 찾아내는 과정.
- 분석 뿐만아니라 데이터 베이스, 데이터 관리, 데이터 전처리, 모형, 사후처리, 시각화 등의 단계도 포함.
- 목적
- 데이터 셋으로부터 정보를 추출하여 추후 사용을 위해 이해할 수 있는 구조로 변환.
- 적용 분야 예
- 기업의 의사결정: 표적 마케팅, 고객 성향 분석 및 세분화
- 금융분야: 신용평가
- 주요 알고리즘 for predicton(예측) or classification(분류)
- 지도학습 = supervised learning: 결과값이 알려진 상황에서의 학습 모형
-
-
- decision tree(의사결정나무) = tree model
- logistic regression(로지스틱 회귀)
- k-NN(인접이웃분류)
- Bayes classification(베이즈 분류)
- ANN(신경망)
- SVM(서포트벡터머신)
- 비지도학습 = unsupervised learning: 별도의 결과값을 요구하지 않는 자료에 대한 분석 -> 오차 개념 없음.
- cluster analysis(군집분석)
- k-means clustering(k-평균군집)
- hierarchical clustering(계층적 군집)
- 혼합분포 군집
- PCA(주성분분석) = Principal Component Analysis
- 독립성분분석
- cluster analysis(군집분석)
-
이후 데이터 전처리와 모형 평가에 대해 포스팅 후 알고리즘에 대해 포스팅할 예정.
'데이터분석' 카테고리의 다른 글
[data mining] 지도학습 #1_로지스틱 회귀(logistic regression)_R (0) | 2023.01.21 |
---|---|
[data mining] 지도 학습과 비지도 학습_정의, 목적, 예, 사용하는 변수 자료형 (2) | 2023.01.13 |
빅데이터(BigData) 의미와 특징 (0) | 2022.11.14 |
댓글