본문 바로가기
데이터분석

[data mining] #1_데이터 마이닝이란_의미, 목적, 적용분야, 주요 알고리즘 종류

by 미완wonder 2022. 11. 3.

data mining(데이터 마이닝)

 

  1. 의미
    • 대량의 데이터로부터 규칙이나 패턴을 찾아내는 과정.
    • 분석 뿐만아니라 데이터 베이스, 데이터 관리, 데이터 전처리, 모형, 사후처리, 시각화 등의 단계도 포함.
  2. 목적
    • 데이터 셋으로부터 정보를 추출하여 추후 사용을 위해 이해할 수 있는 구조로 변환.
  3. 적용 분야 예
    • 기업의 의사결정: 표적 마케팅, 고객 성향 분석 및 세분화
    • 금융분야: 신용평가
  4. 주요 알고리즘 for predicton(예측) or classification(분류)
    1. 지도학습 = supervised learning: 결과값이 알려진 상황에서의 학습 모형
      • decision tree(의사결정나무) = tree model
      • logistic regression(로지스틱 회귀)
      • k-NN(인접이웃분류)
      • Bayes classification(베이즈 분류)
      • ANN(신경망)
      • SVM(서포트벡터머신)
    1. 비지도학습 = unsupervised learning: 별도의 결과값을 요구하지 않는 자료에 대한 분석 -> 오차 개념 없음.
      • cluster analysis(군집분석)
        • k-means clustering(k-평균군집)
        • hierarchical clustering(계층적 군집)
        • 혼합분포 군집
      • PCA(주성분분석) = Principal Component Analysis
      • 독립성분분석

 


이후 데이터 전처리와 모형 평가에 대해 포스팅 후 알고리즘에 대해 포스팅할 예정.

댓글