매일매일 IT

Machine Learning Framework : scikit-learn 본문

Programming Language/python

Machine Learning Framework : scikit-learn

Teeeeeeemo 2017. 8. 9. 14:36
  • 파이썬 머신러닝 라이브러리 !  scikit-learn
  • 다양한 분류기 지원
  • 머신러닝의 결과를 검증하는 기능 있음
  • 분류, 회귀, 클러스터링, 차원축소 등 다양한 알고리즘 지원
    • 분류 ( Classification ) : 특정 데이터에 레이블을 붙여 분류. ex) 스팸 메일 분류, 필기 인식, 증권 사기 등
    • 회귀 ( Regression ) : 과거의 데이터를 기반으로 미래의 데이터 예측. ex) 판매 예측, 주가 변동 등의 예측
    • 클러스터링 ( Clustering ) : 값의 유사성을 기반으로 데이터를 여러 그룹으로 나눔. ex) 사용자의 취향을 그룹으로 묶어 사용자 취향에 맞는 광고를 제공
    • 자원축소 ( Dimensionality Reduction ) : 데이터의 특성을 유지하면서 데이터의 양을 줄임. 특성을 유치한 채로 고차원의 데이터를 저차원의 데이터로 변환. 데이터를 시각화하거나 구조를 추출해서 용량을 줄여 계산을 빠르게 하거나 메모리를 절약할 때 사용.
  • 머신러닝을 바로 테스트 할 수 있는 샘플 데이터 또한 제공
  • pip3 install -U scikit-learn scipy matplotlib scikit-image
  • 데이터를 읽어 들이고 분할할 때 편리하게 사용할 수 있는 Pandas도 설치하장
  • pip3 install pandas 

  •  XOR 연산 학습해보기
    • svm : Support Vector Machine - 패턴 인식, 자료 분석을 위한 지도 학습 모델. 주로 분류, 회귀 분석에 이용
    • fit() : 학습 기계에 데이터를 학습 시킴
    • predict() : 데이터를 넣어 예측 시킴



    
    • 위의 코드를 scikit-learn 프레임워크를 사용해 간단하게 다시 작성하면 아래와 같다.
    • Pandas 모듈의 DataFrame 기능 사용.
    • metrics.accuracy_score() 함수를 이용하여 정답률을 쉽게 구할 수 있다.





Comments