매일매일 IT
Machine Learning Framework : scikit-learn 본문
- 파이썬 머신러닝 라이브러리 ! scikit-learn
- 다양한 분류기 지원
- 머신러닝의 결과를 검증하는 기능 있음
- 분류, 회귀, 클러스터링, 차원축소 등 다양한 알고리즘 지원
- 분류 ( Classification ) : 특정 데이터에 레이블을 붙여 분류. ex) 스팸 메일 분류, 필기 인식, 증권 사기 등
- 회귀 ( Regression ) : 과거의 데이터를 기반으로 미래의 데이터 예측. ex) 판매 예측, 주가 변동 등의 예측
- 클러스터링 ( Clustering ) : 값의 유사성을 기반으로 데이터를 여러 그룹으로 나눔. ex) 사용자의 취향을 그룹으로 묶어 사용자 취향에 맞는 광고를 제공
- 자원축소 ( Dimensionality Reduction ) : 데이터의 특성을 유지하면서 데이터의 양을 줄임. 특성을 유치한 채로 고차원의 데이터를 저차원의 데이터로 변환. 데이터를 시각화하거나 구조를 추출해서 용량을 줄여 계산을 빠르게 하거나 메모리를 절약할 때 사용.
- 머신러닝을 바로 테스트 할 수 있는 샘플 데이터 또한 제공
- pip3 install -U scikit-learn scipy matplotlib scikit-image
- 데이터를 읽어 들이고 분할할 때 편리하게 사용할 수 있는 Pandas도 설치하장
- pip3 install pandas
- XOR 연산 학습해보기
- svm : Support Vector Machine - 패턴 인식, 자료 분석을 위한 지도 학습 모델. 주로 분류, 회귀 분석에 이용
- fit() : 학습 기계에 데이터를 학습 시킴
- predict() : 데이터를 넣어 예측 시킴
- 위의 코드를 scikit-learn 프레임워크를 사용해 간단하게 다시 작성하면 아래와 같다.
- Pandas 모듈의 DataFrame 기능 사용.
- metrics.accuracy_score() 함수를 이용하여 정답률을 쉽게 구할 수 있다.
'Programming Language > python' 카테고리의 다른 글
[Machine Learning] SVM : Support Vector Machine (1) | 2017.08.16 |
---|---|
[Machine Learning] 이미지 내부 문자 인식하기 (0) | 2017.08.09 |
[Machine Learning] 붓꽃의 품종 분류하기 (0) | 2017.08.09 |
파이썬에서 YAML 다루기 (0) | 2017.08.08 |
파이썬에서 JSON 다루기 (0) | 2017.08.08 |
Comments