Table of Contents
파이썬 머신러닝 완벽 가이드
1 파이썬 기반의 머신러닝과 생태계 이해
2 사이킷런으로 시작하는 머신러닝
3 평가
4 분류
5 회귀
6 차원 축소
7 군집화
8 텍스트 분석
9 추천 시스템
파이썬 머신러닝 완벽 가이드
python
,
machine
,
learning
,
ml
,
guide
권철민 지음
예제 코드 :
https://github.com/wikibook/ml-definitive-guide
1 파이썬 기반의 머신러닝과 생태계 이해
머신러닝
의 개념
파이썬 머신러닝 생태계를 구성하는 주요 패키지
넘파이
데이터 핸들링 -
판다스
2 사이킷런으로 시작하는 머신러닝
사이킷런
소개와 특징
첫 번째 머신러닝 만들어 보기 -
붓꽃 품종 예측
하기
사이킷런의 기나 프레임워크 익히기
Model Selection 모듈 소개
데이터 전처리
사이킷런으로 수행하는
타이타닉 생존자 예측
3 평가
정확도
Accuracy
오차 행렬
정밀도
와
재현율
F1 스코어
ROC
곡선과
AUC
피마 인디언 당뇨병 예측
4 분류
분류
의 개요
결정 트리
앙상블
학습
랜덤 포레스트
GBM
Gradient Boosting Machine
XGBoost
eXtra Gradient Boost
LightGBM
분류 실습 -
캐글 산탄데르 고객 만족 예측
분류 실습 -
캐글 신용카드 사기 검출
스태킹 앙상블
5 회귀
회귀
소개
단순 선형 회귀
를 통한 회귀 이해
비용 최소화히기 -
경사 하강법
소개
사아킷런 LinearRegression을 이용한
보스턴 주택 가격 예측
다항 회귀
와 과(대)적합/과소적합 이해
규제 선형 모델 -
릿지
,
라쏘
,
엘라스틱넷
로지스틱 회귀
회귀 트리
회귀 실습 -
자전거 대여 수요 예측
회귀 실습 -
캐글 주택 가격 - 고급 회귀 기법
6 차원 축소
차원 축소
(Dimension Reductino) 개요
PCA
Principal Component Analysis
LDA
Linear Discriminant Analysis
SVD
Singular Value Decomposition
NMF
Non-Negative Matrix Factorization
7 군집화
K-평균
알고리즘 이해
군집 평가
평균 이동
GMM
Gaussian Mixture Model
DBSCAN
군집화
실습 -
고객 세그먼테이션
8 텍스트 분석
텍스트 분석
이해
텍스트 사전 준비 작업 -
텍스트 정규화
Bag of Words -
BOW
텍스트 분류 실습 -
20 뉴스그룹 분류
감성 분석
토픽 모델링
-
20 뉴스그룹
문서 군집화
소개와 실습
문서 유사도
한글 텍스트 처리 -
네이버 영화 평점 감성 분석
텍스트 분석 실습 - 캐글
Mercari Price Suggesion Challenge
9 추천 시스템
추천 시스템
의 개요와 배경
콘텐츠 기반 필터링
추천 시스템
최근접 이웃 협업 필터링
잠재 요인 협업 필터링
콘텐츠 기반 필터링
실습 -
TMDB 5000 영화 데이터 세트
아이템 기반 최근접 이웃 협업 필터링 실습
행렬 분해를 이용한
잠재 요인 협업 필터링
실습
파이썬 추천 시스템 패키지 -
Surprise