Machine Learning 공부를 위한 책으로
Gareth James의 'An Introduction to Statistical Learning'이 좋다는 말을 듣고
관련된 내용을 공부하고 정리해보려 합니다.
즉, 이 책을 근본으로 하며 덧붙이는 내용은 Google 검색을
통해 직접 공부한 것입니다.
ㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡ
An Overview of Statistical Learning
Statistical Learning은 data를 이해하기 위한 도구들의 광대한 집합을 뜻합니다.
(이 책에서 Statistical Learning을 Machine Learning으로 이해하여도 무방하다고 생각합니다.)
Statistical Learning은 supervised (지도)와 unsupervised (비지도)로 나뉩니다.
Supervised learning : 각 input에 대한 output이 무엇인지 주어진 data에 대한 모델
Unsupervised learning : 각 input에 대한 output이 주어지지 않은 data에 대한 모델
Notation and Simple Matrix Algebra
Notation
- data의 개수
- variables의 개수
- i번째 data 중 j번째 변수의 값
예를 들어, 의 matrix는 다음과 같습니다.
는 의 transpose를 뜻합니다.
즉, 아래와 같습니다.
출처 : Gareth James - 'An Introduction to Statistical Learning'