Monthly Credit Card Balance를 이용하여 Default 여부를 예측하는 상황을 생각해봅시다.
일반적인 Linear Regression 모델을 통해 Default일 확률을 예측한 결과는 아래와 같습니다.
그림을 통해 알 수 있듯이
Balance가 0에 가까울 경우 Default일 확률이 음수이고
Balance가 매우 클 경우 Default일 확률이 1.0보다 커지게 됩니다.
이러한 문제를 해결하기 위해 사용하는 것이 Logistic Regression이고
위의 예시에 적용한 그림은 아래와 같습니다.
Pr(defalut = Yes|balance)를 라 하면
는 0과 1사이의 값입니다.
그리고 라면 default = Yes라고 할 수 있습니다.
확률이 0과 1 사이에 위치하게 만들기 위해 아래와 같은 logistic function을 사용합니다.
'An Introduction to Statistical Learning > 4. Classification' 카테고리의 다른 글
An Overview of Classification (0) | 2018.04.06 |
---|