Monthly Credit Card Balance를 이용하여 Default 여부를 예측하는 상황을 생각해봅시다.



일반적인 Linear Regression 모델을 통해 Default일 확률을 예측한 결과는 아래와 같습니다.



그림을 통해 알 수 있듯이

Balance가 0에 가까울 경우 Default일 확률이 음수이고

Balance가 매우 클 경우 Default일 확률이 1.0보다 커지게 됩니다.





이러한 문제를 해결하기 위해 사용하는 것이 Logistic Regression이고

위의 예시에 적용한 그림은 아래와 같습니다.



Pr(defalut = Yes|balance)를 라 하면

는 0과 1사이의 값입니다.


그리고 라면 default = Yes라고 할 수 있습니다.





확률이 0과 1 사이에 위치하게 만들기 위해 아래와 같은 logistic function을 사용합니다.