모두를 위한 딥러닝 시즌2 - TensorFlow

Lab-05-1 Logistic Regression

sososoy 2021. 10. 27. 17:18

<Classification>

What is Binary(Multi-class) Classification?

variable is either 0 or 1 (0: positive / 1: negative)

Exam, Spam, Face, Tumor 등의 예시는 분류 기준에 따라 0: positive / 1: negative 이분법적인 값을 가진다.

 

<Logistic vs Linear>

Logistic: 셀 수 있고, 흩어져있다.

Linear: 셀 수 없고, 연속적이다.

 

공부를 많이 할수록 합격률이 높아진다.

=> 수치형 데이터

특정 값을 넣으면 점선처럼 연속적인 그래프가 나옴

하지만 우리가 원하는 값은 세모와 네모, 이분법적이고 이산적인 그래프가 필요하다.

 

0과 1을 잘 표현하기 위한 이 g함수 모델을 Hypothesis라고 하면,

Hypothesis를 통해 0과 1 사이의 결과값을 얻을 수 있다. 

 

 

z값이 커질수록 0에 수렴한다. 즉 1/1+0이 되므로 1을 결과로 얻을 수 있다.

그에 반해 z가 작아지면 1/1+∞가 되므로 0을 결과로 얻을 수 있다.

 

시그모이드 함수를 통해 연속적인 logistic functiondmf 0.5(decision boundary)를 기준으로 0.5보다 크면 1, 작으면 0이라고 두 가지 값으로 분류한다. 이를 통해 이분법적인 그래프를 얻는다.

linear인 경우, linear가 아닌 경우에도 가능하다.

특정 데이터가 들어왔을 때 네모와 세모를 구분하는 기준을 decision boundary라고 한다.

 

 

 

 

 

 

 

 

출처: https://youtu.be/XnHqv4PC0-M

모든 이미지 출처: http://bit.ly/2LQMKvk