AI/ML

(ML) Supervised Learning - Linear Regression

K_Hyul 2023. 5. 1. 12:41
728x90

Linear Regression 이란? 

독립 변수 x와 종속 변수 y의 선형 상관 관계를 모델링한 회귀분석 기법이며

𝑓(𝑥) = 𝑦' ≈ 𝑦 을 만족해야 한다.

여기서 𝑓(𝑥) =  a𝑥 + b로 쓸 수 있다.

Fig 1. Linear regression 예시

 

이때, Data point와 model's prediction(Output)의 차이를 Cost라 한다.

Cost의 값이 클 수록 model의 quality는 떨어지므로 우리는 Cost 값을 최소화 해야한다.

 

Cost  Functions의 종류는 

- Mean Absolute Error (MAE)

- Mean Squared Error (MSE)

- Cross-Entropy

- Hinge Loss

- Kullback-Leibler Divergence (KL-Divergence)

- MuchX3 more customized loss functions

- Residual Sum of Squares (RSS)

 

등이 있고 이 중에 골라서 문제를 해결하면 된다.

 

우리는 python의 sklearn.linear_model (pip scikit-learn)을 활용하면 손쉽게 LinearRegression을 사용 할 수 있다.

여기서 Cost function은 RSS 임을 참고하고 model를 짜야한다.

 

 

 

 

 

 

 

[참조]

1) Fig 1, 내용

https://ko.wikipedia.org/wiki/%EC%84%A0%ED%98%95_%ED%9A%8C%EA%B7%80#%EB%8A%A5%ED%98%95_%ED%9A%8C%EA%B7%80_%EB%B6%84%EC%84%9D%28Ridge_regression%29

 

728x90