[Coursera][Muchine Learning] Model Representation
- 이 포스팅은 Andrew Ng 교수님의 Machine Learning 강의를 정리했습니다.
모델 표현(Model Representation)
Oregon과 Portland 도시의 주택 가격 데이터를 이용합니다.
x축은 집 크기를 나타내고 y축은 가격을 나타냅니다.
1250 제곱피트 크기의 집 가격을 추측해봅니다. 위 자료에 직선을 그려볼 수 있습니다. 그리고 이 직선에 근거해 220,000 달러라고 말할 수 있습니다.
이것이 ‘지도 학습’ 이라고 불리는 이유는 주어진 데이터에 대해 ‘적당한 답’을 주기 때문입니다. 위와 같은 예시는 가격을 예측하는 회귀 문제입니다.
우리는 위와같은 Training set (학습 데이터) 을 가지고 이 데이터로부터 어떻게 주택 가격을 예측할 지 학습시킵니다. 이제 기호를 정의합니다.
-
m = 학습 데이터의 수
-
x’s = 입력 변수 / feature(특성)
-
y’s = 출력 값 / target
-
(x, y) = 하나의 학습 데이터
-
(x(i), y(i)) = i 번째 학습 데이터
이제 지도 학습 알고리즘이 어떻게 작동하는지 배웁니다.
지도 학습 알고리즘은 결과 값으로 가설을 의미하는 h 로 나타냅니다. h는 새로운 집의 사이즈 x를 입력 값으로 받고 결과 값으로 그 집의 적당한 가격 y를 줍니다.
h 는 x에서부터 y까지의 지도다(h maps from x’s to y’s)
우리는 가설 h를 다음과 같이 표현할 것입니다.
이 식은 h(x) 로 표현하기도 합니다.
이 함수의 의미는 x의 선형함수는 y를 예측하는 것입니다. 이 모형을 선형 회귀 라고 부릅니다. 여기에서는 하나의 x 값으로 모든 가격을 예측하므로 다른 말로 ‘단일변량 선형 회귀’ 라고 부릅니다.