Machine Learning/기초 개념

[머신 러닝] 회귀와 분류 차이

꿈을 파는 두더지 2024. 7. 5. 11:21

지도 학습과 비지도 학습의 차이

회귀와 분류를 알아보기 전에, 지도 학습과 비지도 학습의 차이를 알아보아야 한다.
회귀와 분류는 지도 학습 안에 속해있기 때문이다.

 

지도 학습

말 그대로 정답이 있는 데이터를 활용해서 데이터를 학습하는 것이다.
입력 값 (X data)이 주어지면 입력 값에 대한 Label (Y data)를 주어 학습시키는 방식이다.

 

비지도 학습

지도 학습과 달리 정답 라벨이 없는 데이터를 비슷한 특징끼리 군집화해서 새로운 데이터에 대해 결과를 예측하는 방법이다.
라벨링 되어 있지 않은 데이터를 넣는 것이므로 학습해야 될 분량이 조금 더 많아질 수 밖에 없다.
지도 학습에서 적절한 피처를 찾아내기 위해 전처리 방법으로 비지도 학습을 이용하기도 한다.

아래는 지도학습과 비지도학습의 대표적인 알고리즘을 정리한 표이다.

 

분류와 회귀는 사용자가 주어진 데이터들을 라벨에 따라 분류하는 문제인 지도학습에 속한다.

 

분류 (Classification)

주어진 데이터를 정해진 카테고리(라벨)에 따라 분류하는 문제를 말한다.
분류는 맞다, 아니다 등의 이진 분류 문제 또는 사과다 바나나다 포도다 등의 2가지 이상으로 분류하는 다중 분류 문제가 있다.
이때 연속적인 (continous) 데이터로부터 결과를 예측한다.

 

회귀 (Regression)

회귀는 어떤 데이터들의 Feature를 기준으로, 연속된 값(그래프)을 예측하는 문제로 주로 어떤 패턴이나 트렌드, 경향을 예측할 때 사용된다. 즉 답이 분류 처럼 1, 0이렇게 딱 떨어지는 것이 아니고 어떤 수나 실수로 예측될 경우 회귀가 유리하다.