[머신 러닝] 가중치 (W), 편향 (Bias)

Machine Learning/기초 개념

꿈을 파는 두더지 2024. 8. 14. 20:53

인공지능을 공부하면 처음 가중치 (W), 편향 (Bias)에 대한 단어가 계속 나오는데
이번에는 가중치와 편향에 대해서 알아볼까한다.

각 입력 신호가 결과 출력에 미치는 중요도를 조절하는 매개 변수 → 입력 값에 곱해지는 수
활성화 함수에 따라 기울기를 증가시킴 (기울기가 커질수록 모델에 더 많은 영향을 미치게 됨)

처음 들어온 데이터 (입력층)에서 다음 노드로 넘어갈 때 모두 같은 값이면 계속 같은 값이 나오기 때문에 입력 값에 곱해주면서 비중을 두고 다음 은닉층 (hidden layer)로 전달해주는 것이 목표이다.

뉴런의 활성화 조건을 결정해주는 매개변수 → 활성화 함수에서 설정된 임계값을 얼마나 쉽게 넘게 할 것인지 결정
(편향이 커질수록 그만큼 활성화 함수의 임계값을 넘기 어렵기 때문에 까다로움)
(편향이 작을수록 활성화되는 뉴런들이 많아져 복잡한 모델이 됨)

ex) y = wx + b라는 함수에서, wx + b가 양수가 되어 뉴런을 활성화시키고 싶으면 b가 wx보다 커야된다.

편향은 하나의 뉴런에서 활성화 함수를 거쳐 최종적으로 출력되는 값을 조절하는 역할을 해준다.

위의 그림에서 보면 입력값은 검은색 글이고, 가중치는 빨간색 글로 이루어져 있다.
해당 모델은 가중치가 -5.3으로 제일 큰 부분이 있으므로 이것에 대한 영향을 많이 받을 것이다.
가중치가 작을수록 출력 값에 큰 영향을 주지 않는다는 것이 핵심이다.

-2.97, +2.33 등 다양한 값들이 나올 수 있음.
최종적으로 나온 결과물에서 편향을 넣어줘 값을 변형시킬 수 있다.

노드를 통해 output을 도출할 때 activation function을 거치는 형태와 동일하다.
더욱 복잡하고 다양한 패턴을 학습할 수 있기 때문이다.

추가로 활성화 함수의 입력을 조정시켜주는 역할을 하는데, 활성화 함수를 통해 나온 결과 등을
다시 입력으로 사용할 때 편향을 통해 위치를 조정해줌으로써 효과적으로 활성화 함수의 동작 기준을 변형해줄 수 있다.

하나의 노드에서 다른 노드로 넘어갈 때 생기는 공식에서 가중치는 기울기 역할을 해주고 편향은 y값 역할을 해주는 것이다.
-> 뉴런을 활성화하려면 우리가 설정한 임계점을 넘어야한다.

[RNN] Language Model 정의와 N-gram Model (32)	2024.12.11
[RNN] 단어 의미 모델링 (24)	2024.11.20
[머신 러닝] 퍼셉트론과 인공 신경망 (33)	2024.08.12
[머신 러닝] 선형 회귀 (0)	2024.07.07
[머신 러닝] 회귀와 분류 차이 (1)	2024.07.05

미래지향 프로그래밍