Bias vs Variance
Deep dive into data
์์ฆ ๊ฐ์ฅ ๋ง์ด ๋๋ ์๊ฐ์ ๊ฐ๋ฐ์ ๋๋ฌด ๋ชปํ๊ณ ์๋ค๋ ์๊ฐ์ด๋ค. ์ํ ์
๋ฌด๋ฅผ ํ๋ค๋ณด๋ ์์งํด์ผ๋ ์
๋ฌด๋ค์ด ๋ง์์ง๊ณ ์ด์ ๋ฐ๋ผ์ ํ๋ก์ ํธ๋ ์ด๋ค ๊ณต๋ถ๋ฅผ ํ๊ธฐ๊ฐ ์ฐธ ์ด๋ ต๋ค๋ ์๊ฐ์ด ๋ค์๋ค. ๊ทธ๋ ๊ฒ ํด๊ทผํ๋ฉด์ ์ข
์ข
ํ
ํฌ ๊ด๋ จ ์ ํ๋ธ๋ค์ ๋ณด๋๋ฐ ์์ฆ ํฅ๋ฏธ๋กญ๊ฒ ๋ณธ ์ฑ๋์ CODER X DOX
๋ผ๋ ๋ถ์ด๋ค. (์ด๋ด ๋ ๋ ํ๋ฒ ์ ํ๋ธ์ ์ถ์ฒ์ด ๋๋จํ๋ค๊ณ ๋๋๋คโฆ Youtube Recommendations
๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ ๊ฐ์ด ๋ณด๋ฉด ์ข๋ค!)
์ด๋ถ์ Meta์ ML ์์ง๋์ด์ด์ ๋ฐ Leetcode
ํด์ค๊ณผ ML์ ๊ดํ ์์์ ๋ง์ด ์ฐ์ด์ฃผ์ ๋ค. ๊ทธ ์ค ์กฐ๊ธ ์ฌ๋ฏธ์๊ฒ ๋ดค๋ ๋ด์ฉ์ด ๋ชจ๋ธ์ ํธํฅ๊ณผ ๋ถ์ฐ
์ ๋ค๋ฃฌ ๋ด์ฉ์ด์๋ค. ๋๋ ๊ณต๋ถ๋ฅผ ํ ๋ ๋ญ๊ฐ ํ๋ฉด์ ์ผ๋ก๋ง ๋น์ฐํ์ง~ ํ๋ ๋ด์ฉ์ด์์ง๋ง ๊ณฑ์น์์๋ก ์ค์ํ๋ค๋ ์๊ฐ์ ๋ง์ด ํ์๋ค. ํนํ ML์ ๋ฐ์ดํฐ๊ฐ ๋์ฑ ์ค์ํ ๋ถ์ผ์ธ๋งํผ ํ ๋ฒ ์ง๊ณ ๊ฐ๋ คํ๋ค.
๊ณต๋ถํ ๋น์ ํท๊ฐ๋ ธ๋ ๋ด์ฉ, ์ trade-off ๊ด๊ณ์ธ์ง ๊ฐ์ด ๋ณด๋๋ก ํ์.
๐ช What is Bias?
Bias๋ ํ๊ตญ์ด๋ก ํธํฅ์ ๋ปํ๋ค. ํด๋น ์์์์๋ ์ข ๋ ๊ตฌ์ฒด์ ์ผ๋ก ๋ฐ์ดํฐ์์์ Bias / ๋ชจ๋ธ์์์ Bias๋ฅผ ์ค๋ช
ํด์ฃผ์ ๋ค. ๋ณดํต Bias๋ฅผ ๋งํ ๋๋ ๋ชจ๋ธ
๊ด์ ์์ ์ด์ผ๊ธฐ๋ฅผ ํ์ง๋ง ๋ฐ์ดํฐ์ bias๋ ์์๋ณด์
Data Bias
์ด๊ฑด ์์๋ฅผ ํตํด ์ค๋ช ํ๋ฉด ์ดํดํ๊ธฐ ์ฝ๋ค. ์ฐ๋ฆฌ๊ฐ ์์ ์ฌ์ง์ ๋ถ๋ฅํ๋ ํ์คํฌ๋ฅผ ๋งก์๋ค๊ณ ํ์. ๊ทผ๋ฐ ํ๋ณดํ ๋ฐ์ดํฐ์ ์ ๋ณด๋ ๊ณ ๊ธฐ ๊ด๋ จ ์ฌ์ง์ด ์ฃผ๋ฅผ ์ด๋ฃฌ๋ค๋ฉด ๋ชจ๋ธ์ ๋ฌด์์ ํ์ตํ ๊น? ๊ทธ๋ ๋ค. ๋ฐ๋ก ๊ณ ๊ธฐ์ ํน์ง์ ๋ค์ ํ์ตํด์ ๊ณ ๊ธฐ ์ฌ์ง์ ๊ธฐ๋ฅ์ฐจ๊ฒ ์ ๋ง์ถ์ง๋ง ๋์ฅ์ฐ๊ฐ, ๊น์น์ฐ๊ฐ ๋ฑโฆ ์ด๋ฐ ๊ฒ๋ค์ ๋ชป ๋ง์ถ ํ๋ฅ ์ด ์ปค์ง๋ ๊ฒ์ ๋งํ๋ค.
์ง๊ด์ ์ผ๋ก ๋ฐ์ดํฐ๊ฐ ๊ณ ๊ธฐ์ ํธํฅ๋์๋ค.
๋ผ๊ณ ํด์ํ ์ ์๋ค.
Model Bias
๊ทธ๋ ๋ค๋ฉด ๋ชจ๋ธ์์์ ํธํฅ๋์๋ค
๋ผ๋ ๋ง์ ์ด๋ค ์๋ฏธ์ผ๊น? ์์์์ ์ค๋ช
ํ๋ ํ ์ค ์์ฝ์ ๋ชจ๋ธ์ด ์ ํํ์ง ์๋ค
๋ผ๊ณ ๋ง์์ ํ์ ๋ค. ์ฐ๋ฆฌ๊ฐ Bias & Variance ๋ฅผ ๊ณต๋ถํ ๋ ๊ผญ ๋ณด๋ ๊ทธ๋ฆผ์ด ์๋ค. ๊ทธ๊ฑด ๋ฐ๋ก ๊ณผ๋
์์์ ๊ทธ๋ฆผ์ธ๋ฐ ์ฌ์ค ์ด๋ฒ ๊ธ์์๋ ๊ทธ ๊ทธ๋ฆผ์ ์ ๋ฃ๊ณ ์ค๋ช
ํ๋ ค ํ๋ค. ๊ทธ๋ฆผ์ ์๋ด๋ ๋ฐ๋ก ์ดํด๊ฐ ๋ ์ ์๊ธฐ ๋๋ฌธ์ด๋ค.
Bias๊ฐ ๋๋ค๋ ๊ฒ์ ์ง๊ธ ์ผ๋ฐํ ์ฑ๋ฅ์ด ์ ๋์ค์ง ์์ ๋ต์ ๋ชป ๋ง์ถ๊ณ ์๋ ์ํ๋ผ๊ณ ๋ณผ ์ ์๋ค. ์ด๊ฒ์ ์์ธ์ผ๋ก๋ ๋ชจ๋ธ์ ๊ฐ์ ์ ์๋ชปํ์ฌ ์ผ์ด๋ ๊ฒ์ด๊ณ ์ด๋ ๋ฐ์ดํฐ์ ๊ณผ์์ ํฉ๋๋ ์ด์ ์ด๋ค.
๊ทธ๋ ๋ค๋ฉด ์ด๋ป๊ฒ Bias๋ฅผ ๋ฎ์ถฐ ์ฐ๋ฆฌ์ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ์ฌ๋ฆด ์ ์์๊น? ๊ทธ๊ฑด ๋ฐ๋ก ๋ชจ๋ธ์ ๋ณต์ก๋ ์ฆ๊ฐ
๋ก ํด๊ฒฐํ ์ ์๋ค. ๋ชจ๋ธ์ ํ๋ผ๋ฏธํฐ complexity๊ฐ ๋ฎ์ ๋ฐ์ดํฐ๋ฅผ undefitting ํ๊ฒ ํ์ต์ ํ์๊ธฐ์ complexity ๋ฅผ ๋์ฌ ํด๋น ๋ฐ์ดํฐ์ ์ ๋ง๋ ๋ชจ๋ธ์ ๋ง๋ค ์ ์๋ค.
๐ถ๏ธ What is Variance?
๊ทธ๋ ๋ค๋ฉด Variance ๋ ๋ฌด์์ผ๊น? ํ๊ตญ์ด๋ก๋ ๋ถ์ฐ์ ๋ปํ๋ฉฐ ๋ชจ๋ธ์ Complexity ๋ฅผ ๋งํ๋ค. ์ฌ๊ธฐ์ Variance ๊ฐ ๋๋ค๋ ๋ป์ ๋ชจ๋ธ์ ๋ณต์ก๋๊ฐ ๋๋ค๋ ๋ป๊ณผ ์ผ๋งฅ์ํตํ๋ค. ๊ทธ๋ ๋ค๋ฉด High Variance ์ ๊ฒฝ์ฐ๋ ์ฃผ์ด์ง ๋ฐ์ดํฐ์๋ง ๋๋ฌด ์๋ง๋ ํจ์๋ฅผ ๋ง๋ค์๋ค๋ ๋ป์ด๊ณ ์ด๋ ๊ณง ์ผ๋ฐํ ์ฑ๋ฅ์ด ์ ์ข์ ๋ชจ๋ธ๋ก ํด์ํ ์ ์๋ค.
Variance ์ค์ด๊ธฐ
์ฐ๋ฆฌ๊ฐ ์ํ๋ ๊ฒ์ ์ผ๋ฐํ ์ฑ๋ฅ์ด ์ข์, ์ฆ ์ด๋ค ๋ฐ์ดํฐ์๋ ๋ต์ ์ ๋๋ก ๋งํ ์ ์๋ ๋ชจ๋ธ์ด ํ์ํ๋ฐ ์ด๋ฅผ ์ํด์๋ ์ด๋ป๊ฒ ํด์ผํ ๊น? ๋ฐ๋ก ๋ชจ๋ธ์ ๋ณต์ก๋๋ฅผ ์ค์ด๊ฑฐ๋ ์ด๋ ค์ด ํ๋ จ ๋ฐ์ดํฐ๋ฅผ ์ฃผ๋ ๋ฐฉ๋ฒ์ด ์๋ค. ์ด ๊ธ์ ์ฝ๋ค๋ณด๋ฉด ๋ญ๊ฐ ์ด์ํ ๊ฒ์ด๋ค. ์ฅ? ์๊น๋ ๋ชจ๋ธ์ ๋ณต์ก๋๋ฅผ ์ฌ๋ ค์ Bias๋ฅผ ์ค์ด๋ผ ํ๋๋ฐ ์ด๋ฒ์๋ Variance๋ฅผ ์ค์ด๊ธฐ ์ํด์ ๋ณต์ก๋๋ฅผ ์ค์ด๋ผ๊ณ ํ๋ค?
๊ทธ๋ ๋ค๋ฉด ์์ฃผ ์ ์ดํดํ ๊ฒ์ด๋ค. ์ฌ๊ธฐ์ ML์ ํต์ฌ, Bias & Variance Trade-off
๊ฐ ๋์จ๋ค.
๐ Trade-off
๋ฐฉ๊ธ ์์๋ฅผ ํตํด์ ์ค๋ช ์ ํ๊ธด ํ์ง๋ง ์ ์์ ์ง๊ณ ๋์ด๊ฐ์ผ ๋ ์ข์ ์๋ฃ๊ฐ ๋ ๊ฒ ๊ฐ๋ค.
์ฐ๋ฆฌ๊ฐ ์ค์ผ๋ ค๊ณ ๋ ธ๋ ฅํ๋ Cost(Error) ๋ ์ฌ์ค \(Bias^2 + Variance + noise\) ๋ก ๊ณ์ฐ์ด ๋๋ค. ์ฌ๊ธฐ์ \(noise\) ๋ ์ค์ผ ์ ์๋ ์ค์ฐจ, ์ฆ ๋ง ๊ทธ๋๋ก ๋ฐ์ดํฐ ์์ฒด์ ์๋ ์ก์์ ๋ปํ๋ฉฐ ์ด๋ฅผ ์์จ ์ ์๋ ๋ฐฉ๋ฒ์ ์ก์์ ์ ๊ฑฐํ๋ ๋ฐฉ๋ฒ ๋ฟ์ด๋ค. (์ฌ์ค ์ด ๋ง์ด ๋๊ฒ ์๊ธด๋ฐ ๊ทธ๋งํผ ์ด ์ก์์ ์์ ๋๊ฒ ์ฝ์ง ์๋ค๋ ๊ฒ์ด๋ค. ํนํ real world data ๋ผ๋ฉด ๋๋์ฑ!)
๋ํ Bias์ Variance ๊ฐ Trade-off ๊ด๊ณ์์ ์์๊ธฐ์ ์ฐ๋ฆฌ๊ฐ ์ด์ ์ง์คํด์ผํ ๋ฌธ์ ๋ ๋ฎ์ Bias๋ฅผ ๊ฐ์ ธ๊ฐ๋ ์ด๋ ์ ๋์ Variance๋ก ๋ง์ถฐ์ผํ ๊น?
๋ก ๋ฐ๋๊ฒ ๋๋ค. ๊ทธ๋ ๊ธฐ์ ํ์์ผ๋ก ๋์ค๋ ์ด๋ก ๋ค์ด ๊ท์ ๊ฐ ์๋ ๋ชจ๋ธ
, Early Stopping
๊ณผ ๊ฐ์ ๋ด์ฉ๋ค์ด ๋์ค๋ ๊ฒ์ด๋ค. ๋์ค์ ์ด๊ฒ๊ณผ ๊ด๋ จํ์ฌ์๋ ํ๋ฒ ๋ค๋ค๋ณด๋๋ก ํ๊ฒ ๋ค!
๐ Conclusion
์ด ๊ฐ๋ ์ด ์ฌ์ค ์์ฒญ ์ด๋ ต์ง๋ ์์ง๋ง ํ์ ์ด ๊ฐ์ฅ ๊ณ ๋ฏผํ๋ ๋ฌธ์ ๋ผ ์๊ฐํ๋ค. ์ฐ๋ฆฌ๊ฐ ์ํ๋ ๋ชจ๋ธ์ ์๋ฌด๋๋ ์ฒ์ ๋ณด๋ ๋ฐ์ดํฐ์ฌ๋ ๋ต์ ์ ๋ง์ถ๋, ์ฆ ์ผ๋ฐํ๊ฐ ๊ต์ฅํ ์๋ ๋ชจ๋ธ์ ์ํ์ง๋ง ๊ทธ ์ด๋ฉด์๋ Trade-off ๊ฐ ์๊ธฐ์ ์ด๋ฅผ ์ ํํํ๋ ๊ฒ์ด ์ค์ํ๋ค ์๊ฐํ๋ค.
๋ค์์๋ ์กฐ๊ธ ๋ ํ๋ถํ ๋ด์ฉ์ ๊ฐ์ง๊ณ ๋์์ค๊ฒ ๋ค!