Epoch & Batch Size
๐ก๋ชฉํ
๋ชจ๋ธ์ ์์ธก ๊ฐ๊ณผ ์ค์ ๊ฐ์ ์ค์ฐจ๋ฅผ ์ค์ด๋ ๊ฒ

Epoch
- ์ ์ฒด ๋ฐ์ดํฐ ์ ์ ํ์ตํ ํ์
epoch๊ฐ 10ํ๋ผ๋ฉด, ํ์ต ๋ฐ์ดํฐ ์ A๋ฅผ 10ํ ๋ชจ๋ธ์ ํ์ต ์์ผฐ๋ค๋ ์๋ฏธ
epoch ๋ฅผ ๋์ผ์๋ก, ์ ํฉํ ํ๋ผ๋ฏธํฐ๋ฅผ ์ฐพ์ ํ๋ฅ ์ด ์ฌ๋ผ๊ฐ๋ค. (์ฆ, ์์ค ๊ฐ์ด ๋ด๋ ค๊ฐ๋ค.)
- epoch๋ฅผ ์ง๋์น๊ฒ ๋์ด๋ฉด?
๊ทธ ํ์ต ๋ฐ์ดํฐ ์ ์ ๊ณผ์ ํฉ๋์ด ๋ค๋ฅธ ๋ฐ์ดํฐ์ ๋ํด์ ์ ๋๋ก ๋ ์์ธก์ ํ์ง ๋ชปํ ์๋ ์๋ค.
Batch Size
๋ชจ๋ธ ํ์ต ์ค ํ๋ผ๋ฏธํฐ๋ฅผ ์ ๋ฐ์ดํธํ ๋ ์ฌ์ฉํ ๋ฐ์ดํฐ์ ๊ฐ์ (์ฆ, ์ฐ์ฐ ํ ๋ฒ์ ๋ค์ด๊ฐ๋ ๋ฐ์ดํฐ์ ํฌ๊ธฐ)
- ๋ฐฐ์นํฌ๊ธฐ๊ฐ ๋งค์ฐ ํฌ๋ฉด?
ํ ๋ฒ์ ์ฒ๋ฆฌํด์ผ ํ ๋ฐ์ดํฐ์ ์์ด ๋ง์์ง๋ฏ๋ก, ํ์ต ์๋๊ฐ ๋๋ ค์ง๊ณ , ๋ฉ๋ชจ๋ฆฌ ๋ถ์กฑ ๋ฌธ์ ๊ฐ ๋ฐ์ํ ์ํ์ด ์๋ค.
- ๋ฐฐ์นํฌ๊ธฐ๊ฐ ๋งค์ฐ ์์ผ๋ฉด?
์ ์ ๋ฐ์ดํฐ๋ฅผ ๋์์ผ๋ก ๊ฐ์ค์น๋ฅผ ์ ๋ฐ์ดํธํ๊ณ , ์ด ์ ๋ฐ์ดํธ๊ฐ ์์ฃผ ๋ฐ์ํ๋ฏ๋ก, ํ๋ จ์ด ๋ถ์์ ํด์ง๋ค.
โ์ ์ ํ Epoch์ Batch Size ๊ฐ์ ์ค์ฐจ๋ฅผ ์ต์๋ก ํ๋ ๋ชจ๋ธ์ ์ฐพ์์ผ ํจ
์ง๋ํ์ต vs ๋น์ง๋ํ์ต

๋ชจ๋ ๊ธฐ๊ณํ์ต ์๊ณ ๋ฆฌ์ฆ์ ํ๋ จ ๋ฐ์ดํฐ(training set)๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๊ธฐ๊ณ๊ฐ ์ค์ค๋ก ์ง์์ ํ์ตํ๊ณ , ์ด ์ ์์ ์ง๋ํ์ต๊ณผ ๋น์ง๋ํ์ต์ ์ด๋ฐ ์ ์ ๊ณตํต์ ์ผ๋ก ์ง๋๊ณ ์์.
ํต์ฌ์ ์ธ ์ฐจ์ด๋ ํ์ตํ๋ ๋ฐ์ดํฐ์ ๊ตฌ์ฑ์ด ์๋ก ๋ค๋ฅด๋ค๋ ์ .
- ์ง๋ํ์ต์ ์๊ณ ๋ฆฌ์ฆ๋ค์ ์ ๋ต์ด ์๋ ๋ฐ์ดํฐ(label)๋ค์ ํ์ต. ์ ๋ ฅ ๊ฐ(X data)์ด ์ฃผ์ด์ง๋ฉด ์ ๋ ฅ๊ฐ์ ๋ํ Label(Y data)๋ฅผ ์ฃผ์ด ํ์ต์ํด. ๋ฐ์ดํฐ์ ์ ์ด์ฉํด ๋ฐ๋ณต์ ์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ์์ธกํ๊ณ ์ ๋ต(label)๊ณผ์ ์ค์ฐจ๋ฅผ ์ค์ฌ๋๊ฐ๋ฉฐ ํ์ต. ์ง๋ ํ์ต ๋ชจ๋ธ์ ๋น์ง๋ ํ์ต ๋ชจ๋ธ๋ณด๋ค ๋ ์ ํํ ๊ฒฝํฅ์ด ์์ง๋ง ๋ฐ์ดํฐ์ ์ ์ ํ๊ฒ ๋ ์ด๋ธ์ ์ง์ ํ๋ ค๋ฉด ์ฌ์ ์ ์ฌ๋์ ๊ฐ์ ์ด ํ์ํจ. ์๋ฅผ ๋ค์ด ์ง๋ ํ์ต ๋ชจ๋ธ์ ์๊ฐ, ๊ธฐ์ ์กฐ๊ฑด ๋ฑ์ ๊ธฐ๋ฐ์ผ๋ก ํต๊ทผ ์๊ฐ์ ์์ธกํ ์ ์์ง๋ง ๋จผ์ ๋น๊ฐ ์ค๋ ๋ ์จ๊ฐ ์ด์ ์๊ฐ์ ์ฐ์ฅํ๋ค๋ ๊ฒ์ ์๊ธฐ ์ํด ํ๋ จ์ด ํ์.
ex) classification, regression
2. ๋น์ง๋ํ์ต์ ์๊ณ ๋ฆฌ์ฆ๋ค์ ์ ๋ต(label) ์์ด ๋ฐ์ดํฐ๋ฅผ ํ์ต. ์ด๊ฒ์ ๋ชฉ์ ์ ์ธ๊ฐ์ ๊ฐ์ ์ด ์๋ ๋ฐ์ดํฐ๋ฅผ ์ค์ค๋ก ํ์ตํ์ฌ ๊ทธ ์์ ํจํด(pattern) ๋๋ ๊ฐ ๋ฐ์ดํฐ ๊ฐ์ ์ ์ฌ๋(similarity)๋ฅผ ํ์ตํ๊ฒ ํ๊ธฐ ์ํด์์. ์ ๋ต ๋ผ๋ฒจ์ด ์๋ ๋ฐ์ดํฐ๋ฅผ ๋น์ทํ ํน์ง๋ผ๋ฆฌ ๊ตฐ์งํ ํ์ฌ ์๋ก์ด ๋ฐ์ดํฐ์ ๋ํ ๊ฒฐ๊ณผ๋ฅผ ์์ธกํ๋ ๋ฐฉ๋ฒ. ๋ผ๋ฒจ๋ง ๋์ด์์ง ์์ ๋ฐ์ดํฐ๋ก๋ถํฐ ํจํด์ด๋ ํํ๋ฅผ ์ฐพ์์ผ ํ๊ธฐ ๋๋ฌธ์ ์ง๋ํ์ต๋ณด๋ค๋ ์กฐ๊ธ ๋ ๋์ด๋๊ฐ ์๋ค๊ณ ํ ์ ์์. ์ค์ ๋ก ์ง๋ ํ์ต์์ ์ ์ ํ ํผ์ฒ๋ฅผ ์ฐพ์๋ด๊ธฐ ์ํ ์ ์ฒ๋ฆฌ ๋ฐฉ๋ฒ์ผ๋ก ๋น์ง๋ ํ์ต์ ์ด์ฉํ๊ธฐ๋ ํจ.
ex) clustering, association, dimensionality reduction
Activation Functions(ํ์ฑํ ํจ์)
ํ์ฑํ ํจ์ = ๋น์ ํ์ฑ์ ๋ถ์ฌํ๊ธฐ ์ํ ์ฅ์น!
ํ์ค์ธ๊ณ์๋ ์ ํ์ ์ธ ๋ฐ์ดํฐ๋ณด๋ค ๋น์ ํ์ ์ธ ๋ฐ์ดํฐ๊ฐ ํจ์ฌ ๋ง๋ค. ์ธ๊ณต์ ๊ฒฝ๋ง์๊ฒ ํจ์ฌ ๋ณต์กํ๊ณ ๋ค์ฑ๋ก์ด ๋ฐ์ดํฐ๋ฅผ ํ์ต์ํค๊ธฐ ์ํ ๊ฒ์ด Activation Functions์ด๋ค.
<Activation Functions์ ์ข ๋ฅ>
- Sigmoid Activation

- Tanh(hyperblic tangent) activation

- ReLU(rectified linear unit)activation

- Softmax activation + softplus


Binary classification->sigmoid activation
Multi class classification->softmax
unsure->ReLU
'G-day (์ ๊ท ์ธ์ )' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
Gdg on Campus Ewha - Part Exchange ์ธ์ 3์กฐ (1) | 2024.11.20 |
---|---|
[Part Exchange FE 7์กฐ] CSR vs SSR vs ISR, DOM๊ณผ Virtual DOM (0) | 2024.11.20 |
Gdg on Campus Ewha - Part Exchange ์ธ์ 8์กฐ (0) | 2024.11.20 |
[GDGoC Ewha] Part Exchange ์ธ์ (3) | 2024.11.18 |
[GDSC Ewha] GDG ์ด์ฒญ ์ธ์ (0) | 2024.01.22 |
๋๊ธ