๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
  • GDG on campus Ewha Tech Blog
G-day (์ •๊ทœ ์„ธ์…˜)

Gdg on Campus Ewha - Part Exchange ์„ธ์…˜ 1์กฐ

by alisongeeone 2024. 11. 20.

Epoch & Batch Size

 

๐Ÿ’ก๋ชฉํ‘œ

 

๋ชจ๋ธ์˜ ์˜ˆ์ธก ๊ฐ’๊ณผ ์‹ค์ œ ๊ฐ’์˜ ์˜ค์ฐจ๋ฅผ ์ค„์ด๋Š” ๊ฒƒ

Epoch

  • ์ „์ฒด ๋ฐ์ดํ„ฐ ์…‹์„ ํ•™์Šตํ•œ ํšŸ์ˆ˜

epoch๊ฐ€ 10ํšŒ๋ผ๋ฉด, ํ•™์Šต ๋ฐ์ดํ„ฐ ์…‹ A๋ฅผ 10ํšŒ ๋ชจ๋ธ์— ํ•™์Šต ์‹œ์ผฐ๋‹ค๋Š” ์˜๋ฏธ

epoch ๋ฅผ ๋†’์ผ์ˆ˜๋ก, ์ ํ•ฉํ•œ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ์ฐพ์„ ํ™•๋ฅ ์ด ์˜ฌ๋ผ๊ฐ„๋‹ค. (์ฆ‰, ์†์‹ค ๊ฐ’์ด ๋‚ด๋ ค๊ฐ„๋‹ค.)

  • epoch๋ฅผ ์ง€๋‚˜์น˜๊ฒŒ ๋†’์ด๋ฉด?

๊ทธ ํ•™์Šต ๋ฐ์ดํ„ฐ ์…‹์— ๊ณผ์ ํ•ฉ๋˜์–ด ๋‹ค๋ฅธ ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•ด์„œ ์ œ๋Œ€๋กœ ๋œ ์˜ˆ์ธก์„ ํ•˜์ง€ ๋ชปํ•  ์ˆ˜๋„ ์žˆ๋‹ค.

 

Batch Size

๋ชจ๋ธ ํ•™์Šต ์ค‘ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ์—…๋ฐ์ดํŠธํ•  ๋•Œ ์‚ฌ์šฉํ•  ๋ฐ์ดํ„ฐ์˜ ๊ฐœ์ˆ˜ (์ฆ‰, ์—ฐ์‚ฐ ํ•œ ๋ฒˆ์— ๋“ค์–ด๊ฐ€๋Š” ๋ฐ์ดํ„ฐ์˜ ํฌ๊ธฐ)

  • ๋ฐฐ์น˜ํฌ๊ธฐ๊ฐ€ ๋งค์šฐ ํฌ๋ฉด?

ํ•œ ๋ฒˆ์— ์ฒ˜๋ฆฌํ•ด์•ผ ํ•  ๋ฐ์ดํ„ฐ์˜ ์–‘์ด ๋งŽ์•„์ง€๋ฏ€๋กœ, ํ•™์Šต ์†๋„๊ฐ€ ๋Š๋ ค์ง€๊ณ , ๋ฉ”๋ชจ๋ฆฌ ๋ถ€์กฑ ๋ฌธ์ œ๊ฐ€ ๋ฐœ์ƒํ•  ์œ„ํ—˜์ด ์žˆ๋‹ค.

  • ๋ฐฐ์น˜ํฌ๊ธฐ๊ฐ€ ๋งค์šฐ ์ž‘์œผ๋ฉด?

์ ์€ ๋ฐ์ดํ„ฐ๋ฅผ ๋Œ€์ƒ์œผ๋กœ ๊ฐ€์ค‘์น˜๋ฅผ ์—…๋ฐ์ดํŠธํ•˜๊ณ , ์ด ์—…๋ฐ์ดํŠธ๊ฐ€ ์ž์ฃผ ๋ฐœ์ƒํ•˜๋ฏ€๋กœ, ํ›ˆ๋ จ์ด ๋ถˆ์•ˆ์ •ํ•ด์ง„๋‹ค.

โ†’์ ์ ˆํ•œ Epoch์™€ Batch Size ๊ฐ’์„ ์˜ค์ฐจ๋ฅผ ์ตœ์†Œ๋กœ ํ•˜๋Š” ๋ชจ๋ธ์„ ์ฐพ์•„์•ผ ํ•จ


์ง€๋„ํ•™์Šต vs ๋น„์ง€๋„ํ•™์Šต

๋ชจ๋“  ๊ธฐ๊ณ„ํ•™์Šต ์•Œ๊ณ ๋ฆฌ์ฆ˜์€ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ(training set)๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ๊ธฐ๊ณ„๊ฐ€ ์Šค์Šค๋กœ ์ง€์‹์„ ํ•™์Šตํ•˜๊ณ , ์ด ์ ์—์„œ ์ง€๋„ํ•™์Šต๊ณผ ๋น„์ง€๋„ํ•™์Šต์€ ์ด๋Ÿฐ ์ ์„ ๊ณตํ†ต์ ์œผ๋กœ ์ง€๋‹ˆ๊ณ  ์žˆ์Œ.

 

ํ•ต์‹ฌ์ ์ธ ์ฐจ์ด๋Š” ํ•™์Šตํ•˜๋Š” ๋ฐ์ดํ„ฐ์˜ ๊ตฌ์„ฑ์ด ์„œ๋กœ ๋‹ค๋ฅด๋‹ค๋Š” ์ .

  1. ์ง€๋„ํ•™์Šต์˜ ์•Œ๊ณ ๋ฆฌ์ฆ˜๋“ค์€ ์ •๋‹ต์ด ์žˆ๋Š” ๋ฐ์ดํ„ฐ(label)๋“ค์„ ํ•™์Šต. ์ž…๋ ฅ ๊ฐ’(X data)์ด ์ฃผ์–ด์ง€๋ฉด ์ž…๋ ฅ๊ฐ’์— ๋Œ€ํ•œ Label(Y data)๋ฅผ ์ฃผ์–ด ํ•™์Šต์‹œํ‚ด. ๋ฐ์ดํ„ฐ์…‹์„ ์ด์šฉํ•ด ๋ฐ˜๋ณต์ ์œผ๋กœ ๋ฐ์ดํ„ฐ๋ฅผ ์˜ˆ์ธกํ•˜๊ณ  ์ •๋‹ต(label)๊ณผ์˜ ์˜ค์ฐจ๋ฅผ ์ค„์—ฌ๋‚˜๊ฐ€๋ฉฐ ํ•™์Šต. ์ง€๋„ ํ•™์Šต ๋ชจ๋ธ์€ ๋น„์ง€๋„ ํ•™์Šต ๋ชจ๋ธ๋ณด๋‹ค ๋” ์ •ํ™•ํ•œ ๊ฒฝํ–ฅ์ด ์žˆ์ง€๋งŒ ๋ฐ์ดํ„ฐ์— ์ ์ ˆํ•˜๊ฒŒ ๋ ˆ์ด๋ธ”์„ ์ง€์ •ํ•˜๋ ค๋ฉด ์‚ฌ์ „์— ์‚ฌ๋žŒ์˜ ๊ฐœ์ž…์ด ํ•„์š”ํ•จ. ์˜ˆ๋ฅผ ๋“ค์–ด ์ง€๋„ ํ•™์Šต ๋ชจ๋ธ์€ ์‹œ๊ฐ„, ๊ธฐ์ƒ ์กฐ๊ฑด ๋“ฑ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ†ต๊ทผ ์‹œ๊ฐ„์„ ์˜ˆ์ธกํ•  ์ˆ˜ ์žˆ์ง€๋งŒ ๋จผ์ € ๋น„๊ฐ€ ์˜ค๋Š” ๋‚ ์”จ๊ฐ€ ์šด์ „ ์‹œ๊ฐ„์„ ์—ฐ์žฅํ•œ๋‹ค๋Š” ๊ฒƒ์„ ์•Œ๊ธฐ ์œ„ํ•ด ํ›ˆ๋ จ์ด ํ•„์š”.
ex) classification, regression

 

2. ๋น„์ง€๋„ํ•™์Šต์˜ ์•Œ๊ณ ๋ฆฌ์ฆ˜๋“ค์€ ์ •๋‹ต(label) ์—†์ด ๋ฐ์ดํ„ฐ๋ฅผ ํ•™์Šต. ์ด๊ฒƒ์˜ ๋ชฉ์ ์€ ์ธ๊ฐ„์˜ ๊ฐœ์ž…์ด ์—†๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ์Šค์Šค๋กœ ํ•™์Šตํ•˜์—ฌ ๊ทธ ์†์˜ ํŒจํ„ด(pattern) ๋˜๋Š” ๊ฐ ๋ฐ์ดํ„ฐ ๊ฐ„์˜ ์œ ์‚ฌ๋„(similarity)๋ฅผ ํ•™์Šตํ•˜๊ฒŒ ํ•˜๊ธฐ ์œ„ํ•ด์„œ์ž„. ์ •๋‹ต ๋ผ๋ฒจ์ด ์—†๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ๋น„์Šทํ•œ ํŠน์ง•๋ผ๋ฆฌ ๊ตฐ์ง‘ํ™” ํ•˜์—ฌ ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•œ ๊ฒฐ๊ณผ๋ฅผ ์˜ˆ์ธกํ•˜๋Š” ๋ฐฉ๋ฒ•. ๋ผ๋ฒจ๋ง ๋˜์–ด์žˆ์ง€ ์•Š์€ ๋ฐ์ดํ„ฐ๋กœ๋ถ€ํ„ฐ ํŒจํ„ด์ด๋‚˜ ํ˜•ํƒœ๋ฅผ ์ฐพ์•„์•ผ ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ์ง€๋„ํ•™์Šต๋ณด๋‹ค๋Š” ์กฐ๊ธˆ ๋” ๋‚œ์ด๋„๊ฐ€ ์žˆ๋‹ค๊ณ  ํ•  ์ˆ˜ ์žˆ์Œ. ์‹ค์ œ๋กœ ์ง€๋„ ํ•™์Šต์—์„œ ์ ์ ˆํ•œ ํ”ผ์ฒ˜๋ฅผ ์ฐพ์•„๋‚ด๊ธฐ ์œ„ํ•œ ์ „์ฒ˜๋ฆฌ ๋ฐฉ๋ฒ•์œผ๋กœ ๋น„์ง€๋„ ํ•™์Šต์„ ์ด์šฉํ•˜๊ธฐ๋„ ํ•จ.

ex) clustering, association, dimensionality reduction

 


Activation Functions(ํ™œ์„ฑํ™” ํ•จ์ˆ˜)

ํ™œ์„ฑํ™” ํ•จ์ˆ˜ = ๋น„์„ ํ˜•์„ฑ์„ ๋ถ€์—ฌํ•˜๊ธฐ ์œ„ํ•œ ์žฅ์น˜!

ํ˜„์‹ค์„ธ๊ณ„์—๋Š” ์„ ํ˜•์ ์ธ ๋ฐ์ดํ„ฐ๋ณด๋‹ค ๋น„์„ ํ˜•์ ์ธ ๋ฐ์ดํ„ฐ๊ฐ€ ํ›จ์”ฌ ๋งŽ๋‹ค. ์ธ๊ณต์‹ ๊ฒฝ๋ง์—๊ฒŒ ํ›จ์”ฌ ๋ณต์žกํ•˜๊ณ  ๋‹ค์ฑ„๋กœ์šด ๋ฐ์ดํ„ฐ๋ฅผ ํ•™์Šต์‹œํ‚ค๊ธฐ ์œ„ํ•œ ๊ฒƒ์ด Activation Functions์ด๋‹ค.

<Activation Functions์˜ ์ข…๋ฅ˜>

Sigmoid Activation

- Tanh(hyperblic tangent) activation

- ReLU(rectified linear unit)activation

 

- Softmax activation + softplus

Binary classification->sigmoid activation

Multi class classification->softmax

unsure->ReLU

๋Œ“๊ธ€