[๋ ผ๋ฌธ์ ๋ฆฌ๐] Very Deep Convolutional Networks For Large-Scale Image Recognition
Very Deep Convolutional Networks For Large-Scale Image Recognition
- VGG16 -
๋ ผ๋ฌธ์๋ณธ๐
๋ ผ๋ฌธ ๋ด์ฉ๋ ๋จ์ํ๊ณ ๋ ์ด์ด ๊ตฌ์กฐ๋ ์ ์ ๋์จ ๊ตฌ์กฐ๋ค๋ณด๋ค ์ฌํํ๋ค. ๊ทธ๋ฐ๋ฐ ์ฑ๋ฅ์ด ๋ ์ข๋ค๋ ์ ๊ธฐํ๋ฉด์๋ ์ค๋๋ ์๋ฌ๋ฅผ ๊ณ ์น๋ฉฐ ๋ด ํ์ต์ ์ ์๋๋์ง ์๋ฌธ..ใ ใ
๋ ผ๋ฌธ์์ ๊ฐ์กฐํ๋๊ฒ์ ๋ฑ 2๊ฐ์ง์ด๋ค 3x3์ผ๋ก ์์ receptive field๋ฅผ ์ฌ์ฉํ์๊ณ layer depth ๊ฐ ๊น๋ค๋ ๊ฒ์ด๋ค! ์ง๊ณ ๋์ด๊ฐ๊ธฐ!
VGG-16 ์ฝ๋๊ตฌํ ํ์ด์ง. => VGG-16
1. ๊ฐ์
๋ณธ ๋ ผ๋ฌธ์์๋ ๋๊ท๋ชจ ์ด๋ฏธ์ง ์ธ์ํ๊ฒฝ์์์ CNN ๊น์ด์ ๋ฐ๋ฅธ ์ ํ๋์ ๋ํด ์ฐ๊ตฌํ์๋ค.
์ด ๋ ผ๋ฌธ์ ํต์ฌ์
(1) 3x3 ์ ์์ receptive field
(2) 16~19 layers ์ ๊น์ ๊ตฌ์กฐ
์ ์ฌ์ฉํจ์๋ ๊ธฐ์กด์ ๋ฐฉ๋ฒ๋ณด๋ค ๋ ์ข์ ์ฑ๋ฅ์ ๋ณด์ด๋ ๊ฒ์ด๋ค.
2. architecture
Vgg์ ๊ตฌ์กฐ๋ ํ์ ๊ฐ์ด 11, 13, 16, 19 layer์ ๋ฐ๋ฅธ ๋ชจ๋ธ๋ค์ด ์๋ค. (๋ด๊ฐ ๊ตฌํํ ๊ฒ์ D์ VGG-16 ์ด๋ค.)
์ฌ๊ธฐ์ ์ฃผ๋ชฉํ 2๊ฐ์ง ํต์ฌ๋ด์ฉ์ ๋ค์๊ณผ ๊ฐ๋ค.
7x7 Convolution layer ๋์ 3x3 Convolution layer์ฌ์ฉํ ์ด์ !
3x3 Convolutional layer์ 3๊ฐ ์ฌ์ฉํ๋ ๊ฒ์ 7x7 Convolutional layer์ 1๊ฐ ์ฌ์ฉํ๋ ๊ฒ๊ณผ ๊ฐ์ง๋ง, ํ๋ผ๋ฏธํฐ ์๊ฐ ์ ๋ค
ย ย ย ย ย ย ย ย ย ย ย $3(3^2C^2)<(7^2C^2)$
ํ๋ผ๋ฏธํฐ ์ ๊ณ์ฐํด๋ณด๋ 3X3์ ์ธ๋ฒ ์ฐ์ฐํ ๊ฐ์ด 7X7 ํ ๋ฒ ๋ณด๋ค ์ ์ ๊ฒ์ ํ์ธ!
1x1 Convolutional Layer๋ฅผ ํฌํจ์ํค๋ ์ด์ !
Convolutional Layer์ receptive field๋ฅผ ๊ฑด๋ค์ง ์๊ณ ๋ decision function์ ๋น์ ํ์ฑ์ ์ฆ๊ฐ์ํค๊ธฐ ์ํจ.
๋๊ธ๋จ๊ธฐ๊ธฐ