[๋ ผ๋ฌธ์ ๋ฆฌ๐] Learning Transferable Architectures for Scalable Imageย Recognition
Learning Transferable Architectures for Scalable Imageย Recognition
- NASNet -
๋ ผ๋ฌธ์๋ณธ๐
1. Introduction
์ด ๋ ผ๋ฌธ์์๋ convolution ๊ตฌ์กฐ๋ฅผ ๋์์ธํ๊ณ ๋ฐ์ดํฐ์ ์ ๊ตฌ์กฐ๋ฅผ ์ต์ ํ์ํค๊ธฐ์ํ ์๋ก์ด ํจ๋ฌ๋ค์์ธ NAS framework๋ฅผ ์ ์ํ๋ค.
NAS framework
๊ฐํํ์ต์ ์ฌ์ฉํด ๊ตฌ์กฐ๋ฅผ ์ต์ ํํ๋ ํ๋ ์์ํฌ
NASNet ํน์ง
- ๊ธฐ์กด์ ์ฌ๋์ด conv block์ ๋ง๋ค์๋ค๋ฉด, NASNet์ ๊ฐํํ์ต๊ณผ RNN์ ํ์ฉํด block์ ์ค๊ณํ์๋ค. ๐๐ป๐๐ป
- NAS ๋ฅผ ์ฐธ๊ณ ํ์์ง๋ง ์ฐจ์ด์ ์ด ์๋๋ฐ,
NAS : ์ ์ฒด ๋ชจ๋ธ ๊ตฌ์กฐ๋ฅผ search space๋ก ์ค์ NASNet : ๋ชจ๋ธ์ ๊ตฌ์ฑํ๋ convolutional layer ์ฐ์ฐ์ search space๋ก ์ค์ ํ์๋ค. ์ด๋ ๊ฒ ๋๋ฉด Search space์ ์๋ ๋ชจ๋ convolutional networks๋
weight๋ง ๋ค๋ฅด๊ณ ๊ตฌ์กฐ๋ ๋์ผํ convolutional layers
๋ฅผ ๊ฐ์ง๋ค.
์ด๋ ๊ฒ ์ต์ ์ cell ๊ตฌ์กฐ๋ง ์ฐพ์๋ด๋ฉด ๋๋
๊ฐ๋จํ ๋ฌธ์ ๊ฐ ๋๋ฉฐ, ์ด ๋ฐฉ์์ 2๊ฐ์ง ์ฅ์ ์ด ์๋ค.
(1) ์ ์ฒด ๋คํธ์ํฌ๊ตฌ์กฐ๋ฅผ ์ฐพ๋ ๊ฒ ๋ณด๋ค ๋น ๋ฅด๋ค. (NAS๋ณด๋ค ์ฝ 7๋ฐฐ ๋น ๋ฅด๋ค๊ณ ํจ)
(2) cell์ด ๋ค๋ฅธ ๋ฌธ์ ๋ค์๋ ์ ์ผ๋ฐํ ๋๋ค. (๋ค๋ฅธ ์ด๋ฏธ์ง ํฌ๊ธฐ์ ๊ตฌ์กฐ์๋ ์ ํฉํจ, cifar-10์์ ํ์ตํ ๋ชจ๋ธ์ imagenet์ ์ ์ด์์ผ๋ sota์ ์ ํ๋๋ฅผ ์ ์งํ๋ค.)
์ด ๋ ผ๋ฌธ์ ํต์ฌ์ ๋ค์๊ณผ ๊ฐ๋ค.
โCIFAR-10์์ NASNet(์ต์ ์๊ตฌ์กฐ)๋ฅผ ์ฐพ์๋ด์๊ณ , ํฐ ๋ณ๊ฒฝ์์ด ImageNet์ ์ ์ด์์ผ *SOTA ์ ํ๋๋ฅผ ๊ฐ์ ธ์๋ค.โ
*State-Of-The-Art
2. Related work
-
์ด ๋ ผ๋ฌธ์์ ์ ์ํ ๋ฐฉ๋ฒ์ ์ด์ ์ ๋ฐฉ์์ธ hyperparameter optimization๊ณผ ๊ด๋ จ์ด ์์ผ๋ฉฐ, ํนํ Neural Fabrics, DiffRNN, MetaQNN, DeepArchitect์ ๊ฐ์ ์ต๊ทผ์ ์ํคํ ์ณ๋ฅผ ๊ณ ์ํ๋ ์ ๊ทผ๋ฐฉ์์ ๊ด๋ จ์ด ์๋ค.
-
Evolutionary Algorithms๋ ๊ตฌ์กฐ ์ค๊ณ์ ๊ด๋ จ์ด ์์ง๋ง large scale์์๋ ๊ทธ๋ค์ง ์ข์ ๊ฒฐ๊ณผ๋ ์์
-
๋ค๋ฅธ neural network ์ interact ์ํค๊ฑฐ๋ metadata๋ก ํ์ตํ๋ ๋ฐฉ๋ฒ์ด ์ต๊ทผ ์ฃผ๋ชฉ๋ฐ๊ณ ์์ผ๋ ๋๋ถ๋ถ์ ImageNet๊ณผ ๊ฐ์ large scale๋ฐ์ดํฐ์์ ์ ์ฉํ์ง ์์
-
Search space์ ์ค๊ณ๋ LSTM๊ณผ Neural Architecture Search Cell์์ ์๊ฐ์ ๋ฐ์
-
VGG, Inception, ResNet/ResNext, Xception/MobileNet์ convolutional cell์ ๋ชจ๋๋ฌ ๊ตฌ์กฐ์ ๊ด๋ จ์ด ์์.
3. Method
3-1. NAS Overview
์ ๊ทธ๋ฆผ์ NAS์ ์ ์ฒด์ ์ธ ๋ชจ์ต์ ๋ณด์ฌ์ค๋ค.
๋จผ์ , Search Space์ ์๋ ํ๋ฅ ๊ฐ p๋ก ๋ถํฐ ์ํคํ ์ณ(์ํ๋ชจ๋ธ A)๋ฅผ ์์ธกํ๋๋ฐ, ์ด๋ A๋ ํน์ Validation set์ ๋ํด R ์ ํ๋๋ฅผ ๊ฐ์ง๋ค. ์ด accuracy๊ฐ์ controller๋ฅผ ์ ๋ฐ์ดํธํ๊ธฐ ์ํด ์ฌ์ฉ๋๋ค. ๊ทธ๋ผ์ผ๋ก์จ controller๋ ๋งค ์๊ฐ ๋ ์ข์ ๊ตฌ์กฐ๋ฅผ ์์ฑํ๊ฒ ๋ฉ๋๋ค.
3-2 Normal cell, Reduction cell
๋ชจ๋ image size์ ์ ์ฉํ ์ ์๋ ๊ตฌ์กฐ๋ฅผ ๋ง๋ค๊ธฐ ์ํด feature map์ input์ผ๋ก ๊ฐ์ ธ์ฌ ๋ ์ค์ํ ์ผ์ ์ํํ๋ ๋ convolutional cell์ด ํ์ํ๋ค.
1) Normal cell : ๊ฐ์ ์ฐจ์์ feature map ์ผ๋ก ๋ฐํ
2) Reduction cell : ๋์ด์ ๋๋น๋ฅผ ยฝ feature map์ผ๋ก ๋ฐํ
Block, Controller RNN
์๋ ๊ทธ๋ฆผ์ ์ ์ฒด์ ์ธ ๋คํธ์ํฌ ๊ตฌ์กฐ์์ ๊ฐ์ฅ ์์ ๋จ์์ธ Block
์ด๋ค. block์ 2๊ฐ์ hidden input์ ๋ฐ๊ณ 2๋ฒ์ operation์ ์ํํ๊ณ 1๋ฒ์ combine operation์ ์ํํ๋ค.
cell ์ฐพ๋ ๋ฐฉ๋ฒ ๐บ
Step 1: hi, hi-1๋ก๋ถํฐ hidden state ํ๋๋ฅผ ์ ํํ๋ค (hi๋ ํ์ฌ block์ hidden state, hi-1์ ์ด์ ๋ธ๋ฝ์์ ์์ฑ๋ hidden state๋ฅผ ์๋ฏธ)
Step 2: Step 1๊ณผ ๋์ผํ๊ฒ ๋ ๋ฒ์งธ hidden state ์ ํ
Step 3: Step 1์์ ์ ํ๋ hidden state์ ์ ์ฉํ ์ฐ์ฐ์ ์ ํ
Step 4: Step 2์์ ์ ํ๋ hidden state์ ์ ์ฉํ ์ฐ์ฐ์ ์๋์์ ์ ํํ๋ค
Step 5: ์๋ก์ด hidden state๋ฅผ ์์ฑํ๊ธฐ ์ํด Step3๊ณผ Step4์ ์ถ๋ ฅ ๊ฐ์ ๊ฒฐํฉํ ๋ฐฉ๋ฒ์ ์ ํ
๊ฒฐํฉํ๋ ๋ฐฉ๋ฒ์ (1) element-wise addition, (2) concatenation ๋ ๊ฐ์ง ์ค ํ๋๋ฅผ ์ ํํ๋ค
์ด๋ ๊ฒ Step1 ~ Step5 ๊ณผ์ ์ ํตํด ํ๋์ block์ด ์์ฑ๋๋ค.
๊ทธ๋ฆฌ๊ณ ์ด ํ๋ก์ธ์ค๋ฅผ 5๋ฒ ๋ฐ๋ณตํด 5๊ฐ์ ๋ธ๋ฝ์ ์์ฑํ๊ณ , 5๊ฐ์ block์ผ๋ก ํ๋์ Cell์ ์์ฑํ๊ฒ ๋๋ค.
์ด ํ๋ก์ธ์ค๋ก Reduction cell๊ณผ Normal Cell์ ์์ฑํด์ผ ํ๋ฏ๋ก RNN์ ๊ฐ ๋ ์ด์ด๋ 2x5B Soft max prediction์ ํ๋ค.
(์ฒ์ 5B predictions ์ Normal cell, ๋ ๋ฒ์งธ 5B prediction์ Reduction Cell ์ ์ํจ)
Architecture ์ ๊ฐ ๊ณผ์
์ ๊ทธ๋ฆผ๊ณผ ๊ฐ์ด B๋ฒ ๋ฐ๋ณตํ block์ด ํ๋์ cell์ ์ด๋ฃจ๊ฒ ๋๊ณ , normal cell๊ณผ reduction cell์ด ๋ฐ๋ณตํ๋ฉด์ ๋คํธ์ํฌ ๊ตฌ์กฐ๊ฐ ํ์ฑ๋๋ค.
Network Architecture
-
imageNet์ image size๋ 299x299๋ก 32x32 ์ธ CIFAR-10์ ๊ตฌ์กฐ๋ณด๋ค ํฌ๊ธฐ ๋๋ฌธ์ reduction cell ์ด ๋ ๋ง๋ค.
-
์ด๋ฏธ์ง ๋ถ๋ฅ ๋ฌธ์ ์ scale์ ๋ง์ถ๊ธฐ ์ํด ๋ฐ๋ณต ํ์ N๊ณผ initial convolutional filter์ ์๋ฅผ free parameter๋ก ๋๋ค.
-
๊ตฌ์ฑ๋ network๋ฅผ ํ ๋๋ก training data๋ก ํ์ต์ ์ํจ ๋ค validation accuracy๋ฅผ ์ธก์ ํด reward๋ก ์ฌ์ฉํ์ฌ ๊ฐํํ์ต์ ์ํํ๊ฒ ๋๋ค.
์ด๋ฒ ์ฝ๋๋ ์๋ฌด๋๋ ์ปดํจํฐ๊ฐ ์ง์ ์ํคํ ์ฒ๋ฅผ ์ ๋ฐ์ดํธํ๋ฉด์ ํ์ตํ๋ ๋ฐ๋ค๊ฐ GPU 500์ฅ์ผ๋ก 4์ผ์ ๋๋ ค์ ๋์ค๋ ๋ชจ๋ธ์ด๊ธฐ ๋๋ฌธ์ ๋ชจ๋ธ๊ตฌํ์ ๊ฑด๋๋ฐ์๋ค.
๊ทธ๋์ ๋ ผ๋ฌธ์ ๋์จ ์ด๋ฏธ์ง๋ฅผ ์ฐธ๊ณ ํ์ฌ reduction cell ๊ณผ normal cell์ ํ ๋๋ก ์์๋ก ๊ตฌํ์ ํด์ ๋๋ ธ์ง๋ง ํ ์คํธ acc๋ 64% ์ ๋๊ฐ ๋์๋ค. ใ ใ ๋๋ฒ๊น ์ ์ข ๋ ํด๋ณด๊ณ ์ฝ๋๋ฅผ ์ ๋ฆฌํด์ ์ฑ๋ฅ์ ์ฌ๋ฆฌ๋๋ก ํด์ผ๊ฒ ๋ค.
๋๊ธ๋จ๊ธฐ๊ธฐ