Global Second-order Pooling Convolutional Networks - 医療系AIエンジニアの技術メモ

SE Blockのような自己注意ブロックGSoP Block(Global Second order Pooling Block)を提案
- cSE Block(spatial squeeze and channel excitation)では空間成分をGlobal Average Pooling(平均)でつぶしているのに対し、GSoPでは共分散を利用する
- ブロック名のSecond orderは、共分散＝2次のモーメントであることから命名されている
- sSE Block(channel squeeze and spatial excitation)のようにチャンネル成分をつぶすブロックも提案されている
  - 論文では、オリジナルのSE block(＝cSE)との比較のみ行っている。

空間成分をつぶすGSoP Block (Fig1(b)

チャンネル成分をつぶすGSoP Block。channel-wise版との違いを以下に示す。

f:id:y_kurashina:20190714234212p:plain

GSoP-NetはResNetがベースになっている
- ablation studyではResNet-26、ImageNetでの評価はResNet-50を使用
conv2_x ～ conv5_xの各ステージの最後にGSoP Blockを追加
- ablation studyでchannel-wizeとposition-wiseのGSoP Blockをconcatした結果が最良となっていたため、最終的なImageNetでの評価もconcat版で行ったものと思われるが明記はされていない。なお、ablation study結果の考察として、後述のGSoP-Net1ではconcat版を使用するとchannel-wise結果より性能低下し、GSoP-Net2でもconcat版の結果は少ししか改善しないとの記述があることから、channel-wise版を採用した可能性も有る。
conv5_xの後の構造により2パターンのモデルを評価
- GSoP-Net1 ： GSoP Block + Global Average Pooling
- GSoP-Net2 ： iSQRT-COV
  - 2018年のCVPRで本論文の著者グループが提案したブロック。このブロックも共分散を利用している。

f:id:y_kurashina:20190714235824p:plain