Large-scale interactive object segmentation with human annotators
Gated-SCNN: Gated Shape CNNs for Semantic Segmentation
スポンサーリンク
論文URL
https://arxiv.org/pdf/1907.05740.pdf 2019年7月公開
ポイント
- エッジを学習するパスを追加したsegmentationモデルGated SCNN
- Gated Conv Layer
- SE Block風のアテンション機構になっている
スポンサーリンク
Towards Accurate One-Stage Object Detection with AP-Loss
スポンサーリンク
論文URL
ポイント
- 1stage-detectorにおいて、ranking形式で背景とオブジェクトを分けるように学習
- RetinaNet500でAP-Lossにより、COCO APが3%改善
スポンサーリンク
Global Second-Order Pooling Convolutional Networks
スポンサーリンク
論文URL
ポイント
- 平均だけでなく共分散を考慮したアテンションブロックGSoP Block(Global Second Order Pooling)を提案
- scSE blockの拡張版と思うと理解しやすい
- GSoPもchannel squeeze版とspatial squeeze版が有る
スポンサーリンク
MVTec AD — A Comprehensive Real-World Dataset for Unsupervised Anomaly Detection
スポンサーリンク
論文URL
ポイント
- 工業製品で現実的に生じるような細かい欠陥の異常検出評価用データセットMVTec ADを作成し、以下の既存のアルゴリズムを評価
- AnoGan
- GANベースの手法で、学習が不安定
- Autoencoder
- L2 LossとSSIM(Structural similiarity index) Lossを試用
- VAEは特に効果なしor劣化するとの先行研究が有ったらしい
- CNN Feature Dictionary
- GMM-Based Texture Inspection Model
- Variation Model
- 全てに最高精度の方法は無かったが、Autoencoderが比較的優位な感じ
スポンサーリンク
FCNN: Fourier Convolutional Neural Networks
スポンサーリンク
論文URL
http://ecmlpkdd2017.ijs.si/papers/paperID11.pdf 2017年12月公開
ポイント
- 入力データをフーリエ変換し、周波数空間表示の畳み込みカーネルを学習
- 周波数空間では畳み込み演算が要素積になるため高速
- 入力画像と同じサイズのカーネルを学習していることと同値
- max poolingの代わりにハイパスフィルタを導入
- 分類性能についてはイマイチ信用できない
- プロットが小さすぎて分からない
- 数値が明記されていない
- SOTAのCNNと比較しているわけではない
- かなり古いネットワークを比較している雰囲気
スポンサーリンク