2021-09-08

Large-scale interactive object segmentation with human annotators

論文メモ

論文URL

http://openaccess.thecvf.com/content_CVPR_2019/papers/Benenson_Large-Scale_Interactive_Object_Segmentation_With_Human_Annotators_CVPR_2019_paper.pdf
CVPR2019で公開

ポイント

Google Researchが作成したOpenImagesデータセットに関する論文
- Instance Segmentation用の2.5M instancesデータセット
DeepLabV3 Xception65で推論したマスクを最大4クリック×4ラウンドで更新
Anotation時の重要事項
- 基準の明確化
  - 例
  - ベルトはズボンの一部か？
  - 首輪は猫の一部か？
  - 氷は飲み物の一部か？
- Annotatorが基準を理解しているかをテスト

f:id:y_kurashina:20210908002153p:plain

■Web Interface アノテーション基準も表示している f:id:y_kurashina:20210908002253p:plain

2021-09-05

Gated-SCNN: Gated Shape CNNs for Semantic Segmentation

論文メモ

論文URL

https://arxiv.org/pdf/1907.05740.pdf
2019年7月公開

ポイント

エッジを学習するパスを追加したsegmentationモデルGated SCNN
Gated Conv Layer
- SE Block風のアテンション機構になっている

f:id:y_kurashina:20210905221505p:plain f:id:y_kurashina:20210905221602p:plain f:id:y_kurashina:20210905221706p:plain

2021-09-05

Towards Accurate One-Stage Object Detection with AP-Loss

論文メモ

論文URL

http://openaccess.thecvf.com/content_CVPR_2019/papers/Chen_Towards_Accurate_One-Stage_Object_Detection_With_AP-Loss_CVPR_2019_paper.pdf
CVPR2019で公開

ポイント

1stage-detectorにおいて、ranking形式で背景とオブジェクトを分けるように学習
- オブジェクトが背景よりも高ランクになるようにするAP-Lossを提案
- パーセプトロンのアイデアを利用し、背景よりも低ランクのオブジェクトの係数を直接修正する
RetinaNet500でAP-Lossにより、COCO APが3%改善

f:id:y_kurashina:20210905005520p:plain f:id:y_kurashina:20210905005701p:plain

2021-09-03

Global Second-Order Pooling Convolutional Networks

論文メモ

論文URL

http://openaccess.thecvf.com/content_CVPR_2019/papers/Gao_Global_Second-Order_Pooling_Convolutional_Networks_CVPR_2019_paper.pdf
CVPR2019で公開

ポイント

平均だけでなく共分散を考慮したアテンションブロックGSoP Block(Global Second Order Pooling)を提案
- scSE blockの拡張版と思うと理解しやすい
- GSoPもchannel squeeze版とspatial squeeze版が有る

f:id:y_kurashina:20210903235406p:plain

2021-09-03

MVTec AD — A Comprehensive Real-World Dataset for Unsupervised Anomaly Detection

論文メモ

論文URL

http://openaccess.thecvf.com/content_CVPR_2019/papers/Bergmann_MVTec_AD_--_A_Comprehensive_Real-World_Dataset_for_Unsupervised_Anomaly_CVPR_2019_paper.pdf
CVPR2019で公開

ポイント

工業製品で現実的に生じるような細かい欠陥の異常検出評価用データセットMVTec ADを作成し、以下の既存のアルゴリズムを評価
AnoGan
- GANベースの手法で、学習が不安定
Autoencoder
- L2 LossとSSIM(Structural similiarity index) Lossを試用
- VAEは特に効果なしor劣化するとの先行研究が有ったらしい
CNN Feature Dictionary
GMM-Based Texture Inspection Model
Variation Model
全てに最高精度の方法は無かったが、Autoencoderが比較的優位な感じ

f:id:y_kurashina:20210903004507p:plain f:id:y_kurashina:20210903004553p:plain f:id:y_kurashina:20210903004618p:plain f:id:y_kurashina:20210903004642p:plain f:id:y_kurashina:20210903004805p:plain

2021-08-31

FCNN: Fourier Convolutional Neural Networks

論文メモ

論文URL

http://ecmlpkdd2017.ijs.si/papers/paperID11.pdf
2017年12月公開

ポイント

入力データをフーリエ変換し、周波数空間表示の畳み込みカーネルを学習
- 周波数空間では畳み込み演算が要素積になるため高速
- 入力画像と同じサイズのカーネルを学習していることと同値
max poolingの代わりにハイパスフィルタを導入
分類性能についてはイマイチ信用できない
- プロットが小さすぎて分からない
- 数値が明記されていない
- SOTAのCNNと比較しているわけではない
  - かなり古いネットワークを比較している雰囲気