医療系AIエンジニアの技術メモ

ディープラーニング(主に画像系)の技術メモブログです

Large-scale interactive object segmentation with human annotators

スポンサーリンク


論文URL

http://openaccess.thecvf.com/content_CVPR_2019/papers/Benenson_Large-Scale_Interactive_Object_Segmentation_With_Human_Annotators_CVPR_2019_paper.pdf
CVPR2019で公開

ポイント

  • Google Researchが作成したOpenImagesデータセットに関する論文
    • Instance Segmentation用の2.5M instancesデータセット
  • DeepLabV3 Xception65で推論したマスクを最大4クリック×4ラウンドで更新
  • Anotation時の重要事項
    • 基準の明確化
      • ベルトはズボンの一部か?
      • 首輪は猫の一部か?
      • 氷は飲み物の一部か?
    • Annotatorが基準を理解しているかをテスト

f:id:y_kurashina:20210908002153p:plain

■Web Interface アノテーション基準も表示している f:id:y_kurashina:20210908002253p:plain


スポンサーリンク


Gated-SCNN: Gated Shape CNNs for Semantic Segmentation

スポンサーリンク


論文URL

https://arxiv.org/pdf/1907.05740.pdf
2019年7月公開

ポイント

  • エッジを学習するパスを追加したsegmentationモデルGated SCNN
  • Gated Conv Layer
    • SE Block風のアテンション機構になっている

f:id:y_kurashina:20210905221505p:plain f:id:y_kurashina:20210905221602p:plain f:id:y_kurashina:20210905221706p:plain


スポンサーリンク


Towards Accurate One-Stage Object Detection with AP-Loss

スポンサーリンク


論文URL

http://openaccess.thecvf.com/content_CVPR_2019/papers/Chen_Towards_Accurate_One-Stage_Object_Detection_With_AP-Loss_CVPR_2019_paper.pdf
CVPR2019で公開

ポイント

  • 1stage-detectorにおいて、ranking形式で背景とオブジェクトを分けるように学習
    • オブジェクトが背景よりも高ランクになるようにするAP-Lossを提案
    • パーセプトロンのアイデアを利用し、背景よりも低ランクのオブジェクトの係数を直接修正する
  • RetinaNet500でAP-Lossにより、COCO APが3%改善

f:id:y_kurashina:20210905005520p:plain f:id:y_kurashina:20210905005701p:plain


スポンサーリンク


Global Second-Order Pooling Convolutional Networks

スポンサーリンク


論文URL

http://openaccess.thecvf.com/content_CVPR_2019/papers/Gao_Global_Second-Order_Pooling_Convolutional_Networks_CVPR_2019_paper.pdf
CVPR2019で公開

ポイント

  • 平均だけでなく共分散を考慮したアテンションブロックGSoP Block(Global Second Order Pooling)を提案
    • scSE blockの拡張版と思うと理解しやすい
    • GSoPもchannel squeeze版とspatial squeeze版が有る

f:id:y_kurashina:20210903235406p:plain


スポンサーリンク


MVTec AD — A Comprehensive Real-World Dataset for Unsupervised Anomaly Detection

スポンサーリンク


論文URL

http://openaccess.thecvf.com/content_CVPR_2019/papers/Bergmann_MVTec_AD_--_A_Comprehensive_Real-World_Dataset_for_Unsupervised_Anomaly_CVPR_2019_paper.pdf
CVPR2019で公開

ポイント

  • 工業製品で現実的に生じるような細かい欠陥の異常検出評価用データセットMVTec ADを作成し、以下の既存のアルゴリズムを評価
  • AnoGan
    • GANベースの手法で、学習が不安定
  • Autoencoder
    • L2 LossとSSIM(Structural similiarity index) Lossを試用
    • VAEは特に効果なしor劣化するとの先行研究が有ったらしい
  • CNN Feature Dictionary
  • GMM-Based Texture Inspection Model
  • Variation Model
  • 全てに最高精度の方法は無かったが、Autoencoderが比較的優位な感じ

f:id:y_kurashina:20210903004507p:plain f:id:y_kurashina:20210903004553p:plain f:id:y_kurashina:20210903004618p:plain f:id:y_kurashina:20210903004642p:plain f:id:y_kurashina:20210903004805p:plain


スポンサーリンク


FCNN: Fourier Convolutional Neural Networks

スポンサーリンク


論文URL

http://ecmlpkdd2017.ijs.si/papers/paperID11.pdf
2017年12月公開

ポイント

  • 入力データをフーリエ変換し、周波数空間表示の畳み込みカーネルを学習
    • 周波数空間では畳み込み演算が要素積になるため高速
    • 入力画像と同じサイズのカーネルを学習していることと同値
  • max poolingの代わりにハイパスフィルタを導入
  • 分類性能についてはイマイチ信用できない
    • プロットが小さすぎて分からない
    • 数値が明記されていない
    • SOTAのCNNと比較しているわけではない
      • かなり古いネットワークを比較している雰囲気

f:id:y_kurashina:20210831001352p:plain f:id:y_kurashina:20210831001453p:plain


スポンサーリンク


Regularized Evolution for Image Classifier Architecture Search

スポンサーリンク


論文URL

https://arxiv.org/pdf/1802.01548.pdf
2018年2月公開

ポイント

f:id:y_kurashina:20210829235613p:plain f:id:y_kurashina:20210829235706p:plain f:id:y_kurashina:20210829235827p:plain


スポンサーリンク