NAS-FPN: Learning Scalable Feature Pyramid Architecture for Object Detection

論文メモ

* Google Brainが強化学習でモデル構造を決定した物体検出モデル * ベースは[RetinaNet](https://arxiv.org/pdf/1708.02002.pdf) * Feature Pyramid Network (FPN)ブロックの組み合わせを強化学習で生成 * 得られた組み合わせは、FPNブロックを増やすほど精…

2019-04-23

Artificial Intelligence–Based Breast Cancer Nodal Metastasis Detection

論文メモ

* 病理画像（HE染色画像）から乳がんを検出するモデルLYNA（LYmph Node Assistant）をGoogle Brainが作成 * 技術的には[FCN](https://people.eecs.berkeley.edu/~jonlong/long_shelhamer_fcn.pdf)登場前夜にしばしば目にしたパッチベースのクラス分類を採用 …

2019-04-15

Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

論文メモ

* CNNにおいて、任意サイズの入力画像から固定サイズの特徴量ベクトルを出力するSpatial Pyramid Pooling (SPP)層を提案 * 例えば、ImageNetで事前学習しているモデルの多くは、入力画像サイズが224x224となっており、処理対象画像サイズが224x224でない場合…

2019-03-24

“Why Should I Trust You?” Explaining the Predictions of Any Classifier

論文メモ

* 分類モデルの分類根拠理由を可視化する手法LIME (Local Interpretable Model-agnostic Explanations) を提案 * ある入力サンプルに対する分類モデルの振る舞いを人間が理解可能な簡易モデルで近似し、入力データのどの部分が分類に寄与したかを可視化 * 入…

2019-03-21

Mask Scoring R-CNN

論文メモ

* Instance segmentationを行う[Mask R-CNN](https://arxiv.org/pdf/1703.06870.pdf)を改良したMask Scoring R-CNN(MS R-CNN)を提案 * Mask R-CNNの問題点 * 物体認識スコアが高くても、segmentation maskの質が悪い(＝Ground TruthとのIoUが低い)ことがある…

2019-03-17

Transfusion: Understanding Transfer Learning with Applicationsto Medical Imaging

論文メモ

* ImageNetによる学習済みモデルを医療画像に転移学習し、その効果を検証 * Fundus photographs (眼底画像データセット) ResNet50を評価 * ChestXray14 (胸部X線画像データセット) DenseNet121を評価 * 転移学習、ランダムな初期値、初期値の平均と分散を学…

2019-03-17

Max-margin Class Imbalanced Learning with Gaussian Affinity

論文メモ

* クラスごとの教師データ数がアンバランスな場合に対応できるAffinity Lossが提案されている。 * 各クラスの特徴量をクラスタリングし、クラス境界のマージンを最大化する * クラスタのセントロイドと各サンプルの類似度をガウシアンで測っている * 概念的…

2019-03-02

CNN-RNN: a large-scale hierarchical imageclassification framework

論文メモ

* 画像分類の際、粗い分類(例：犬)と細かい分類(例：プードル)を同時に学習することで、細かい分類のみで学習するモデルよりも精度が向上する。 * CNNで抽出した特徴量をLSTMにかけ、構造化された分類を出力する(Fig1) * CNNのみのモデルに比べ、1～2%精度が…

2019-02-24

Class-Balanced Loss Based on Effective Number of Samples

論文メモ

* 損失関数計算時のクラスアンバランス補正項を提案している * 教師サンプル数の逆数でクラスアンバランスを補正するのではなく、実効サンプル数の逆数で補正 * 似たようなサンプルが多い場合、実効サンプル数は小さい

2019-02-17

Focal Loss for Dense Object Detection

論文メモ

* Object detectionを行うRetina Netの損失関数としてFocal Lossを提案 * Faster RNN系の2 stage detectorでは物体検出精度が高いのに対し、YOLO等の1 stage detectorでは高速な推論が可能 * 1 stage detectorで精度を高めるために、Focal Lossを提案 * Foca…

2019-02-17

Seizure detection by convolutional neural network-based analysis of scalp electroencephalography plot images

論文メモ

* 脳波画像から発作を検出 * 脳波の時系列データをハイパス・ローパス・ノッチフィルタにかけノイズ除去 * ノイズ除去した脳波データからプロット画像を作り、VGG16により発作を検出 * RNN系の時系列モデルとの精度比較は行われていない。

2019-02-11

Pyramid Scene Parsing Network

論文メモ

* ImageNet scene parsing challenge 2016、PASCAL VOC 2012 benchmark、Cityscapes benchmarkで1位を取ったSegmentation用モデル * Pyramid Pooling Moduleにより大域的特徴量を計算することで、画像のコンテキストを考慮したSemantic Segmentationを行う

2019-02-10

Error Corrective Boosting for Learning Fully Convolutional Networks with Limited Data

論文メモ

* 以下の条件で、脳のMRI画像をSegmentation * ラベル無しMRI画像は数多く有るが、医師によるラベル付きMRI画像が少ない * 既存のSegmentationソフトウェア(FreeSurfer)が有る * Error Correcting Boostingにより分類精度の低いクラスの学習を効率化 * 損失…

2019-02-10

BoxNet: Deep Learning Based Biomedical Image Segmentation Using Boxes Only Annotation

論文メモ

* Segmentationを弱教師付き学習で行う手法を提案 * 検出対象物体領域の長軸と4点の極点のみをアノテーション * 教師データ作成時間を10～30%程度に削減し、通常の教師付き学習結果と同等の精度を実現

2019-02-05

Concurrent Spatial and Channel `Squeeze & Excitation' in Fully Convolutional Networks

論文メモ

* [SE-Net](https://ai-engineer-memo.hatenablog.com/entry/2019/02/04/005845) で導入されたchannel単位のAttension＆gating機構(SE block)のアイデアをpixel単位のAttension＆gating機構(scSE block)に拡張し、U-Net等のSemantic Segmentation用モデルに…

2019-02-04

Squeeze-and-Excitation Networks

論文メモ

* ILSVRC2017画像分類コンペティションで1位となったモデル * 任意のCNNモデルにAttension＆gating機構を追加できるSE blockを提案 * 畳み込み層で計算された特徴量をそのまま使用するのではなく、入力画像に応じて有効な特徴量チャンネルを制御 * 計算コス…

医療系AIエンジニアの技術メモ

ディープラーニング（主に画像系）の技術メモブログです

2019-01-01から1年間の記事一覧

NAS-FPN: Learning Scalable Feature Pyramid Architecture for Object Detection

Artificial Intelligence–Based Breast Cancer Nodal Metastasis Detection

Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

“Why Should I Trust You?” Explaining the Predictions of Any Classifier

Mask Scoring R-CNN

Transfusion: Understanding Transfer Learning with Applicationsto Medical Imaging

Max-margin Class Imbalanced Learning with Gaussian Affinity

CNN-RNN: a large-scale hierarchical imageclassification framework

Class-Balanced Loss Based on Effective Number of Samples

Focal Loss for Dense Object Detection

Seizure detection by convolutional neural network-based analysis of scalp electroencephalography plot images

Pyramid Scene Parsing Network

Error Corrective Boosting for Learning Fully Convolutional Networks with Limited Data

BoxNet: Deep Learning Based Biomedical Image Segmentation Using Boxes Only Annotation

Concurrent Spatial and Channel `Squeeze & Excitation' in Fully Convolutional Networks

Squeeze-and-Excitation Networks