医療系AIエンジニアの技術メモ

ディープラーニング(主に画像系)の技術メモブログです

論文メモ

Striking the Right Balance with uncertainty

クラスレベルとサンプルレベルの分類の不確定性を考慮して、マージンを最大化するLossを提案

Deep Learning for Chest Radiograph Diagnosis in the Emergency Department

* Lunitの胸部レントゲン画像用AIを救急での使用を想定して評価 * 1施設のみ * 後ろ向き試験

Bounding Box Regression with Uncertainty for Accurate Object Detection

BBoxのregression時にボックス位置の不確定性(ガウス分布の分散)をKL Divergenceで測り、その分散に基づきボックス位置を修正する

Precise diagnosis of intracranial hemorrhage and subtypes using a three-dimensional joint convolutional and recurrent neural network

* CT画像により脳出血の分類 * 1検査単位での検出とスライス単位での検出の両方に対応 * VGG16のFC層で各スライスに対し抽出した特徴量ベクトルを双方向GRUにかけ分類 * HU範囲別の3チャンネル化 * -50~150:正常部位と出血部位の判別 * 100~300:頭蓋内と…

Probabilistic End-to-end Noise Correction for Learning with Noisy Labels

* ラベルのアノテーションミスを推定し、修正したラベルにより分類モデルを学習するPENCIL(probabilistic end-to-end noise correction in labels)フレームワークを提案 * 数十%の大量のミスラベルが有っても一定の性能を確保している * 精度の高いラベルが…

SSAP: Single-Shot Instance Segmentation With Affinity Pyramid

* proposal-free instance segmentation * 先にセグメンテーションを行い、セグメンテーション結果および画素間の類似度に基づき物体を分ける

Three-Dimensional Endoscopy

* 内視鏡のMotion stereoで3次元計測 * Harris特徴量抽出 * 特徴点回りの15x15領域でフレーム間の相関係数を計算 * 最大相関係数のペア群が第一候補 * random samplingでoutlierを削除 * ちゃんと確認していないがRANSACのノリのはず * カメラパラメータを推…

Deep Learning and Conditional Random Fields-based Depth Estimation and Topographical Reconstruction from Conventional Endoscopy

* 大腸内視鏡画像を用いたDepth推定 * 教師データ * シミュレーション画像 * Phantom画像 * CTで立体構造を計測できる模様 * 豚の大腸画像 * テストにだけ使用 * 人の大腸画像 * 定性的な評価にのみ使用 * ALEX Netで抽出した特徴量をスーパーピクセル単位で…

Elastic Boundary Projection for 3D Medical Image Segmentation

* 臓器のセグメンテーション * 3Dデータを2Dのモデルで扱う手法が斬新 * でも、結果がパッとしない印象 * pivot(大量にばらまいている?)から放射状に境界までの距離を推論することでセグメンテーションを行う * 放射方向(Az, El)毎の境界までの距離を等緯…

Decoders Matter for Semantic Segmentation:Data-Dependent Decoding Enables Flexible Feature Aggregation

* Data-dependent Upsampling (DUpsampling)レイヤーを提案 * bilinearではなく入力データに基づきUpsamplingできるため、低解像度のまま各レイヤーの特徴量をconcatしても最終的なsegmentation精度を確保できる * DeepLabv3+でencoderの出力解像度を1/8では…

Object as Distribution

* bounding boxではなく2次元正規分布によるオブジェクト検出 * 純粋な物体検出では使用できずInstance segmentationが対象となると思うので、使い所が思いつかない * Instance segmentation用の教師データが無いと、正解となる平均&共分散を計算できない

Attention Guided Network for Retinal Image Segmentation

* 眼底画像の血管セグメンテーション * M-Netにattention機構を追加 * M-NetはU-Netの各段階にリサイズした入力画像も入力するモデルの模様

Collaborative Learning of Semi-Supervised Segmentation and Classification for Medical Images

* 眼底画像の病変セグメンテーション&鑑別(Classification) * 半教師付き学習 * セグメンテーションマスクが少ない * 画像分類時にattention mapも生成 * attention mapがセグメンテーションマスクと同等の物になるようadversarial lossも入れている

Large-scale interactive object segmentation with human annotators

* Google Researchが作成したOpenImagesデータセットに関する論文 * Instance Segmentation用の2.5M instancesデータセット * DeepLabV3 Xception65で推論したマスクを最大4クリック×4ラウンドで更新 * Anotation時の重要事項 * 基準の明確化 * 例 * ベルト…

Gated-SCNN: Gated Shape CNNs for Semantic Segmentation

* エッジを学習するパスを追加したsegmentationモデルGated SCNN * Gated Conv Layer * SE Block風のアテンション機構になっている

Towards Accurate One-Stage Object Detection with AP-Loss

* 1stage-detectorにおいて、ranking形式で背景とオブジェクトを分けるように学習 * オブジェクトが背景よりも高ランクになるようにするAP-Lossを提案 * パーセプトロンのアイデアを利用し、背景よりも低ランクのオブジェクトの係数を直接修正する * RetinaN…

Global Second-Order Pooling Convolutional Networks

* 平均だけでなく共分散を考慮したアテンションブロックGSoP Block(Global Second Order Pooling)を提案 * scSE blockの拡張版と思うと理解しやすい * GSoPもchannel squeeze版とspatial squeeze版が有る

MVTec AD — A Comprehensive Real-World Dataset for Unsupervised Anomaly Detection

* 工業製品で現実的に生じるような細かい欠陥の異常検出評価用データセットMVTec ADを作成し、以下の既存のアルゴリズムを評価 * AnoGan * GANベースの手法で、学習が不安定 * Autoencoder * L2 LossとSSIM(Structural similiarity index) Lossを試用 * VAE…

FCNN: Fourier Convolutional Neural Networks

* 入力データをフーリエ変換し、周波数空間表示の畳み込みカーネルを学習 * 周波数空間では畳み込み演算が要素積になるため高速 * 入力画像と同じサイズのカーネルを学習していることと同値 * max poolingの代わりにハイパスフィルタを導入 * 分類性能につい…

Regularized Evolution for Image Classifier Architecture Search

* Google Brain作成のAmoeba Net * 強化学習ではなく進化アルゴリズムでImageNet分類モデルを作成 * 強化学習よりも短時間で良い性能のモデルが得られた * Search SpaceはNASNetと同じ

Attention U-Net:Learning Where to Look for the Pancreas

* CT画像による腹腔内の臓器segmentation * 3D U-Netでconcatする前にattention gateを入れている * Attentionはチャンネル毎に入れている模様 * 参考文献[29]とgithubコードを斜め読みした印象 * 性能は1~2%改善、パラメータ数と処理速度は10%増加 * 評価…

Transfusion: Understanding Transfer Learning with Applications to Medical Imaging

* 医療画像(眼底画像、胸部X線)に対する転移学習の効果を調査 * ImageNetを使っても使わなくても、最終精度に有意差なし * 学習スピードは転移学習による効果大 * パラメータ初期値の平均と分散を学習済みパラメータから決めてやるだけでも学習スピードは…

Reconstructing cell cycle and disease progression using deep learning

* inception architectureベースのdeep flowにより細胞や眼底の状態をクラスタリング * 特徴量をt-SNEで可視化(3次元)すると変化の経過が綺麗に特徴量空間での連続分布していた * イレギュラーなもの(壊れた細胞)は異なる領域に存在しており、異物検出にも使…

Class-Balanced Loss Based on Effective Number of Samples

* サンプルのオーバーラップ確率をβとし、実効サンプル数を以下の式で計算 * Class-balanced Lossを実行サンプル数の逆数で計算 * Βはハイパーパラメータである。 * 論文では、0.9~0.9999で調整

Seizure detection by convolutional neural network-based analysis of scalpelectroencephalography plot images

* 脳波からてんかんを検出 * 脳波データを時系列処理するのではなく、プロット画像にしてCNNにかけている * 使っているモデルはVGG16.Chainerのバージョンも1.2と古く、とりあえず深層学習をしてみたと言う雰囲気 * LSTM等の時系列処理モデルとの比較は行わ…

Spatial As Deep: Spatial CNN for Traffic Scene Understanding

* 道路の白線検出 * Spatial CNNブロック * 1次元のconvを行or列方向にかける * Convの結果を次の行or列の入力に足す(residualライクなアイデア) * 下向き、上向き、右向き、左向きの4方向のブロックを使用 * 車等で隠れていても検出できる * 20行ごとの特…

Automatic anatomical classification of esophagogastroduodenoscopy images using deep convolutional neural networks

* AIメディカルサービスの論文 * 胃の部位認識 * 咽頭 * 食道 * 胃 * 上部 * 中部 * 下部 * 十二指腸 * CaffeでGoogLeNetを使用 * 学習データ27335(1施設:ただともひろ胃腸科肛門科、1750症例) * テストデータ17081(1施設:ただともひろ胃腸科肛門科、43…

Mask R-CNN

* Instance Segmentation * Faster R-CNNにsegmentation maskを追加 * head部で以下を並列処理 * classification * detection * segmentation * backbone * ResNeXt-101-FPN * FPN : Feature Pyramid Network

Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation

* DeepLab v3+ * V3からの変更点 * バックボーンがXception * Decorderパートを追加 * 簡易なものだが、U-Netのように全解像度でDecordしても効果が無かったとのこと * Multi grid methodは不使用

Xception: Deep Learning with Depthwise Separable Convolutions

* Inceptionを極端な設定にしたネットワーク * "extreme" version of inception * Inceptionではchannel方向と空間方向の相関は弱いと仮定し、1x1 convやaverage poolingをしてから3x3 convをかけている * Xceptionではchannnel方向と空間方向を完全に分離し…