医療系AIエンジニアの技術メモ

ディープラーニング(主に画像系)の技術メモブログです

2021-08-01から1ヶ月間の記事一覧

FCNN: Fourier Convolutional Neural Networks

* 入力データをフーリエ変換し、周波数空間表示の畳み込みカーネルを学習 * 周波数空間では畳み込み演算が要素積になるため高速 * 入力画像と同じサイズのカーネルを学習していることと同値 * max poolingの代わりにハイパスフィルタを導入 * 分類性能につい…

Regularized Evolution for Image Classifier Architecture Search

* Google Brain作成のAmoeba Net * 強化学習ではなく進化アルゴリズムでImageNet分類モデルを作成 * 強化学習よりも短時間で良い性能のモデルが得られた * Search SpaceはNASNetと同じ

Attention U-Net:Learning Where to Look for the Pancreas

* CT画像による腹腔内の臓器segmentation * 3D U-Netでconcatする前にattention gateを入れている * Attentionはチャンネル毎に入れている模様 * 参考文献[29]とgithubコードを斜め読みした印象 * 性能は1~2%改善、パラメータ数と処理速度は10%増加 * 評価…

Transfusion: Understanding Transfer Learning with Applications to Medical Imaging

* 医療画像(眼底画像、胸部X線)に対する転移学習の効果を調査 * ImageNetを使っても使わなくても、最終精度に有意差なし * 学習スピードは転移学習による効果大 * パラメータ初期値の平均と分散を学習済みパラメータから決めてやるだけでも学習スピードは…

Reconstructing cell cycle and disease progression using deep learning

* inception architectureベースのdeep flowにより細胞や眼底の状態をクラスタリング * 特徴量をt-SNEで可視化(3次元)すると変化の経過が綺麗に特徴量空間での連続分布していた * イレギュラーなもの(壊れた細胞)は異なる領域に存在しており、異物検出にも使…

Class-Balanced Loss Based on Effective Number of Samples

* サンプルのオーバーラップ確率をβとし、実効サンプル数を以下の式で計算 * Class-balanced Lossを実行サンプル数の逆数で計算 * Βはハイパーパラメータである。 * 論文では、0.9~0.9999で調整

Seizure detection by convolutional neural network-based analysis of scalpelectroencephalography plot images

* 脳波からてんかんを検出 * 脳波データを時系列処理するのではなく、プロット画像にしてCNNにかけている * 使っているモデルはVGG16.Chainerのバージョンも1.2と古く、とりあえず深層学習をしてみたと言う雰囲気 * LSTM等の時系列処理モデルとの比較は行わ…

Spatial As Deep: Spatial CNN for Traffic Scene Understanding

* 道路の白線検出 * Spatial CNNブロック * 1次元のconvを行or列方向にかける * Convの結果を次の行or列の入力に足す(residualライクなアイデア) * 下向き、上向き、右向き、左向きの4方向のブロックを使用 * 車等で隠れていても検出できる * 20行ごとの特…

Automatic anatomical classification of esophagogastroduodenoscopy images using deep convolutional neural networks

* AIメディカルサービスの論文 * 胃の部位認識 * 咽頭 * 食道 * 胃 * 上部 * 中部 * 下部 * 十二指腸 * CaffeでGoogLeNetを使用 * 学習データ27335(1施設:ただともひろ胃腸科肛門科、1750症例) * テストデータ17081(1施設:ただともひろ胃腸科肛門科、43…

Mask R-CNN

* Instance Segmentation * Faster R-CNNにsegmentation maskを追加 * head部で以下を並列処理 * classification * detection * segmentation * backbone * ResNeXt-101-FPN * FPN : Feature Pyramid Network

Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation

* DeepLab v3+ * V3からの変更点 * バックボーンがXception * Decorderパートを追加 * 簡易なものだが、U-Netのように全解像度でDecordしても効果が無かったとのこと * Multi grid methodは不使用

Xception: Deep Learning with Depthwise Separable Convolutions

* Inceptionを極端な設定にしたネットワーク * "extreme" version of inception * Inceptionではchannel方向と空間方向の相関は弱いと仮定し、1x1 convやaverage poolingをしてから3x3 convをかけている * Xceptionではchannnel方向と空間方向を完全に分離し…

Rethinking Atrous Convolution for Semantic Image Segmentation

* DeepLab v3 * ResNetのblock4をblock5~7にコピーして使用 * atrous convにより特徴量の解像度は落とさずに視野を広げている * Multi gridを採用 * ブロック内でのatrous conv rate(畳み込み画素間隔)を(2,4,8)と変えている * Atrous Spatial Pyramid Pool…

DeepLab: Semantic Image Segmentation withDeep Convolutional Nets, Atrous Convolution,and Fully Connected CRFs

* DeepLab v2 * Atrous Spatial Pyramid Pooling(ASPP)を追加 * 複数のrate(atrous convの畳み込み素子間隔)を統合して使用する。 * 最後の統合方法は明記されていない

SEMANTIC IMAGE SEGMENTATION WITH DEEP CONVOLUTIONAL NETS AND FULLY CONNECTED CRFS

* DeepLab v1の論文 * Segmentation * バックボーンはVGG16 * 第一層のcoarseなCNNをatrous convに変更 * DNNで求めた特徴量マップをConditional Random Field(CRF)で精細化 * CRFでは画素間の距離や色の差も考慮したエネルギー関数を定義して最適化している

LARGE BATCH TRAINING OF CONVOLUTIONAL NETWORKS

バッチサイズを大きくする(1000程度以上)場合、Layer-wise Adaptive Rate Scaling(LARS)を取り入れる必要がある

A Hitchhiker’s Guide On Distributed Training of Deep Neural Networks

* 大規模なハードウェア環境での高速学習に関する論文 * 精度はSynchronous SGDがAsynchronous SGDより良い * 最終結論でSynchronous SGDをrecommendしている * Layer-wise Adaptive Rate Scaling(LARS)を推奨 * 層ごとに、weightとgradの大きさから学習率を…

Progressive Neural Architecture Search

* Neural Architecture Search(NAS)を発展させたモデル自動生成手法 * Progressive NAS (PNAS) * ブロックを1段ずつ最適化 * 構成要素 * 3x3 Conv * 5x5 Conv * 7x7 Conv * 1x7 + 7x1 Conv * identity * 3x3 Average Pooling * 3x3 Max Pooling * 3x3 dilate…

Taskonomy: Disentangling Task Transfer Learning

* 画像のタスク間の関係を調査 * 教師データの多いタスク(ex. 画像分類)で学習したモデルをencorderとして使い、教師データの少ないタスク(ex. detection, segmentation, ...)を解く * decorder部分だけ学習する * encorderは複数モデルとすることも可能 * m…

Focus, Segment and Erase: An Efficient Network for Multi-Label Brain Tumor Segmentation

* 脳腫瘍のSegmentation * 以下のクラスごとのimbalanceに対処する必要がある * non-tumor * edema * enhancing core * necrosis * non-enhancing core * FSE-Net (Focus - Segment - Erase) * 入力 MRデータ * contrast-enhanced T1-weighted (T1c) image *…

The One Hundred Layers Tiramisu: Fully Convolutional DenseNets for Semantic Segmentation

* Dense-NetによるSegmentation * Encoder側で全部のフィルターをconcatするとパラメタが増えすぎる * フィルターの数が増えるだけでなく、spatial resolutionも上がるので。 * upsampleするフィルターは直前のDenseBlockで作られたもののみとして、フィルタ…

Error Corrective Boosting for Learning Fully Convolutional Networks with Limited Data

* Whole brain MRI T1 scan segmentation * SD-Net (SkipDeconv-Net) * ベースはU-Net(Skip connection) * Unpooling でup-samplingする * 学習方法 * FreeSurfer(既存のsegmentation手法)でアノテーションしたデータでpre-train * manual labelデータでfi…

Unsupervised Deep Embedding for Clustering Analysis

* DEC * Stacked Auto Encoder(SAE)ベースのクラスタリング 1. SAEを学習 1. 層ごとのAEを学習 1. SAE全体をfine tuning 1. encoderの特徴量の分布pとcentroidと特徴量の距離の分布qのKLダイバージェンスを最小化するように学習 1. centroidの位置だけでなく…

Learning to Segment Every Thing

* 大量のBounding Box教師データと少量のSegmentation教師データによりSegmentaitionを行う。 * Mask^x R-CNN を使用

Non-local Neural Networks

離れた場所の関連を計算するnon local blockを提案

Deep Extreme Cut: From Extreme Points to Object Segmentation

最も外側の4点をアノテーションし、その情報からSegmentationを行う。