医療系AIエンジニアの技術メモ

ディープラーニング(主に画像系)の技術メモブログです

2019-04-01から1ヶ月間の記事一覧

Attention U-Net: Learning Where to Look for the Pancreas

* CT画像を用いた腹腔内臓器(膵臓、腎臓、脾臓)segmentation * 3D U-Netにattention構造を追加 * 基本的なアイデアは[scSE-Net](https://ai-engineer-memo.hatenablog.com/entry/2019/02/05/010030)のsSEブロックと同様、空間ピクセルごとにattention gateを…

Drop an Octave: Reducing Spatial Redundancy in Convolutional Neural Networks with Octave Convolution

* 畳み込み層に代わるOctave Convolution (OctConv)層をFacebook AIが提案 * 特徴量マップを空間上の高周波成分と低周波成分に分け、低周波成分を低解像度化しておくことで、メモリ使用量と計算コストを削減 * パラメータ数は通常の畳み込み層と変わらないこ…

NAS-FPN: Learning Scalable Feature Pyramid Architecture for Object Detection

* Google Brainが強化学習でモデル構造を決定した物体検出モデル * ベースは[RetinaNet](https://arxiv.org/pdf/1708.02002.pdf) * Feature Pyramid Network (FPN)ブロックの組み合わせを強化学習で生成 * 得られた組み合わせは、FPNブロックを増やすほど精…

Artificial Intelligence–Based Breast Cancer Nodal Metastasis Detection

* 病理画像(HE染色画像)から乳がんを検出するモデルLYNA(LYmph Node Assistant)をGoogle Brainが作成 * 技術的には[FCN](https://people.eecs.berkeley.edu/~jonlong/long_shelhamer_fcn.pdf)登場前夜にしばしば目にしたパッチベースのクラス分類を採用 …

Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

* CNNにおいて、任意サイズの入力画像から固定サイズの特徴量ベクトルを出力するSpatial Pyramid Pooling (SPP)層を提案 * 例えば、ImageNetで事前学習しているモデルの多くは、入力画像サイズが224x224となっており、処理対象画像サイズが224x224でない場合…