医療系AIエンジニアの技術メモ

ディープラーニング(主に画像系)の技術メモブログです

2019-06-01から1ヶ月間の記事一覧

Deep Learning–Assisted Diagnosis of Cerebral Aneurysms Using the HeadXNet Model

* CTA画像(造影剤を使用して血管を撮像したCT画像)から脳動脈瘤をsegmentationするモデルHeadXNetを作成 * 医学系の論文では珍しくAIモデルの作りこみに様々な工夫がみられ、co-senior authorとしてAndrew Ngが入っている影響を強く感じた。 * HeadXNetの性…

Objects as Points

* 多くの物体検出モデルでは、大量の物体候補領域を抽出し、NMS(Non-Maximum Suppression)により最終的な物体位置を選択している。 * 本論文で提案されたCenterNetでは、候補領域ではなく、物体中心位置を直接推定する * NMSが不要になり、高速で高精度なモ…

Stacked Hourglass Networks for Human Pose Estimation

* Fig1のように砂時計(Hourglass)型モジュールを繰り返し、人間の姿勢推定を行うネットワークStacked Hourglass Networkを提案 * encodeとdecodeを繰り返すことで広域的な特徴と局所的な特徴を何度も混ぜ合わせている * 個々のHourglassモジュールごとに姿勢…

Deep Layer Aggregation

* ResNetで導入されたresidual blockのような"浅い"skip connectionに留まらず、より"深い"aggregationを導入し、パラメータ数や演算回数の観点でより効率的なモデルDLA(Deep Layer Aggregation)を提案 * DLAでのaggregation nodeでは、出力層の異なる特徴量…

EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks

* モデルのスケールアップを行う場合、既存研究ではwidth(特徴量マップのチャンネル数)、depth(モデルの層数)、resolution(入力画像解像度)のいずれか1つもしくは2つだけ大きくすることが大半であったのに対し、本論文では3つのパラメータを同時に大きくする…

Deformable Convolutional Networks

* deformable convolutionとdeformable RoI poolingを提案 * 入力特徴マップの値に応じて、演算する画素を動的に変更する * 畳み込み層の場合、入力画素位置が変わる * Fig1(a)は3x3の通常の畳み込み層を2回行う場合のreceptive fieldの概念図 * Fig1(b)はde…