医療系AIエンジニアの技術メモ

ディープラーニング（主に画像系）の技術メモブログです

Deep Learning–Assisted Diagnosis of Cerebral Aneurysms Using the HeadXNet Model

論文メモ

スポンサーリンク

f:id:y_kurashina:20190616194234j:plain — Fig1. 脳動脈瘤読影時のAI支援効果の評価方法

論文URL

https://jamanetwork.com/journals/jamanetworkopen/fullarticle/2735471?utm_campaign=articlePDF&utm_medium=articlePDFlink&utm_source=articlePDF&utm_content=jamanetworkopen.2019.5600
2019年6月公開

ポイント

CTA画像(造影剤を使用して血管を撮像したCT画像)から脳動脈瘤をsegmentationするモデルHeadXNetを作成
- 医学系の論文では珍しくAIモデルの作りこみに様々な工夫がみられ、co-senior authorとしてAndrew Ngが入っている影響を強く感じた。
- HeadXNetの性能は感度94.9%、特異度66.1%となっており、擬陽性をかなり許容するよう調整されている。
HeadXNetの支援により8人の医師の読影結果にどのような影響があるかを評価
- 感度が6%改善
- 精度が4%改善
- 医師間の読影結果の同一性をFleissのκ係数で測り、6%改善
- 特異度と読影時間は、統計上有意差無し
  - どちらの項目も今回の結果では一応改善している

HeadXNet

f:id:y_kurashina:20190616201211j:plain — Fig2. HeadXNet

U-Net風構造のモデル
入力は16スライスx192x192のvoxelデータ
encoderは50層のSE-ResNeXt
decoderでは3x3のtransposed convolutionによりup-sampling
学習方法
- 学習データ
  - 1施設662患者からの818データを使用
    - 内328データに最低1つの脳動脈瘤がある
  - 各スライス画像から頭蓋骨領域を切り出し、208x208にリサイズ
  - 192x192にrandom cropping
    - 推論時は中心192x192を切り出す
  - 脳動脈瘤が存在するvoxelが全イタレーションでの使用データの3割を占めるようデータサンプリング
- encoder部分をKinetics-600を用いて事前学習
  - Kinetics-600は人物の動作をラベル付けしたYoutubeビデオ
- イタレーション 0～10,000回
  - 学習率を0から線形に0.1まで増加
  - encoder部分はfreeze
- イタレーション 10,000～300,000回
  - cosine anealingで学習率スケジューリング
- stochastic depth dropoutを使用
- 脳動脈瘤が存在しないvoxelではdecoder部分を学習させない
- 損失関数はbinary cross entropy + Dice loss + auxiliary loss
  - encoderの出力から脳動脈瘤の有無を分類し、その結果のFocal Lossをauxiliary lossとして使用

HeadXNetの支援効果計測 (Fig1)

8人の医師を以下の2グループに分ける
- グループ1 ： 3人の放射線医師、1人の脳外科医、1人の研修医
- グループ2 ： 3人の放射線医師
グループ1はHeadXNetの支援無しでテストデータを読影し、2週間後に同じデータに対し、HeadXNetの支援有りで読影
グループ2はグループ1と逆で、先にHeadXNetの支援有りで読影を実施
HeadXNetの支援がある場合は、Fig1 Cのように脳動脈瘤の候補領域が赤く表示される
- 自由に表示／非表示を切り替えられる

評価結果

下記の図表にて、with augmentationもしくはaugmentedと書かれた結果がHeadXNetの支援結果