Deep Learning–Assisted Diagnosis of Cerebral Aneurysms Using the HeadXNet Model
スポンサーリンク
論文URL
ポイント
- CTA画像(造影剤を使用して血管を撮像したCT画像)から脳動脈瘤をsegmentationするモデルHeadXNetを作成
- 医学系の論文では珍しくAIモデルの作りこみに様々な工夫がみられ、co-senior authorとしてAndrew Ngが入っている影響を強く感じた。
- HeadXNetの性能は感度94.9%、特異度66.1%となっており、擬陽性をかなり許容するよう調整されている。
- HeadXNetの支援により8人の医師の読影結果にどのような影響があるかを評価
- 感度が6%改善
- 精度が4%改善
- 医師間の読影結果の同一性をFleissのκ係数で測り、6%改善
- 特異度と読影時間は、統計上有意差無し
- どちらの項目も今回の結果では一応改善している
HeadXNet
- U-Net風構造のモデル
- 入力は16スライスx192x192のvoxelデータ
- encoderは50層のSE-ResNeXt
- decoderでは3x3のtransposed convolutionによりup-sampling
- 学習方法
- 学習データ
- 1施設662患者からの818データを使用
- 内328データに最低1つの脳動脈瘤がある
- 各スライス画像から頭蓋骨領域を切り出し、208x208にリサイズ
- 192x192にrandom cropping
- 推論時は中心192x192を切り出す
- 脳動脈瘤が存在するvoxelが全イタレーションでの使用データの3割を占めるようデータサンプリング
- 1施設662患者からの818データを使用
- encoder部分をKinetics-600を用いて事前学習
- Kinetics-600は人物の動作をラベル付けしたYoutubeビデオ
- イタレーション 0~10,000回
- 学習率を0から線形に0.1まで増加
- encoder部分はfreeze
- イタレーション 10,000~300,000回
- cosine anealingで学習率スケジューリング
- stochastic depth dropoutを使用
- 脳動脈瘤が存在しないvoxelではdecoder部分を学習させない
- 損失関数はbinary cross entropy + Dice loss + auxiliary loss
- encoderの出力から脳動脈瘤の有無を分類し、その結果のFocal Lossをauxiliary lossとして使用
- 学習データ
HeadXNetの支援効果計測 (Fig1)
- 8人の医師を以下の2グループに分ける
- グループ1 : 3人の放射線医師、1人の脳外科医、1人の研修医
- グループ2 : 3人の放射線医師
- グループ1はHeadXNetの支援無しでテストデータを読影し、2週間後に同じデータに対し、HeadXNetの支援有りで読影
- グループ2はグループ1と逆で、先にHeadXNetの支援有りで読影を実施
- HeadXNetの支援がある場合は、Fig1 Cのように脳動脈瘤の候補領域が赤く表示される
- 自由に表示/非表示を切り替えられる
評価結果
- 下記の図表にて、with augmentationもしくはaugmentedと書かれた結果がHeadXNetの支援結果