Magicode logo
Magicode
4

ChexNetで学ぶCNNの解釈

畳み込みニューラルネットワークの推論過程の解釈法をCheXNetを例に学ぶ。

CheXNetとは

概要

CheXNet article

主旨:2017年に公表された、NIHの公開している14疾患のラベル付き胸部X線画像に対して肺炎検出タスクをCNNに学習させ、放射線技師を上回るF1スコアを出せたという論文。肺炎検出という2値分類タスクから、14疾患の検出という多クラス分類タスクへと拡張し、過去のモデルを上回るAUROCスコアもだせたとも言っている。

画像のどこが推論に対して影響力が大きいか表したヒートマップ(CAMs)も導入している。

image.png

Dataset

  1. 30805人の患者の112120枚の前面胸部X線画像(1024*1024 png)
  2. 各画像には14種類の疾患ラベルが複数可で紐づいている。
    • ラベルは診断分をNLPによって生成したもので、精度は90+%程
    • NLPによる抽出法はCoursera AI for treatmentで紹介されている。
  3. 1000枚弱の画像に対して、病変部のBounding boxの座標が示されている。

NIHの元データセット:https://nihcc.app.box.com/v/ChestXray-NIHCC
Kaggleバージョン:https://www.kaggle.com/nih-chest-xrays/data

Model architecture

ベースモデルはDenseNet。最後の特徴量マップにGlobal averaging pooling、その次に全結合、そのアウトプットにSigmoid活性化関数を適応してラベル予測確率を出す小構造になっている。Kerasだと下のようになる。


Discussion

コメントにはログインが必要です。