深層学習によるCT画像からの筋肉自動認識システムを開発 解析時間を大幅短縮、実用精度を達成 ~医学やスポーツ科学への応用期待~

2019/12/13

深層学習によるCT画像からの筋肉自動認識システムを開発
解析時間を大幅短縮、実用精度を達成
~医学やスポーツ科学への応用期待~

【概要】

 奈良先端科学技術大学院大学(学長:横矢直和)先端科学技術研究科 情報科学領域 日朝祐太助教、大竹義人准教授、佐藤嘉伸教授の研究グループと大阪大学大学院医学系研究科 運動器医工学治療学講座 菅野伸彦教授、器官制御外科学 高尾正樹講師は、深層学習(機械学習の一種)を用いて、下肢の3次元CT画像から、筋骨格を構成する19種類の筋肉、3種類の骨の形状を個別に素早く高い精度で自動認識するシステムを開発しました。医学の診断やスポーツ科学などへの応用が期待されます。

 今回の自動認識システムは、認識に必要な処理を多くのデータから自動的に学習する「深層学習」の手法を使うことで、CT画像からの筋肉の輪郭の認識誤差を約3分の2に、計算時間を約10分の1と大幅に削減することができます。具体的には、平均誤差は実用化の目安になる1 mm 以下、計算時間は骨盤から膝までの認識が約5分で、従来にない実用性能を得ることに成功しました。CT画像からの筋肉の自動認識は、この10年、本学のグループが国際的に先導しており、本論文は、様々な応用に適用可能な実用システムを確立した点で、意義が大きいと考えます。

 また、深層学習の認識結果に「確信度」(機械が自信をもって認識したかどうかの度合い)を付与し、それが実際の認識精度と高い相関を持つことを示しました。さらに、「確信度」の低い(機械が自信をもって認識していない)箇所のみを、機械に追加で学習させることにより、学習にかかる手間が大幅に削減できることを示しました。「深層学習はブラックボックスであり、出てきた結果の根拠がわからない」という批判がありますが、新たに「確信度」を出力することで測定結果の信頼性を高めます。特に、疾患の進行や治療による回復における筋肉の形状変化の解析など医学的に解釈する際の有用な指標を提供することができると考えます。

 この研究成果は、2019年9月10日付で、医用画像工学で最も権威のある国際論文誌 IEEE Transactions on Medical Imaging (Impact Factor 7.816) にEarly Accessにてオンライン公開されました。

【ご連絡事項】

(1)本件につきましては、奈良先端科学技術大学院大学から奈良県文化教育記者クラブをメインとし、学研都市記者クラブ、大阪科学・大学記者クラブに同時にご連絡しております。
(2)取材希望がございましたら、恐れ入りますが下記までご連絡願います。
(3)プレスリリースに関する問合せ先

 奈良先端科学技術大学院大学 先端科学技術研究科
 情報科学領域 生体医用画像研究室 助教 日朝祐太
 TEL:0743-72-5232  FAX:0743-72-5239
 E-mail:faculty-icb〔at〕is.naist.jp、hiasa〔at〕is.naist.jp

【解説】

 まず、図1に典型的な入力CTデータと認識結果(図1上図)、および、20例の患者データでの精度評価の結果(図1下図)を示します。処理は、CT画像の2次元断面(スライス像)の1枚1枚に対して行われ、これらを積み重ねて3次元的に復元します。図1上図のU-Netと記された列の結果は、Multi-atlas (従来法)の列に比べて、特に下段の矢印のあたりで、Ground truthと記された正解に近いことがわかります。図1下図に、20例の患者データでの従来法との誤差の比較を示しています。左が従来法で右が提案法の結果で、それぞれ、縦軸が異なる患者、横軸が異なる筋肉に対応しており、青が小さい誤差、緑、黄、赤となるにつれ、大きな誤差を表しています。提案法では、実用精度の目安となる1 mm 以下の平均誤差を達成し、個々の筋肉でみても、19の筋肉の中で11筋肉において1 mm 以下を達成しました。一方、従来法では誤差1 mm 以下は2筋肉のみでした。

図1上図
図1下図
図1 典型的な入力データと認識結果(上図)、および、20例の実験での誤差分布(下図)

 次に、認識結果に「確信度」を付与したことの技術的側面について、少し専門的な立場から説明します。医用画像処理においては、自動認識手法による誤認識は、医療ミスを誘発する可能性があります。誤認識が起きる要因は、大きく分けて、学習データに含まれる手動アノテーション(注釈、用語解説1参照)の誤差などによるノイズと、学習データ数の不足が知られています。ところが、医用画像データは、倫理的な問題や医学的な専門性の高さから、アノテーション付きデータの数を増やすことが難しい傾向にあります。そのため、本研究では、学習データ不足による不確実性(epistemic uncertainty)の推定に焦点を当てています。
 本手法では、図2のように、CT画像の2次元断面を入力とし、筋骨格認識結果および不確実性を出力します。不確実性が低いと確信度が高くなります。これを全スライスへ適用することで、3次元的な出力を得ます。本論文では、推定した確信度と認識精度との関係を実験により評価し、高い相関があることを示しました。深層学習による認識はブラックボックスで認識の根拠がわからないのが問題であると言われますが、根拠はわからずとも、確信度がわかることは、実用する上で一定の意味があると言えます。

図2
図2.CT画像からの筋骨格抽出および不確実性の推定

 一方で、データ不足という問題は、学習だけでなく、精度評価においても問題となり得ます。例えば、限られたデータセット、すなわち、同一の大学病院内で撮影されたデータで交差検証(用語解説2参照)により精度を確かめたとしても、他の機関でのデータにおいても同様の精度が得られるのかという疑問は残ります。そこで、本研究では、大阪大学病院で撮影されたデータに加えて、米国国立がん研究所が公開しているデータに対しても、評価を行いました。図3に、米国国立がん研究所のデータによる典型的な2例の結果を示します。患者#05は、比較的正常に近い例ですが、患者#07の右足は、腫瘍のため大きく膨らんでいます。このような領域において、高い不確実性(低い確信度)の値を示していることが確認されます。

図3
図3.米国国立がん研究所が公開しているデータに本手法を適用した結果

 また、手動アノテーションには、筋骨格解剖を知り尽くした専門医が1例あたり約40時間(1日8時間休憩なしで専念して丸5日間)を要します。そのため、論文においては、図4にように、学習データを半手動で、効率的に増強する手法も提案しました。この手法は、アノテーションされていない画像を一旦提案手法によって自動アノテーションし、確信度の低かったスライスのうち特に確信度の低かったピクセル(画素)だけを手動でアノテーションするというものです。これにより、全てのスライスをアノテーションするのに比べて90分の1の作業量で、同様の性能を発揮できることを実験的に確かめました。

図4
図4.学習データを半手動で効率的に増強する手法

【今後の展開】

 現在、国立情報学研究所とのプロジェクトにおいて、本手法を用いて、大規模CTデータ(1万例規模)の解析が進んでおり、筋骨格に関する新しい知見の獲得が期待されています。CT画像だけでなく、MRI(磁気共鳴画像)にも本手法を直ちに適用するための深層学習技術も開発中です。本研究により、今後、人体の運動シミュレーションを各個人の筋骨格解剖で行うことが可能になり、医療やスポーツ科学への応用が期待されます。


【掲載論文】

https://ieeexplore.ieee.org/abstract/document/8830493 (Early Access)

Hiasa Y, Otake Y, Takao M, Ogawa T, Sugano N, Sato Y. Automated Muscle Segmentation from Clinical CT using Bayesian U-Net for Personalized Musculoskeletal Modeling. IEEE Transactions on Medical Imaging. 2019 Sep 10.


【用語解説】

1)手動アノテーション:CT画像のピクセル毎に、どの筋肉であるかの情報(解剖学的名称)を付与する作業

2)交差検証:データセットを分割し、一部で学習、残りで精度評価し、未知データに対する予測性能を推定する方法


【お問い合わせ先】

奈良先端科学技術大学院大学 先端科学技術研究科
 情報科学領域 生体医用画像研究室 助教 日朝祐太
 TEL:0743-72-5232  FAX:0743-72-5239
 E-mail:faculty-icb〔at〕is.naist.jp、hiasa〔at〕is.naist.jp

プレスリリース一覧に戻る