研究成果 2020/11/20
奈良先端科学技術大学院大学(学長:横矢直和)先端科学技術研究科 ソーシャル・コンピューティング研究室の荒牧英治教授らの研究グループは、株式会社ワイズ・リーディングと合同で、CTなどの画像診断の結果を記載した文書を自動作成するための研究を加速するため、公開読影レポートデータセットを開発・公開いたしました。
近年、医療AIを用いて、単純X線(レントゲン)、CT、MRIなどの医用画像から読影レポートを自動生成する研究が盛んになっています。しかし、現存する評価方法で生成物に点数付けをすると、医学的な妥当性とは必ずしも一致しません。これは、肝心の目標である「よい読影レポートとは何か?」の定義が難しいということでもあり、分野の発展の大きな障害となっています。
私達は、その原因の一つとして、同じ診断内容であっても文章としてさまざまな書き方ができること(表現の多様性)に着目しました。医療現場では、一つの画像に対して一つの読影レポートしか作成されません。そのため、ただ単に医療機関に保存されている読影レポートを集めただけでは、同じ診断内容に対して人間がどのような書き方をするのかを十分に知ることができません。
そこで私達は、同一のCT画像に対して複数名の読影医に読影レポートを作成していただき、集積して文章表現の適切な理解に役立てるという新しい方法で読影レポートデータセット「Japanese Medical natural language processing Standard datasets: Radiography Reports (J-MedStd: RR)」を作成し、一部をサンプルしてWebサイト(https://sociocom.naist.jp/j-medstd/rr/)にて公開することにいたしました。
このデータセットは将来、医療AIが単純X線(レントゲン)、CT、MRIなどに対してよりよい自動診断を下すためのお手本となる学習データとして広く使用されることを目的としています。
さらに今後、サンプル数の拡張を続け、本データを大規模化する予定です。本データが、専門性の高い医療文書の品質を判定したり、医用画像から自動診断を行ったりする医療AIの一助となり、ひいては医療分野における人間とAIの協働をますます加速させることが期待されます。