ブックタイトルSENTAN せんたん JAN 2019 vol.27
- ページ
- 8/24
このページは SENTAN せんたん JAN 2019 vol.27 の電子ブックに掲載されている8ページの概要です。
秒後に電子ブックの対象ページへ移動します。
「ブックを開く」ボタンをクリックすると今すぐブックを開きます。
このページは SENTAN せんたん JAN 2019 vol.27 の電子ブックに掲載されている8ページの概要です。
秒後に電子ブックの対象ページへ移動します。
「ブックを開く」ボタンをクリックすると今すぐブックを開きます。
SENTAN せんたん JAN 2019 vol.27
知の扉を開く論文を計算機に読ませ、新たな知識を発見する情報科学領域自然言語処理学研究室教授紹介松本裕治教授新保仁准教授進藤裕之助教文章や図表を自動的に解析人は言葉によって知識を獲得し、コミュニケーションをとっている。その言語を理解するためには、個々の単語の意味や文を解析し、蓄積された知識と照らし合わせて総合的に判断する必要がある。人間のこうした高度な営みを計算機に肩代わりさせる研究が進み、日常会話のようなあいまいな言語構造を持つ「自然言語」の解析もかなりの精度で行えるようになった。こうした自然言語処理研究の先駆けである松本教授は、日本語の意味を持つ最小単位の「形態素」を解析する「茶筌(ちゃせん)」をはじめ、多様な言語解析システムを開発、公開してきた。最近では、オンラインで入手できる科学技術分野の論文が急増して、専門家でさえも最新の研究成果を把握し難くなっていることから、「膨大な数の論文を自動的に効率よく計算機が解析して情報・知識を獲得し、重要な論文の検索など研究者に役立ち、イノベーションにつながるシステムの開発を行っています」と松本教授は説明する。現在、取り組んでいるテーマの一つが、科学技術振興機構(JST)の戦略的創造推進事業(CREST)の中の「構造理解に基づく大規模文献情報からの知識発見」。それぞれの分野特有の高度な知識を含む論文の構造や内容を解析(理解)し、的確な文献の検索、新たな知識の創造などを支援するシステムを構築する。もうひとつは理化学研究所の革新知能統合研究センター(AIP)の知識獲得チームのリーダーとして行っている専門分野のデータベースづくりの自動化。これまで人海戦術で膨大な時間と手間がかかっていたものを、論文の文章や図表を自動的に解析する技術などを使い、データベースを効率よく拡充する。「このテーマに取り組みはじめてから、結構、役に立つと好評で、公的な研究所や企業との共同研究も増えています」と張り切る。査読が自動化できたらこのような論文解析のシステムの開発には、有効な情報を抽出するための試行錯誤が重ねられた。例えば、理系の論文は、「どんな問題に対し、どんな手法を適用して、どんな結果が出たか」というように、成果を得るまでの筋道が明確な構造の文章で書かれているので解析しやすいといわれる。専門分野を絞れば、同様の構造を持つ論文が多くなり、情報を抽出して比較検討できる。ところが、範囲を広げて関連分野全体を俯瞰する形で解析する場合、論文中の内容をコンパクトに記した「アブストラクト0 7 S E NTAN