化学プラントを自律制御するAIソフトが日本産業技術大賞の内閣総理大臣賞を受賞
自律制御AIが産業技術として認められた
奈良先端科学技術大学院大学と横河電機株式会社(本社・東京都武蔵野市)は、化学プラントの製造装置を自律制御するAI(人工知能)のソフト「FKDPP (アルゴリズム名:Factorial Kernel Dynamic Policy Programming)」を共同で開発し、その実証試験の成果が評価されて「第52回日本産業技術大賞」(日刊工業新聞社主催)の最高位である「内閣総理大臣賞」を受賞しました。この賞は、日本の産業社会の発展に貢献した技術成果を選定しているもので、これまで「スーパーコンピュータ富岳」「東京スカイツリーの建設」などが受賞しています。
今回の受賞対象になった「FKDPP」は、AIのシステム自体が試行錯誤しながら、最適な制御ルールを学習するという強化学習のアルゴリズム(操作手順)を組み込んだソフトウェアです。化学プラントは、化学製品を工場で製造するので多くの設備が連係して配置されており、微妙な調整が必要な箇所の自動化は困難なため、手動で制御されています。このような産業の現場にAIを実際に導入し、自律制御の安全性などを実証できたのは、世界で初めての成果です。
今回の共同開発で本学の研究代表者となった情報科学領域ロボットラーニング研究室の松原崇充教授は「このAIのソフトが産業技術としてインパクトがあることを認められたのは非常に嬉しい。この強化学習技術は、横河電機の協力のもと、当時の研究室で博士課程に在籍していた朱令緯さん、元特任助教の崔允端さんとの共同開発です。彼らの努力なくして、この成果は得られず、感謝します」と話します。
現場で強化学習
松原教授によると、2016年ごろ、横河電機の社員が当時所属していた研究室を訪れたのが共同開発のきっかけでした。特に興味を持たれたのは、ロボットハンドがぺットボトルのフタをひねって開けるといった器用な指の動作について、AIソフト「KDPP(Kernel Dynamic Policy Programming)」により、わずか100回程度の練習(強化学習)で自動的に習得できるようになる、というロボットデモンストレーションでした。「これだけの少ない規模のデータで学習できるなら、このAIソフトを化学プラントの手作業が必要な箇所の自動制御にも使えるはず」との発想でした。
ただ、化学プラントについては、同じ素材を生産するプラントであっても、それぞれの装置や操作の方法などが異なるため、個別の制御ルールの設計が必要となります。しかし、実際のプラントで膨大なデータを集めることは現実的に困難でした。そのため、研究室の「KDPP」に横河電機が持つ操業ノウハウを取り入れて、より少ないデータで短時間に学習し、適切な制御ルールを獲得可能な強化学習アルゴリズム「FKDPP」を開発しました。この自律制御AIソフトは、実際の化学プラントの蒸留塔で手動操作の箇所を自律化することに成功し、1年間の実証試験のあと、正式採用されました。
産学連携が新たな研究シーズの呼び水
「昨今のAI技術は、ビッグデータを処理することが主流ですが、これに対し、我々のKDPPは、実際の現場で得られる不十分なデータしか取れない状況で、短時間に強化学習して作業のルールを習得するものです。そのため、ソフトの数学的な枠組みが大きく異なります」と松原教授。その基礎技術は、松原教授が本学の「若手研究者の海外武者修行プロジェクト」でオランダ・ラドバウド大学に1年間滞在した際に学んだ物理学の理論から着想を得たものです。その後に開発した衣類を折り畳むロボット、試行錯誤を通じて自動運転する小型船舶などの研究にも活かされています。今後は、自律型エッジロボット用に、省電力コンピュータ向けのAI技術を開発する予定とのこと。「産学連携の研究を進めることで、新たな研究シーズの呼び水にしたい」と積極的な姿勢を見せます。
松原教授は、研究がオフの日は家族で山歩きして水晶などの鉱石を採集します。「奈良県の二上山など、噴火の痕跡がある場所には、珍しい石があります」と採石に役立つデータ収集も用意周到です。