
情報科学領域
ロボットラーニング研究室
助教
鶴峯 義久 Tsurumine Yoshihisa
衣服をたたむ家事支援ロボット
柔らかいものは不得手
洗濯、掃除、調理など、ロボットは家事をどこまで引き受けられるようになるのでしょうか。ロボット工学技術は、家事労働時間の軽減で余裕がある豊かな生活を生みだし、高齢社会や核家族化の進行による一人暮らし世帯の増加という社会課題にも対応します。しかし、すべての家事をロボットがやり遂げるためには、衣類など形が不規則に変化する柔らかい物体を適切に扱う能力など未だ克服すべき難点が残されています。
家事支援ロボットの研究を続ける鶴峯助教は「食器を運ぶなど硬い物体をつかんで操作する場合は、形状の変化を考えなくてよいため操作を計画しやすいです。しかし、衣類など柔らかいものを折りたたむときは、つかむ箇所のちょっとした違いによって操作後の形状が多様に変化します。そのため様々な衣類状態に適した行動選択が必要になり、ロボットによる自動化は困難です」と説明します。
そこで、鶴峯助教が挑んできたのが、ロボット自身に試行錯誤させることで様々な状況に適した動きを学習する深層強化学習をベースとした衣類操作ロボット技術の開発です。

強化学習で訓練
鶴峯助教は、双腕ロボットによる「Tシャツの折りたたみ」の学習を目指していましたが、手法開発や比較検証のためにベンチマークタスクとなる「ハンカチの裏返し」の学習から始めました。
強化学習で学習する衣類操作方策は、観測した衣類の形状から操作行動を決定する方策です。このような入出力の方策を「深層学習」で近似することで対象物の画像から形状や位置などの特徴点を自動的に抽出し、衣類形状画像から直接行動を決定する方策を学習できます。強化学習は試行錯誤的に選択した行動の良さを報酬として評価し、報酬和を最大化する方策に少しずつ更新していくのです。
「ロボットは試行錯誤しているうちに、ハンカチを裏返す動作を学んでいきます。全く知識のない状態から行動が少しずつ最適化されていくのですが、最終的にはハンカチを半分折り返した後に位置を調整してから端を伸ばして広げる戦略を自ら獲得します」
また、鶴峯助教は、実環境のロボットタスクにおいて多くのデータを収集することが困難という問題に対処するために、方策の更新を安定化させることで少数データから学習できる「深層強化学習」の手法を提案し、実験にも成功しています。
「子供服やズボンなどがたためるようになりました。ただ、事前に強化学習を行っていない衣類に対しても対応できるようにするのが、今後の課題です」。
こうしたことから、鶴峯助教は、コンピュータシミュレーション(模擬実験)により、大量のデータを高速に処理して機械学習を行う研究を目指しており、シミュレーションを並列処理して行い、データ処理の効率化などを図る研究環境の構築にも取り組んでいます。
できるまでやれば、できる
「最近では、ロボットが、食器棚に並んだ調理器具や食材の中から必要なものを、どこに注目して選択するかなど、実際にロボットが家庭内に入ったときに直面する課題の解決にテーマを広げています」と鶴峯助教。「将来的には、身の周りのことを全部、ロボットが引き受けてくれたらいいと思います」
鶴峯助教がロボットに関わったのは、中学生のころから。宇部工業高等専門学校時代に、組み込みソフトウェア技術を競うETソフトウェアデザインロボットコンテストに参加し、全国大会/アーキテクト部門で優勝しました。そしてロボットの強化学習の研究をめざし、奈良先端大に入学しました。
研究への思いは「できるまでやれば、できるだろう」。ハンカチ裏返しの実験の時は、一日8時間、ロボットの行動をそばで見守りました。「無数の失敗を経験したあとに成功へのラインが見えてくることがあります」。趣味は250ccのバイクでのツーリングです。「奈良先端大の周辺は山に囲まれ、山道をワインディングするのに、絶好の環境です」。
