コンピューターを使い超高速で生体高分子構造の謎に迫る! ~RNAの複雑な構造予測のための超高速・高精度ウェブツールを開発~

2012/08/30

【概要】
RNA(リボ核酸)は人間を含めた生物の細胞の中に存在し、DNAのゲノム(遺伝情報)からタンパク質の情報をコピーしている鎖状の高分 子。近年、遺伝子の働きの抑制など重要な生命活動の機能を発揮するRNAが相次いでみつかり、注目を集めている。このRNAの未知の機能を解明するには、 強い相関関係がある構造の解析が不可欠で、コンピューターによりRNAの塩基配列データから、その折り畳み構造を予測するアプローチは、時間とコストがか かる構造解析実験技術を補完する有力なツールとされている。

奈良先端科学技術大学院大学(奈良先端大、学長:磯貝彰)情報科学研究科計算メカニズム学研究室の加藤有己助教は、慶應義塾大学、東京大学、京都大学からなるグループとの共同研究により、従来の常識を打ち破る超高速の構造予測ツールセットの開発に成功した。

こ のツールは、2種類の予測ができ、1つは、従来法で無視されることが多い複雑な部分構造を含めたRNA全体の構造予測で、精度の向上と新たなRNA遺伝子 の発見につながる。もう1つは、RNAが部分的に結合したさいの相互作用の予測で、RNAによる生体内制御機構の解明が期待されている。

従 来法では、複雑な構造解析のさいに計算効率が極端に悪くなるという欠点があり、高性能なコンピューターを使っても膨大な計算時間がかかってしまう例もあ る。本研究では、ソフトウェア改良の観点からこれらの問題に対処した。両ツールとも計算速度は世界最速レベルであり、予測精度も他の手法と比べて勝るとも 劣らないことを実証している。例えば、従来法と比べて構造予測では最大で1万2千倍、相互作用予測では最大で4万倍の高速化を実現した。

両 ツールを広く公開するため、それらを実装したウェブサーバーを開発し、商用目的以外であれば誰でも自由に利用することが可能 (http://rna.naist.jp/)。開発したツールの高速性は、RNAの大規模な遺伝子領域の予測や、相互作用のための標的RNAの探索に真 価を発揮し、生命科学の発展だけでなく、医学や薬学の分野に貢献することが期待される。この研究成果は、平成24年7月発行のNucleic Acids Research誌に掲載(電子版のみ)された。

【解説】
RNA(リボ核酸)は通常1本鎖で存在し、4種類の塩基A(アデニ ン)、C(シトシン)、G(グアニン)、U(ウラシル)からなる文字列(塩基配列)で表現される。RNAの多くは、選択的に塩基同士で水素結合することに より2次構造1) と呼ばれる折り畳み構造を形成する。RNAの2次構造の中には図1のような複雑な部分構造を含むものが少なからず存在することが分かっていて、複雑な2次 構造を含めてRNAの構造を解析できることは、より精度の高い機能推定につながると期待されている。

また、RNAは生体内制御に関わって いることが知られている。一例を挙げると、あるRNAがタンパク質の鋳型である別のRNAと結合することで、タンパク質の合成を抑制する現象が見つかって いる(図2)。このような現象はRNA間相互作用と呼ばれているが、相互作用の仕組みを解明するためには、2つのRNAから構成される結合構造を解析する ことが重要になる。

これまでいくつかの研究グループにより、RNA2次構造予測問題およびRNA間相互作用予測問題に対して、コンピュー ターを利用した様々なアプローチが提案されてきた。複雑な構造を解析するときには計算効率が極端に悪くなるという欠点があり、従来法ではそれらを考慮せず に解析するか、あるいは考慮する代わりに時間をかけて計算するかの2通りのアプローチがあった。つまり、扱える構造のクラスと計算効率にはトレードオフの 関係が存在したわけだ。

本研究ではこのトレードオフの関係を打破すべく、複雑な構造をうまく分割して解析しやすい問題を解き、結果を重ね 合わせることで元の構造を復元するアプローチを取った。具体的には、複雑な構造の近似確率分布の下で予測構造の精度の期待値を最大化する問題を、閾値カッ トと呼ばれる技術を用いた整数計画法2) という手法で解くことにした。整数計画法はモデル記述能力と拡張性が高いものの、通常は計算時間を長く要する計算手法として知られている。

し かし、本研究では期待精度を最大化するという原理を融合させることで、圧倒的に高速に計算できる整数計画法を実現することができた。実際の構造データを用 いた計算機実験結果では、開発手法は既存手法と比べて同等以上の予測精度を達成したが、特筆すべきはその実行時間の劇的な短縮にある。

RNA2次構造予測とRNA間相互作用予測のための開発ツールは、単体のプログラムとしてダウンロードして利用できるほか、ウェブサーバー(http://rna.naist.jp/)として、ブラウザ上でマウス操作などで簡単に利用できるようになっている。

以 上の研究成果は、平成24年7月発行のNucleic Acids Research (NAR) 誌のウェブサーバー特集号の電子版に掲載されている。NAR誌はDNA、RNAといった核酸に関する最重要研究成果を掲載している英国の雑誌で、現在のイ ンパクトファクターは8.026であり、生命科学系では非常に影響力のある雑誌の1つとなっている。本研究は慶應義塾大学佐藤健吾講師、東京大学浅井潔教 授、京都大学阿久津達也教授との共同で行われた。また、本研究は一部科学研究費補助金(若手研究(B))の助成を受けて実施した。

【研究の位置づけ】
昨 今の実験技術の革新により、大量の生物配列データがこれまでにない速度で得られる時代となった。この膨大なデータを高速に処理するための情報科学的アプ ローチは、生命科学にとって避けては通れない技術となっている。本研究で開発したツールはまさにそのような時代のニーズに合ったものであると確信してい る。本研究の特徴の1つは、大規模なハードウェアの能力に依存するのではなく、斬新なソフトウェアの開発だけで高速性を実現したこと。したがって、開発手 法は個人用の標準的なパソコンでも高速に動作することが可能だ。開発ツールの高速性はRNAの大規模な遺伝子領域予測、相互作用のための標的RNAの探索 に真価を発揮し、生命科学の発展のみならず、医学や薬学の分野に貢献されることが期待される。現在、こうした問題に応用する研究を着々と進めている。

【用語解説】
1) 2次構造: 立体構造の骨格を成す塩基対の集合で、A-U、G-C、G-Uの規則で結合する。
2) 整数計画法: 考えている問題を、整数値を取る変数に関する線形の不等式制約の下で、線形の目的関数を最大化または最小化する問題(整数計画問題)として定式化し解く方法。

【関連リンク】
・論文は以下に掲載されております。
http://dx.doi.org/10.1093/nar/gks412
・以下は論文の書誌情報です。
Yuki Kato, Kengo Sato, Kiyoshi Asai, Tatsuya Akatsu, Rtips: fast and
accurate tools for RNA 2D structure prediction using integer
programming. Nucleic Acids Research June 27, 2012

admin_d1ee307d020dd5524d99694f5bf84a20_1346320442_.gifadmin_d1ee307d020dd5524d99694f5bf84a20_1346320456_.gifadmin_d1ee307d020dd5524d99694f5bf84a20_1346322515_.gif

PDFファイル(300.66 KB)

プレスリリース一覧に戻る