文末を待たずに翻訳を行う、同時自動音声通訳技術を開発 ~20%のスピード向上 講演や会議の同時通訳に応用期待~

2013/08/27

【概要】
奈良先端科学技術大学院大学(奈良先端大、学長:小笠原直毅)情報科学研究科知能コミュニケーション研究室  中村 哲教授、グラム ニュービッグ助教らのグループは、同時通訳者のように発話途中から文末を待たずに翻訳を行う、同時自動音声通訳のコア技術を開発し た。この技術を講演、ニュースや会議などの場で使うことにより、一回の発話が長く続く音声を、素早く高精度で同時自動通訳する機械翻訳が可能になる。

【研究成果】
今 回の研究では、自動音声通訳のさいに、翻訳の遅れが生じる問題を解決するために、文が終了する前に翻訳を開始する手法を提案した。これまでの手法では図1 に示すように文の発話終了からそれぞれの処理が逐次的に行われていた。これに対し、今回の同時自動通訳研究では図2に示すように、一文が完全に終わる前に 適切なタイミングで通訳を行う。

具体的には、句ごとに対応関係を対訳文から統計的に学習し、正解の確率が高い訳語を表現する「統計的フレーズ(句、単語列)ベース翻訳」を用いる。まず、その情報を利用して入力する言葉を「文」より短い「句」の単位に分割する。

た だ、翻訳の単位を短くすれば訳出タイミングを速くすることができるものの、単位が短かすぎると、正確な訳出に必要な文脈情報が失われる。このため、本研究 では、翻訳に最も適切な単位を選択できるように、翻訳対象となる言語対の並べ替えやすさを考慮したパラメータを導入し、トレードオフの関係にあるスピード と精度の調整を可能にした。図3に句の並べ替えの様子を示す。言語構造が異なることにより、順番が逆に対応する場合や、その間に異なる単語を挟んで不連続 となる場合があることが分かる。本研究では不連続の場合も含め、図中にある右確率の大きさに基づいて訳出を行う方法を開発した。

図4に訳出タイミングの調整の様子を示す。「こんにちは」が入力されても訳出を保留し、次の句をみて、右確率が大きいことを確認して、「駅は」につながらないことを確認して「こんにちは」を訳出する。

さ らに、日英の比較的長い文章で同時自動通訳評価を行ったところ、提案法により音声翻訳の遅延が大幅に改善された。導入したパラメータによりスピードと精度 のバランスを調整でき、提案法が精度を維持したまま20%のスピード向上を実現できることが明らかになった。また、同一の講演に対して、上級通訳者(15 年以上経験者)、中級(4年以上経験者)、初級(1年以上経験者)が、同一の講演に対して同時通訳を行ない、速度と品質を比較したところ、初級と同等の同 時通訳性能と速度が達成されることが明らかとなった。

【研究の背景】
音声の自動通訳(音声翻訳)は国際交流を深める夢の技術とし て長年研究が行われてきた。その仕組みは、コンピューターにより、音声の自動認識、機械翻訳、音声合成を順番に行い、その場で相手の言語の音声に変換す る。音声認識や機械翻訳の技術的な困難さから、これまで、旅行会話や簡単な日常会話に特化して研究開発が行われてきた。

中村教授は、国際電気通信基礎技術研究所(ATR)、情報通信研究機構(NICT)などを経て、本学に赴任し、その間、一貫して音声自動翻訳の研究を行ってきた。これまで開発した技術の一部はすでに実用化され、携帯電話の商用サービスにも利用されている。

し かし、講演や会議などの場で使われる一発話が長い音声に対して、人間の同時通訳者のように発話中に通訳を開始するという同時自動音声通訳技術は難易度が高 く、実用的な技術を確立することが困難であった。特に、文頭で肯定、否定がわかる英語と文末まで来ないと判断できない日本語というような語順が異なる言語 の同時自動通訳は困難で、大きな遅延を伴う欠点が存在した。

【社会への影響】
本研究は、同時自動通訳の核となる翻訳方式となるも のであり、さらに研究開発を行うことにより、日本語を含む多言語の講演、ニュースや会議の同時自動通訳システムの実現につながる。同時自動通訳システムに より、たとえば、外国語ニュースの同時自動通訳、会議の同時自動通訳、日本語ニュース、講演の外国語発信など、これまでの旅行会話の単なるコミュニケー ションの補助のための技術でなく、より大規模な情報流通に資することができる。

本研究の成果は、平成25年8月29-30日に「イノベー ションジャパン2013~大学見本市&ビジネスマッチング~」(http://innovation-japan2013.jp/) にて展示される。ま た、平成25年8月26日からフランスで開催される「INTERSPEECH2013」にて学会発表される。

【用語説明】
●統計的フレーズ(句、単語列)ベース翻訳
異なる言語で同じ意味を持つ文(対訳文)からなるデータから、句ごとに、単語の翻訳、語順の変換、翻訳文の目的言語での自然性が高くなるように統計モデルを学習し、これらモデルを用いて原言語の文章を目的言語に翻訳する方式。

PDFファイル(358.32 KB)

プレスリリース一覧に戻る