NICTでは、2017年から総務省と連携して、ニューラル翻訳*1技術に不可欠な翻訳データを集積する翻訳バンク*2を運営し、製薬会社をはじめとして多数の組織からデータの提供を受けて、翻訳データの集積・活用を進めてきた。また、トヨタとは2018年6月から「自動車法規文章の自動翻訳エンジンの研究開発」で共同研究を進めてきた。
NICTは、トヨタが提供した自動車法規に関する英日・中日翻訳データを基に、汎用英日・中日ニューラルネットワーク翻訳エンジンのアダプテーション*3を行い、実用度を向上させた。
トヨタが自動車法規についてアダプテーション後の実用度を評価したところ、英日翻訳について、アダプテーション前と比べ、自動翻訳エンジンの約24%、中日翻訳については、約11%の実用度向上が得られた。これを受けて、トヨタでは、実用度向上の検討を継続することとなった。
各国語の法規の翻訳は、自動車にとどまるものでなく輸出される全ての生産物に対して存在し、その翻訳の高速化・高精度化は同様に不可欠となり、翻訳バンクによって実現されていくことが期待される。
今回は、英日・中日翻訳の片方向のみだが、今後は、①双方向に、更には、多言語にすること、②オーナーズマニュアル等の多種多様な文献に展開すること、③自動車産業全体に広げること、④広域にわたる輸出産業に広げることを目指す。
*1 ニューラル翻訳(NMT)
脳の神経回路を模したニューラルネットワークを用いた自動翻訳技術。膨大な翻訳データを用いてトレーニングしたニューラルネットワークで翻訳することで、従来の翻訳技術よりも高い翻訳精度が確認されている。
https://www.nict.go.jp/press/2017/06/28-1.html (NICT)
*2 翻訳バンク
ニューラル技術による自動翻訳の精度向上には、アルゴリズムの改良に加えて、翻訳データの質と量の影響も大きく、高品質翻訳データの大量の確保が重要となる。NICTは、総務省と共に翻訳データを集積する「翻訳バンク」を運用し、日本語の翻訳技術の多分野化・高精度化に取り組んでいる。
http://h-bank.nict.go.jp/index.html
https://www.nict.go.jp/press/2017/09/08-1.html(NICT)
提供された翻訳データは、既存の翻訳データと併せて、ニューラルネットのトレーニングに活用され、技術移転される。最新版の翻訳精度は、NICTの開発した音声翻訳アプリVoiceTra*4や文字ベースの自動翻訳システムTexTra*5で自由に確認できる。
*3 アダプテーション
翻訳バンクで追加した翻訳データを用いて、精度を改善するようにトレーニング済みのNMTのニューラルネットワークを更に調整すること。
*4 VoiceTra
言葉の壁で困らない社会実現を目指してNICTが開発した多言語音声翻訳アプリ。NMTを用いて、観光地での旅行会話はもとより、病院、商業施設といった様々なシーンで精度の高い音声翻訳を提供している。世界31の言語に対応。
https://voicetra.nict.go.jp/
*5 TexTra
NICTでは、文字入力用のNMTをTexTraと名付けて公開している。公開サイト「みんなの自動翻訳@TexTra」では、コピー・ペーストしたり、サイト上の翻訳エディタを利用したり、ワードやパワーポイントのファイルを直接翻訳したり、API(Application Programming Interface)を介してプログラムから利用するなど、様々な方法で翻訳精度を試すことができる。
https://mt-auto-minhon-mlt.ucri.jgn-x.jp/(NICT)