自動車法規文の自動翻訳をニューラル技術で高精度化 ~トヨタとの共同研究で英日・中日翻訳の実用度向上~
国立研究開発法人情報通信研究機構(NICT)
自動車法規文の自動翻訳をニューラル技術で高精度化
~トヨタとの共同研究を通じ、英日・中日翻訳の実用度が向上~
【ポイント】
■ 自動車業界からトヨタが翻訳バンクに協力、翻訳データを提供
■ 自動車法規を対象とした翻訳をニューラル英日翻訳システムで24%実用度向上
■ 数万点に及ぶ部品のメーカーを含めた裾野の広い自動車業界全体への波及効果は絶大
国立研究開発法人情報通信研究機構(NICT、理事長: 徳田 英幸)は、トヨタ自動車株式会社(トヨタ、代表取締役社長: 豊田 章男)と、自動車法規を対象としたニューラル英日・中日自動翻訳の共同研究を実施し、実用度向上を確認しました。これにより、自動車業界全体でのニューラル自動翻訳の活用が大きく期待できます。
今後は、本技術を法規文以外のマニュアル等の多種多様な文献に展開するとともに、多言語化を進め、自動車産業で必要となるあらゆる翻訳を高効率化することを目指します。
【背景】
自動車及び自動車部品の設計・製造・輸出に当たっては、安全確保・環境保護等の様々な観点から、各国が定める法規の要件を満足することが求められています。そのためには、頻繁に改訂される各国の法規情報を迅速かつ正確に理解する必要があり、現状は、人による翻訳のため、精度確保には時間が掛かっています。情報の高速・高精度な翻訳は、トヨタをはじめとする自動車業界の業務効率化の鍵となっています。
NICTでは、2017年から総務省と連携して、ニューラル翻訳*1技術に不可欠な翻訳データを集積する翻訳バンク*2を運営し、製薬会社をはじめとして多数の組織からデータの提供を受けて、翻訳データの集積・活用を進めてきました。また、トヨタとは2018年6月から「自動車法規文章の自動翻訳エンジンの研究開発」で共同研究を進めてきました。
【今回の成果】
NICTは、トヨタが提供した自動車法規に関する英日・中日翻訳データを基に、汎用英日・中日ニューラルネットワーク翻訳エンジンのアダプテーション*3を行い、実用度を向上させました。
トヨタが自動車法規についてアダプテーション後の実用度を評価したところ、英日翻訳について、アダプテーション前と比べ、自動翻訳エンジンの約24%、中日翻訳については、約11%の実用度向上が得られました。これを受けて、トヨタでは、実用度向上の検討を継続することとなりました。
各国語の法規の翻訳は、自動車にとどまるものでなく輸出される全ての生産物に対して存在し、その翻訳の高速化・高精度化は同様に不可欠となり、翻訳バンクによって実現されていくことが期待されます。
【今後の展望】
今回は、英日・中日翻訳の片方向のみでしたが、今後は、①双方向に、更には、多言語にすること、②オーナーズマニュアル等の多種多様な文献に展開すること、③自動車産業全体に広げること、④広域にわたる輸出産業に広げることを目指します。
<用語解説>
*1 ニューラル翻訳(NMT)
脳の神経回路を模したニューラルネットワークを用いた自動翻訳技術。膨大な翻訳データを用いてトレーニングしたニューラルネットワークで翻訳することで、従来の翻訳技術よりも高い翻訳精度が確認されている。
https://www.nict.go.jp/press/2017/06/28-1.html (NICT)
*2 翻訳バンク
ニューラル技術による自動翻訳の精度向上には、アルゴリズムの改良に加えて、翻訳データの質と量の影響も大きく、高品質翻訳データの大量の確保が重要となる。NICTは、総務省と共に翻訳データを集積する「翻訳バンク」を運用し、日本語の翻訳技術の多分野化・高精度化に取り組んでいる。
http://h-bank.nict.go.jp/index.html
https://www.nict.go.jp/press/2017/09/08-1.html(NICT)
提供された翻訳データは、既存の翻訳データと併せて、ニューラルネットのトレーニングに活用され、技術移転される。最新版の翻訳精度は、NICTの開発した音声翻訳アプリVoiceTra*4や文字ベースの自動翻訳システムTexTra*5で自由に確認できる。
*3 アダプテーション
翻訳バンクで追加した翻訳データを用いて、精度を改善するようにトレーニング済みのNMTのニューラルネットワークを更に調整すること。
*4 VoiceTra
言葉の壁で困らない社会実現を目指してNICTが開発した多言語音声翻訳アプリ。NMTを用いて、観光地での旅行会話はもとより、病院、商業施設といった様々なシーンで精度の高い音声翻訳を提供している。世界31の言語に対応。
https://voicetra.nict.go.jp/
*5 TexTra
NICTでは、文字入力用のNMTをTexTraと名付けて公開している。公開サイト「みんなの自動翻訳@TexTra」では、コピー・ペーストしたり、サイト上の翻訳エディタを利用したり、ワードやパワーポイントのファイルを直接翻訳したり、API(Application Programming Interface)を介してプログラムから利用するなど、様々な方法で翻訳精度を試すことができる。
https://mt-auto-minhon-mlt.ucri.jgn-x.jp/(NICT)
広瀬アリス「普段の髪形が迷走中。“どんぐり”とか“こけし”とか」主演ドラマで前髪バッサリ
コンピュート・エクスチェンジ、オークションモデルによりAIコンピュートへのアクセスを拡大し、10億ドルの供給を促進
エスリ、世界で最も包括的なGIS用語辞典の拡張版をリリース
AIエージェント/AIが自律的に判断して行動
【巨人】田中将大「すごく特別」586日ぶり白星、勝利投手かかった5回「氣持ち」全開併殺斬り
レーザーフィッシュ、2025年CRN®パートナープログラムガイドで5つ星評価を獲得
横浜ベイシェラトン ホテル&タワーズ、ナイトスイーツブッフェ「Sweets Parade」を開催 5月29日まで
浜崎あゆみ、美ボディ際立つ姿でリハに打ち込む姿を披露「会える日が近づいて来たね」「ドキドキ」
【巨人】586日ぶり復活星の田中将大「2人して存在感出せた」幼なじみの盟友坂本の援護受け
【中日】9安打も3併殺が響き巨人に連敗…借金2も井上監督「粘り強くやるものは見えた」
多部未華子(30)結婚の裏事情あまりにも恐ろしすぎると話題に!
「中居正広」Xトレンド入り、第三者委員会の調査報告書にツッコミ殺到「こりゃ酷い」の声
二階堂ふみが結婚!?お相手が衝撃的過ぎてネット民「マジか・・・」
有吉弘行、「感謝祭」で永野芽郁に暴走突撃の江頭2:50について“たったひと言”で言及
笠井信輔アナ、飲食店で隣席の女性に叱責され謝ったのに「自らのストレスを他人に向けて…」
「もう会えなくなるけど、こんな女がいたことも忘れないでね」ヒコロヒー“永久出禁”受け吐露
伝説のロックバンドドラマー、中居正広氏めぐるテレビ番組報道に「ハッキリ言います!」
中居正広氏「ひと段落かな」B氏「動きます」女性A退職時の文面公開されX「最悪」「ヘド出る」
元フジ渡邊渚さんが告白、アナウンサー時代に歯がゆかったこと「私は自分のことを…」
紀藤正樹弁護士「驚きます」 中居正広氏の「見舞金」めぐる言動に唖然
多部未華子(30)結婚の裏事情あまりにも恐ろしすぎると話題に!
二階堂ふみが結婚!?お相手が衝撃的過ぎてネット民「マジか・・・」
堀江貴文氏、炎上ストリートピアノ騒動に“たった5文字”で反応しX賛同多数
「中居正広」Xトレンド入り、第三者委員会の調査報告書にツッコミ殺到「こりゃ酷い」の声
楽しんご、銭湯での男性へのわいせつ行為で逮捕された中孝介容疑者に“8文字”でずばり私見
【おすすめアニメ50選】完結済み!定番から最新作まで!
万引き逮捕の米田哲也容疑者を「ご親族かどなたか助けてあげられないのか」紀藤正樹氏「悲しい」
堺正章が60歳タレントと“禁断の”共演「確かに昔干したよ」「本気でした」激白しスタジオ騒然
【ネタバレ?】史実で見るキングダムの今後の展開まとめ〜中華統一までの全体像
有吉弘行、「感謝祭」で永野芽郁に暴走突撃の江頭2:50について“たったひと言”で言及

広瀬アリス「普段の髪形が迷走中。“どんぐり”とか“こけし”とか」主演ドラマで前髪バッサリ
コンピュート・エクスチェンジ、オークションモデルによりAIコンピュートへのアクセスを拡大し、10億ドルの供給を促進
[通貨オプション]OP買い、リスク警戒感が強まる
エスリ、世界で最も包括的なGIS用語辞典の拡張版をリリース
【巨人】田中将大「すごく特別」586日ぶり白星、勝利投手かかった5回「氣持ち」全開併殺斬り
AIエージェント/AIが自律的に判断して行動
レーザーフィッシュ、2025年CRN®パートナープログラムガイドで5つ星評価を獲得
横浜ベイシェラトン ホテル&タワーズ、ナイトスイーツブッフェ「Sweets Parade」を開催 5月29日まで
NY外為:BTC反落、200DMA再び割り込む、リスク資産売り加速
浜崎あゆみ、美ボディ際立つ姿でリハに打ち込む姿を披露「会える日が近づいて来たね」「ドキドキ」