今回は華村@中国さんの『note』からご寄稿いただきました。
自動翻訳を使いこなすのに言語力が必要?(note)
少し前にとある事情で大量の中国語を日本語に翻訳しなければならない場面があり、ヒイヒイ言いながら作業しました。その際に少しでも作業負担を減らせないかと思い、ネットで使える自動翻訳サービスであるDeepL翻訳を使って、初めてまとまった量の翻訳をしてみました。その時に感じたことを書いてみます。
DeepLはGoogle翻訳などに比べて精度が良いと評判らしい(Wikipediaにあった記述なのでどこまで事実か知らんけど)のですが、それでも致命的な誤訳が出てくることが結構ありました。
細かいニュアンスの差や単語の解釈違いと言ったレベルではなく、主述や使役の関係が間違っていたり、ひどい時には文意からして真逆ということもありました(「〜があります」なのに「〜がありません」になっているレベル)。
しかもそれを、かつて2ch等でネタにされていた支離滅裂な文章*1 ではなく、文構造としてはかなり整った文章として出してくるので、うっかり騙されそうになるのが怖いところです。
*1:「2ちゃんねる用語を再翻訳してみた 1」2010年3月5日 『ニコニコ動画』
https://www.nicovideo.jp/watch/nm9914442
結局自分で原文を確認しながらやっていくしかなく、訳したものをそのまま使えるようなことはほとんどありませんでした(前後の文脈からして「いやそれは絶対違うだろ」という文章が出て来れば、その解釈になる可能性が消えることが翻訳の手がかりになるので、そういう意味では翻訳のスピードアップに貢献はしているのですが)。無料サービスですし、なかなかそう都合良くはいきません。
そしてもう一点気がついたのが、原文による翻訳精度の差です。
原文が冗長でなくスッキリと一意に取れる文章であれば、翻訳を通してもそれなりに近い意味の文章が出力されます。逆に原文の時点で無駄な繰り返しが多かったり修飾関係がわかりにくいような文章を入れた場合は、やはり出力される訳文も意味が通らないものになりやすいし、間違いも起こりやすくなります。
当たり前といえば当たり前なのですが、実際にやってみると違いを顕著に感じました。僕が翻訳した中にはいろいろな人がいろいろなシチュエーションで書いた文章が含まれていたのですが、原文が僕にも読みやすいようなものは翻訳を通すことで効率化につなげることができるのに対し、冗長で読みにくい文章では自動翻訳を通さず文脈から判断した方が早い場合が多かったです。
ここから気付かされるのは、「自動翻訳を使うのにも言語力が必要」ということです。
まず、外国語の文を読むためのツールとして。DeepLの現状の能力では、出力されてくる翻訳文が正しいものかどうか自分でチェックできないと、とてもではないが使うことはできません。まるごと信用すると、致命的な誤訳がそのまま流れてきてしまいます。それに気づくためには、結局もとの外国語文をある程度読み解く力が必要になります。
そして、自分が書いた文章を外国語にするツールとして。この場合には、母語で過不足なく自分の書きたいことが表現でき、かつ文法的な誤りがない文を書くことができないと、翻訳文の精度も上がらないということが言えます。正しく意図を伝えたければ、まず母語の精度が必要になります。
「母語で過不足なく自分の書きたいことが表現でき、かつ文法的な誤りがない文を書くことができる」というのも、簡単に身に付くスキルではありません。少なくとも、誰もが持っているスキルではないでしょう。僕自身も、まったく出来ている気がしません。
言葉(外国語)がわからない人を補助するためのツールとして自動翻訳があるはずなのに、使うためには言語力、つまりリテラシー(literacy)が必要になるというのは、なんだか矛盾しているような気もします。テクノロジーは弱者の味方じゃないのかよ、と文句のひとつも言いたくなります。
データがもっと大量に集まって深層学習(?)が進めば、こういう揺らぎもどんどん是正されて精度が上がっていくのかな? 個人的な勘ですが、どうもそうではないような気がしています。
近年はある情報にアクセスする能力があるかないかで生活の豊かさに大きな差が開くような時代らしいですが、その流れを補強・増幅するような例がこんなところにもあるのか…と気づかされて、なんだか落ち込みました。
目まぐるしく発達していく世界になんとかついていくには、まだまだ勉強することが山ほどありそうです。
執筆: この記事は華村@中国さんの『note』からご寄稿いただきました。
寄稿いただいた記事は2021年7月19日時点のものです。