今日の役に立たない一言 - Today’s Trifle! -

古い記事ではさまざまなテーマを書いていますが、2007年以降はプログラミング関連の話がほとんどです。

機械翻訳を安易に信用してはいけない

ちょっとした英文を書くのに、Exciteのテキスト翻訳を使ってみた。翻訳された英文を読んでみると明らかに変だ。そこで、長い文章を翻訳するのではなく、1文ずつ翻訳するようにした。それでも変なのには変わりはない。ふと日本語の作文技術に、日本語の機械翻訳は困難だと書いていたことを思い出した。日本語の文には暗黙で省略されている単語が多いため、機械翻訳するには、省略されている単語を補った上で、語順や句点の位置を調整するなどして機械翻訳に適した文にしないと正しい翻訳ができないのだ。
適切な場所に句点をつけ、語順を入れ替えてやると前よりはマシな英文が翻訳されるようになった。
もうひとつアイディアが出てきた。翻訳された英文を日本語に翻訳してみたらどうだろうと思った。やってみると、意味が通らない日本語になっている。もとの日本語の助詞を変えたりして英訳→和訳し、もとの日本語と比較するというのを何度か繰り返すと、もとの日本語とほぼ同意の和訳が出てくるようになった。これならば、意図が伝わる英文になっていることは、ある程度期待できる。
英訳の結果が間違っていて、間違ったな英文を和訳した結果の和訳も間違っていて、偶然にももとの日本語と同意となっている可能性もあるが、そうなる確率は低いだろう。
ひとつの例を紹介する。
「これは黒のペンです。」をExciteのテキスト翻訳で英訳すると「This is a black pen.」となる。「This is a black pen.」を和訳すると「これは黒いペンです。」となり、違う意味になっていることが分かる。
「これは黒のペンです。」正しく英訳させるには、暗黙で省略されている単語を補ってやる必要がある。「これは黒インクのペンです。」とすれば、正しい英訳が得られる。
興味がある方は、日本語→英語→日本語の翻訳結果の比較をぜひお試しください。なかなかおもしろいです。