2022 年 12月 26 日 DeepL/Google/Microsoft/Yaraku(β) 翻訳エンジンを比較 - 機械翻訳を活用してより良い訳文に - グローバル化が進む昨今、社内文書や社外文書の翻訳が必要になる機会が増えています。例えばニュースリリースやIR資料など、日本語以外の言語でも公開できればもちろん良いのは分かっているけれど、そこに割けるリソースがない…といった方もいるのではないでしょうか。 近年精度が飛躍的に向上しているAI自動翻訳ですが、世の中にはたくさんのエンジンが存在しています。一番よく知られているエンジンはやはりGoogle翻訳でしょうか?数年前、DeepLが日本語に対応した時には「DeepLの翻訳精度は非常に高い!方言なんかも正しく訳してくれる!」と界隈がざわついたこともありましたね。しかし、エンジンはこれがいい!あれがいい!という話ではなく、用途や状況に応じて使い分けることが大切です。 本記事では複数のエンジンの訳出結果を比較し、その違いや特徴を見ていきます。 ヤラクゼンで使えるエンジン 弊社開発の翻訳プラットフォーム『ヤラクゼン』では、以下4つのエンジンが使用できます。 DeepL独DeepL社が開発する翻訳エンジン。サポート言語は、英語、日本語、ドイツ語、フランス語、イタリア語、スペイン語、オランダ語、ポーランド語、ポルトガル語、ロシア語、および中国語(簡体)。訳文の流暢さに定評があります。Google Translate米グーグル社が開発する翻訳エンジン。世界トップレベルの翻訳品質・スピードを達成しています。Microsoft Translator米マイクロソフト社が開発する翻訳エンジン。Yaraku Translate β大規模なパブリック コーパスでトレーニングされたオープンソースモデルに基づく堅牢なエンジン。 自社施工・自社管理。 29言語に対応。 (ヤラクゼン無料ユーザーが使用できるエンジンは「Yaraku Translate β」のみです。また、有償オプションで「みんなの自動翻訳@TexTra®」も利用できます。対応言語はこちらからご確認ください。) 以上がヤラクゼン上で使用できるエンジンです。本記事では、様々な特性を持つ各エンジンの訳出結果にはどのような違いがあるのか、例を用いて比較してみようと思います。 実際に各エンジンの訳出結果を比較 今回は次のようなニュースレターを英語に翻訳しました。 このニュースレターの翻訳について、各エンジンが異なる訳文を出力した例をご紹介します。※2022年10月現在、ヤラクゼン上での訳出結果です。 1. DeepLが元の日本語と少し違った訳出をしている例 DeepLは「こなれた」、つまり他に比べて流暢な訳文を出力できると定評があります。実際今回のニュースレターでも、「この度ヤラクゼンがVer. 4.0へアップデートされます。」という日本語に対し、DeepLは「We are pleased to announce that YarakuZen will be updated to Ver. 4.0.」と出力しています(画像右側の右サイドパネル参照)。 DeepLは勝手に、文脈に沿った「We are pleased」を追加してくれたのです。ちなみに他の3エンジンはすべて「YarakuZen will be updated to Ver. 4.0」と出力しました。 ヤラクゼンのUIでは、上記のように右サイドパネルで各エンジンの訳出結果を一覧表示することができます!同じページ上で訳出結果をもう一度翻訳にかける「逆翻訳」を実行することも可能です。 また、次の例では他3つのエンジンが「より使いやすい」を「easier to use」と訳している一方で、DeepLは「user-friendly」と、よりコンパクトな表現を出力しました。 2. Microsoftが元の日本語に忠実な訳出をしている例 Microsoftのエンジンでは、他エンジンが落としている細かい情報も落とさずに訳文に反映している箇所がありました。 「『プリエディット・ポストエディット』丸わかりセミナー」という、弊社で開催したセミナーの名前に対する訳文です。 原文 『プリエディット・ポストエディット』丸わかりセミナーMicrosoft "Pre-Edit Post-Editing" Full Understanding SeminarDeepL Pre-editing and post-editing seminarGoogle "Pre-editing/Post-editing" SeminarYaraku (β) "Pre-edit, post-edit" comprehensive seminar 「丸わかり」という表現はAI自動翻訳エンジンにとってなじみがなかったのかもしれません。DeepLとGoogleは「丸わかり」部分をすっぽり落としています。ヤラク翻訳βは「わかる」部分のみを訳出しています。そんな中、Microsoftは「丸わかり」の意味をもれなく反映させて「Full Understanding」と訳出していました。 3. Googleが他エンジンと異なる表現をしている例 Googleのエンジンについては、他と目立って異なる訳文はあまり見かけませんでした。汎用的なエンジンだと言えそうです。しかし、そのような中でもいくつかは他と異なる表現があったので一つご紹介します。 原文 「すべて確認済みにする」ボタンで、全セグメントが確認済みになります。DeepL With the ‘Confirm all’ button, all segments are confirmed.Yaraku (β) Click ‘Check all’ button to check all segments.Google All segments will be confirmed with the ‘Confirm all’ button.Microsoft The Mark All as Verified button confirms all segments. この原文に対しては、全エンジンが異なる訳出をしていました。 まず、「確認」という語彙に対する訳語が「comfirm」「check」「verify」など様々でした。そして、語彙よりも少し大きな文節の単位で見ると、「すべてを確認済みにする」という、原文では前半にあたる節を訳文で後半にもってきているのはGoogleのみでした。 ざっくりと意味をマッピングすると、以下のようなイメージです。対応する意味同士を同じ色で囲んでみました。Googleの訳出結果のみが、文節の順番が違うことが分かると思います。 操作マニュアルなど、読み手の行動を案内するテキストでは、その行動を示す部分(ここでいう「すべて確認済みにするボタンを押す」という部分)を文頭に持ってくることが多いため、ここではGoogleのみがこの文脈において慣習的でない訳出をしているということになります。 ただし、ここでは訳文の良し悪しの話ではなく、異なる表現を参照できることで表現の幅が広がる、という話にとどめておきたいと思います。 4. Yaraku Translate βが他エンジンと異なる表現をしている例 Yaraku Translate βは、今回試したニュースレターの翻訳においては、他エンジンと大きく異なる訳文を出してくることがあまりありませんでした。他の3エンジンに比べて大きく優れている部分や大きく劣る部分がない、汎用的なエンジンと言えそうです。語彙単位では、他のエンジンと異なる表現を出している部分がありました。 「機能追加」の「追加」という部分に対し他3エンジンは「additional」、「added」、「addition」などと訳している中、ヤラク翻訳βは「New features」と訳出しています。 以上各エンジンの文例を取り上げて見てみました。どの表現が適切なのかは媒体や状況によって変わるため、良し悪しについては触れませんが、エンジンが4つある中で1つのエンジンが異なる表現を示してくれることもあるということが分かっていただけたかと思います。訳文を仕上げていく際にはぜひ色々なエンジンの出力を比較してみてください。 まとめ:複数のエンジンを同時併用することで訳文の質を上げる 同じ文書内であっても違うエンジンの訳を採用したい場合があります。例えばニュースレターの中でも、ちょっとこなれた意訳(※)にしておきたい箇所(タイトルなど)、一語一句情報を落とさずに訳出してほしい箇所など様々ですよね。※意訳…元の文の一語一語にとらわれず、文章の目的や意味を汲み取った表現に翻訳すること。 『ヤラクゼン』では複数のエンジンの結果を同時に参照できます。興味を持ってくださった方はぜひ無料トライアルをお試しください。