Google翻訳の精度がいいらしい

NO IMAGE

サーチエンジンの翻訳サービスについては、Yahoo、Googleをはじめとして国内のgooやexciteといったところでも提供している割とポピュラーなサービスです。

それだけ、需要があるってことなんでしょうけれど、日本人の英語力の無さも反映してますね。

どの翻訳サービスが良いかということを2006年5月12日にも調査しています。(検索エンジンの翻訳機能)結論としては、使いやすさでYahooの翻訳機能がよいという結論付けを行いました。

最近、Google翻訳というページがあることに気づき、いろいろと見ていたところ、面白いことが書いてあることに気づきました。

Google 翻訳 よくある質問の中にあるのです。以下はその内容の抜粋です。

Google で独自の翻訳ソフトを開発したのですか

はい。Google のリサーチ グループが開発した独自の統計的翻訳システムを Google 翻訳に使用しています。

統計的機械翻訳とは

現在市場に出回っている自動翻訳システムのほとんどはルール ベースで開発されており、語彙や文法の定義など多くの作業を必要とします。

一方で、Google の翻訳システムの手法では、ターゲットとなる言語で記述された単一言語のテキストと、人間が翻訳した他言語のサンプル翻訳テキストを対にしたものを大量にコンピュータに入力します。そしてこれらのテキストに統計的学習手法を適用して、翻訳モデルを構築しています。Google のリサーチ評価では、この手法が優れた結果をもたらすことが判明しています。

Googleが最も得意とする手法を用いた翻訳サービスということです。しかも、システムが稼働している以上、翻訳の精度は永久的に上がっていくということです。また、言語の種類は関係なく様々な言語間の翻訳が可能になります。

ただ、このシステムには、大きな問題があるのです。

統計的ということは、サンプル数が多ければその精度は高まりますが、サンプル数が少ないと、はっきり言って使い物にはなりません。

現在の状況を見てみると、翻訳精度そのものには、まだまだ改良の余地は残されているようです。

しかし、慣用句など常用的に使うセンテンスについてはかなり高い精度の翻訳がなされています。時間がかかるかもしれませんが、人件費やサーバ維持管理以外のコストは全くかかりません。メンテナンス性も高く、永続したサービス提供が可能になりますので、時間がすべてを解決してくれるという訳です。

今からもう2年経てば、また精度は上がっていくことでしょうし、5年、10年と時間が過ぎていくことによって、より人間らしい表現にまで精度は上がるかもしれません。

Google翻訳 Beta