けれどログインを必須にしないと、まれに大量のデータを一気に翻訳させてサーバをパンクさせてしまう人が現れることもあるので、それを防ぐためにログインを必要とする設計にし、意図的に利用者を制限しているんです」(同)
TexTraが収集している翻訳データの出自も、他のツールとは異なる部分があるという。
「世間のさまざまな企業は、各分野に特化した独自の翻訳データを持っていることが多いのですが、NICTはそれらのデータを寄付してもらって高精度の翻訳システムを作り、恩返し的に技術提供をしています。これは、ビジネスの競争原理からは外れたパブリックな組織だからこそ協力してもらえているものであり、NICTには汎用、特許用、製薬用、金融用など、こうして生まれた何種類もの専門分野のエンジンがあるのです」(同)
やはり気になるのは、両者の翻訳力にどのぐらいの差があるのかという点だ。
「客観的に見て、日本語・英語間の翻訳に関してはDeepLと同程度の翻訳精度があると認識しています。さらにいうと、日本語・中国語間や特定の専門分野の翻訳ではTexTraが上回っているようです。率直に言ってDeepLの日中翻訳文にはまだまだ引っかかる部分がありますからね。DeepLはドイツが本拠地ということもありヨーロッパ言語は強く、TexTraを上回っています。このような差が出る理由は、TexTraはアジアを重視しているのに対して、DeepLは欧州に注力しているからですね」(同)
自動翻訳の分野においてTexTraは今後どのような位置づけになっていくのか。
「TexTraの精度は研究や翻訳サーバ、データバンクの発展とともに今後も日々向上していくでしょう。そして、NICTの技術を利用して国内の民間無料自動翻訳サイトの質が向上することになるでしょう。
TexTraは社会に貢献できる技術を第一優先で研究しており、現在NICTでは、2025年日本国際博覧会に向けて、同時自動通訳の研究をしています。同時通訳は時間に制限があるので、重要な情報とそうでない情報を判断して重要な情報だけを出力する技術を作っているところです。これらの技術もTexTraで試験公開しているので見ていただければ幸いですね」(同)
実験と改良が重ねられ、進化し続けるTexTraがどう社会に活用されていくのか、期待して注目したい。
(文=A4studio)