家電ちゃんねる

家電ちゃんねるです。いろんな最新科学や家電を紹介していきたいと思っています。みなさん、どうぞよろしくお願い致します。あと、リンクも、見てみてください。【ワールドニュースちゃんねる】(政治・経済・エンタメ 関係)、【2次元ちゃんねる】(映画・アニメ・マンガ 関係)というブログを書いています。アレな情報が載っています。よろしくお願いいたします。

音声認識・機械翻訳は、「言葉の壁」を取り払えるのか?

さて、今回はAI翻訳についてです。

f:id:electronic-channel:20180421140751p:plain

 

・「ほんやくコンニャク」は実現するのか?

 

ほんやく(翻訳)コンニャクと言えば、国民的大衆漫画「ドラえもん」のドラえもんが取り出す「未来のひみつ道具」の一つで、食べると相手の言語が日本語に聞こえ、自分が日本語で発言してるつもりでも発する言葉は、相手の言語になるという便利な道具で、外国人との意思疎通には欠かせない。宇宙人や動物にも使用していた。

 

こうした万能翻訳ツールに対する渇望は世界中にあるようで、SFの世界では割とメジャーな存在だ。

 

例えば、海外SFドラマ「Star Trekスタートレック)」においても万能翻訳機はストーリーで重要な位置を占めており、Microsoftの翻訳アプリ「Bing Translator」は標準で劇中に登場する「クリンゴン語」の翻訳に対応している。

 

英国の作家ダグラス・アダムスが記したSFコメディ「The Hitchhiker's Guide to the Galaxy(銀河ヒッチハイク・ガイド)」では、「Babel Fish(バベル魚)」という魚型の万能翻訳機が登場しており、これを耳から挿入する事で宿主の脳波を糧に周囲の音を取り込んで言語変換を可能にするという。

 

SF世界では異星人との交流が当たり前なので、ドラマを生み出すための道具として欠かせないものというわけだ。

 

・人はなぜ、万能翻訳機を求めるのか?

 

SFの世界に限らず、言葉の壁を越えて相手とコミュニケーションを取りたいという欲求は普遍的に存在しており、語学学習に対するニーズは非常に高い。

とはいえ、近似している欧州圏内の隣接言語でさえ互いのコミュニケーションは大変なようで、言葉を上手く話せずに同じ出身国者同士で固まってしまうという現象もよく見られるという。

英語に比較的近く、英語習得レベルが高いと言われるドイツ人達でさえ「込み入った話は英語では難しい」と、ドイツ人同士で固まってしまうありさまだった。

「日本語と英語は文法が全然違うから日本人が英語を習得するのは欧州人より難しい」という話はよく聞くが、程度の差こそあれ抱えている事情はみな一緒という。

 

さて、そうした彼らが語学学習に向かう一番のモチベーションは何だろうか。

フランス人やスペイン人らは、「外国で働くため」という仕事上の理由を挙げており、移動の自由のあるEU圏内ならではの事情が見られた。

英語が比較的に達者な女性達に学習方法やそのきっかけについて聞いたところ、純粋に「外国にいる友人らと共通して話せる言語を学びたい」といった理由を挙げていた。

 

だが実際のところ、多くの人にとっての理由は非常にシンプルなもののようだ。

英The Telegraphによれば、語学学習アプリを提供するBabbelがユーザーらを対象にした最新のアンケート調査結果では、その理由の4割を「旅行」が占め、「移住」や「教養」といった回答を大きく引き離している。

 

今でこそ航空運賃やビザの障壁が下がって人の行き来が簡単になり、欧州などのように外国人と触れる機会はそれほど珍しいものではなくなっているが、「海外旅行」は外の世界に触れる貴重な機会である事に変わりはない。

その瞬間や体験を最高のモノにすべく、事前に備えるのは自然な行為かも知れない。

 

スマホの活用と、進化する翻訳

 

「海外旅行で相手と意思疎通を図りたい」というニーズに対し、最近になって登場した強い味方がスマホだ。

電子辞書やフレーズ集などは昔からあったが、スマホは非常に高機能であり、文章翻訳もこなしてくれる。

最近ではさらに高度なものとして、撮影した写真の中にある単語や文章の翻訳をしたり、音声を取り込んで通訳をこなしてくれるアプリまで存在する。

 

海外のメニューは、日本のように写真付きではなく料理名と解説と値段のみ記されたものが一般的だ。

観光客向けではない地元のレストランに行った時などは、現地語でしか解説が書かれていない事が多い。

例えば、フランスでインド料理屋や中華料理屋に入った時、料理名から解説まで全てフランス語で書かれている為、英語しか分からない人が読み解くのはなかなか難度が高い。

こうした時にスマホのアプリが大いに役に立つ。

スマホの通訳アプリとしてメジャーなのはGoogle Translate」Microsoft Translator」の2つだ。

どちらもAndoroid版とiOS版の両方が用意されており、文章や単語翻訳の他、写真撮影によるOCR翻訳、音声中継による通訳機能がサポートされている。

無料で利用出来る点もポイントだ。

また、Microsoft Translatorにはグループ中継機能が用意されており、同じグループ内のメンバーがスマホのマイクに向かって発言すると、残りのグループメンバーの端末にはそれぞれの言語(同じ言語でなくてもよい)への翻訳文が表示され、一種のリアルタイム通訳のような事が可能となる。

 

2017年末に日本マイクロソフト社内で記者向けの忘年会が開かれ、同社執行役員常務でマーケティング&オペレーションズ部門担当のマリアナカストロ氏が挨拶した際、本人が英語とスペイン語を混ぜたスピーチでMicrosoft Translatorに話しかけると、参加者のスマホにインストールされた同アプリが日本語に自動翻訳して画面に表示するというMicrosoft Translator Live」機能が紹介された。

 

このように非常に便利な翻訳アプリだが、いくつか弱点がある。

その1つが「オフライン利用」だ。

Google Translate」と「Microsoft Translator」ともにクラウド側の処理機構を使っており、翻訳処理中にスマホを「機内モード」に変更するとエラーで処理が止まってしまう。

最近でこそ安価なローミングサービスが増えつつあるほか、欧州内では2017年6月以降は国をまたいだローミング利用が無料になっているが、「海外ではデータ通信をオフにしている」というユーザーもいると思う。

そんな時は現地の無料Wi-Fiなどを活用する事になるが、常に使いたい場所でWi-Fiが利用出来るわけでもない。

翻訳需要が旅を主目的としたものならば、こうした事態は致命的であり、GoogleMicrosoftともにアプリ向けに事前にダウンロード可能な言語パックを提供している。

これを現地に移動する前にあらかじめダウンロードしておけば、到着後すぐにオフライン環境でも翻訳アプリを利用出来る。

 

各言語の単語やフレーズごとに、それに当てはまる対訳を記録し、データの塊としてサーバ上で統計処理する事で翻訳精度を向上させる仕組みは「統計的手法による機械翻訳(SMT:Statistical Machine Translation)」と呼ばれ、一昔前までの一般的な手法だった。

単語単位や汎用的なフレーズには特に有効な為、「旅行先での翻訳用途」には十分な効果を発揮するはずだ。

一方で、文章としての前後の繋がりや、単純に単語のみを見るだけでは意味を取り違える可能性の高いフレーズなど、翻訳として「どうしても不自然」というケースも少なくない。

翻訳精度が上がったと言われる昨今においてもなお、欧州言語圏の翻訳に比べ、日本語への変換は不自然さを伴う。

 

そこで登場したのが機械学習モデルを採用した「ニューラルネットワーク」型の翻訳サービスで、より自然な翻訳を目指している。

この翻訳エンジンの切り替えについて、Googleは2016年9月に成果を報告しつつ、同年11月にGoogle Translateへの導入を発表している。

Microsoftも2016年11月に、その成果を発表して検証ページをオープンしている。

 

・進化するニューラルネットワーク

 

ここでもう少し、ニューラルネットワーク型翻訳について見ていく。

Googleはこの仕組みに「Neuraachine Translation(NMT)」と名付け、同社の名称を付けて「GNMT(Google's Neural Machine Translation)」などとも呼んでいる。

Googleが公開した解説記事のサンプルでは中国語から英語への変換が紹介されているが、入力した漢字をそれぞれエンコーダーで分解し、デコーダーで英語への変換を行っている。

ここで「LSTM(Long Short Term Memory)」という仕組みが用いられているが、これは「深層学習(Deep Learning)」の世界において、特に自然言語処理や翻訳など互いの依存関係の把握と解決が必要なケースで重要な役割を果たしている。

 

ここまでの解説にあるように、自然な翻訳を実現する上では文書全体の個々の単語の繋がりの把握が必要となる。

「Aという問題に対してBという答え」というシンプルな計算の場合は問題ないが、翻訳のようなケースでは入力された文章全体を把握、つまり前後の依存関係が重要になるというわけだ。

そこで登場するのが「RNN(Recurrent Neural Network)」モデルで、内部にループ構造を持たせる事で前後の入力データを維持し、互いの依存関係を意識した処理を可能としている。

 

ただ、RNNそのものは短期(Short Term)の依存関係の把握には問題ないものの、長文翻訳のように数百や数千単位の長期(Long Term)の依存関係の把握は難しく、それを解決すべく考案されたのがLSTMという事になる。

LSTMはMicrosoftニューラルネットワーク型翻訳にも採用されており、ここ数年の翻訳エンジンのトレンドとなっている。

大量の辞書(コーバス)にGPUを組み合わせてDNNを構成しており、Googleの場合はTPU(TensorFlowによる機械学習用のプロセッサ)TensorFlow(Googleが開発してオープンソースで公開している機械学習に使うソフトウェアライブラリ)を組み合わせた大規模処理を用い、Microsoftでは「BrainWave」の仕組みを組み合わせ、恐らくはGPUFPGAを組み合わせたハイブリッドな仕組みでの運用が行われているのではないかと予想している。

 

Microsoftは今年2018年3月に「Microsoft reaches a historic milestone ,using AI to match human performance in translating news from Chainese to English」というブログ記事を公開したが、その内容は「newstest2017」というテストで中国語から英語への翻訳が「人間と同等の水準になった」というものだ。

いくらニューラルネットワーク型翻訳が進化したとして、「最後のわずか数%の部分の調整でやはり人手を介した自然翻訳にはかなわない」というのがGooleとMicrosoftの両サービス共通の認識だったが、この壁をクリア出来たというのがその趣旨となる。

実際、中国語と英語の翻訳に関する研究は非常に盛んであり、恐らく全ての言語の組み合わせでも世界トップクラスだろう。

ゆえに、ほぼ納得のいく翻訳クオリティを実現する万能翻訳機が登場するのであれば、まずは中国語を含めた欧州言語が最初にカバーされる事になると予想している。

実際、これらの言語は英語さえ理解出来ていれば遜色無いレベルで内容が把握可能だと認識している。

日本語についてもそう遠くない将来、遜色無いレベルの相互翻訳が可能になると信じている。

 

・オンラインとオフラインの壁

 

翻訳精度の向上に膨大なコーバスとGPUなどを使ったDNNによる膨大な計算を使う事は、これを実現するクラウド、つまりデータセンターの存在が必要不可欠となる。

常時ブロードバンド環境が利用出来るのであれば問題ないが、人々が万能翻訳機を利用する為の最初のモチベーションである「旅行」の用途には少々心もとない。

これは翻訳の部分だけでなく、スマートスピーカースマホ内臓の音声アシスタント機能において、音声認識構文解析クラウドが用いられているという背景もある。

オンラインとオフラインの壁が存在する事で、スマホ本来の機能が削がれ、どこでも使える「ほんやくコンニャク」を実現する為のコンパクトな装置の実現が難しいというわけだ。

 

そこで登場するのが「インテリジェントエッジ」という事になる。

全ての処理をクラウドに依存するのではなく、処理の一部や多くを末端デバイスである「エッジ」に移し、レスポンスの向上や通信量の削減を行うものだ。

クラウド依存であった音声認識や翻訳機能を「エッジ」側に搭載する事で、一部の学習データの送信といった処理を除いたほとんどが端末内で完結する事になる。

Qualcommが最新のSnapdragon 845でデモンストレーションを行っていたが、年々進むスマホの処理能力向上により過去数年では難しかった技術のモバイルへの転用が実現しつつある。

 

こうした最新の成果の一端がうかがえるのが、Microsoftが2017年10月にブログで公開した「Microsoft and Huawei deliver Full Neural ON-device Translations」と「Bring AI translation to edge devices with Microsoft Translator」という2つの記事だ。

 

前者は、「HUAWEI Mate 10」シリーズに搭載されたKirinプロセッサのNPUを使う事で、ニューラルネットワーク型翻訳のデバイス内実装を実現した」という話。

 

後者は、そのデバイス内実装の背景について解説しており、NPUのようなDNNの学習モデルを効率的に実装出来る仕組みが登場する事で、モバイルデバイス特有の「メモリ」「処理能力」「バッテリー」といった問題を解決出来るという。

今後、重要になるのは機械翻訳手法の向上と、それを実装出来るデバイスの存在だろう。

4月18日に「Microsoft Translator」でオフラインでもニューラル機械翻訳が利用出来るようになった事が公式に発表された。

これは日本語も、サポートしている。

 

※海外旅行なら、こちらからどうぞ⇩