2012年3月16日金曜日

Microsoft、自分の声で26か国語を話せる「翻訳こんにゃく」的技術を公開

Microsoft ResearchはTechFest 2012の基調講演で、テキストデータとして入力された文章を26か国語に翻訳、話し言葉として読み上げる通訳技術デモを公開した。

このデモのポイントとしては、音声入力したユーザーのアクセントや声色、イントネーションを維持した上で、その音声を再構成する形で26か国語に翻訳してしまうこと。つまりドラえもんの秘密道具「翻訳こんにゃく」のように、音声入力者がネイティブで26か国語が話せる技術に一歩近づいたと言える。

デモでは長めの英語の文章を入力し、それをイタリア語やスペイン語、北京語などに翻訳してみせている。この技術は同社のクラウドプラットフォームWindows Azureを利用しており、言語や変換のクセを学習させる必要はないという。

さらにこのデモでは、Webカメラで撮影した映像から3Dモデルと表情のテクスチャを自動生成するアバターを作り、話すときの顔も再現してみせた。この技術が実用化されれば、将来的にはスマートフォンで海外の人と話すと、ほぼリアルタイムで通話を翻訳して会話のできる時代が来る……といいなあ。

0 件のコメント:

コメントを投稿