夢のリアルタイム音声翻訳、マイクロソフトがAI技術を使った「Microsoft Translator」と「Skype翻訳」を発表、そのしくみと狙いは? PowerPointアドインも登場

スマートフォンで4人のメンバーが入室したチャットルーム。
4人のメンバーはそれぞれ別の言語を使う。英語やドイツ語、中国語、彼はフランス語だ。しかし、彼のスマートフォンの画面では、みんなそれぞれの言語で話しているにも関わらず、会話はフランス語のテキストで表示され音声も流れる。それぞれ画面でそれぞれの自国語で会話が進む。
これは、ほかの3人の会話をシステムがリアルタイムで翻訳して発話しているから。

ドイツ語、英語、中国語、フランス語の会話をシステムがリアルタイムに翻訳して伝える「Microsoft Translatorライブ機能」(最大100人までを想定)

マイクロソフトは4月7日、AI技術(ニューラルネットワーク/ディープラーニング)を活用した新バージョンの「Microsoft Translator」を発表した。この技術はリアルタイム翻訳を実現する技術となる。
記者発表会で展示されたスカイプでは、日本語を使う人と英語を使う人が会話をしている。日本語を使う人が話すのは日本語、イヤホンに聞こえてくる相手の話も音声合成の日本語で聞こえてくる。

記者発表会で体験展示されたスカイプ。体験者は日本語で会話をしているが、通話先の相手は英語しかできない。発話は日本語→英語に、相手の音声は英語→日本語に、「スカイプ翻訳」がリアルタイム翻訳している

「確かに今、多くの企業が翻訳技術にニューラルネットワークを活用し始めていて、競争になっています。ニューラルネットワークの技術を持たない翻訳システムは撤退することになるでしょう。それほどニューラルネットワークによる機械翻訳は精度が高いのです」
これは、報道関係者からの質問に答えて、来日中の米マイクロソフトのAI & Researchグループリーダーのオリヴィエ・フォンタナ氏が語った言葉だ。

オリヴィエ・フォンタナ氏(OLIVIER FONTANA)、マイクロソフト コーポレーション、AI & Research グループ ディレクター(機械翻訳プロダクト戦略担当)




リアルタイム翻訳を実現する「Microsoft Translator Speech API」

リアルタイム翻訳の提供方法のひとつが、Microsoftのクラウドプラットフォーム「Azure」のAPI(Cognitive Services API)、「Microsoft Translator Speech API」としてサービス提供される形態だ。
また、更にそれを組み込んだ「Microsoft Translator ライブ機能」のリリースも発表した。

「Microsoft Translator Speech API」(https://www.microsoft.com/ja-jp/translator/getstarted.aspx)

また、今後は同社のほぼすべての製品へこの翻訳技術を導入していく予定だ。
具体的にどのようなものに組み込まれる予定なのかを次に見ていこう。

ABOUT THE AUTHOR / 

神崎 洋治
神崎 洋治

神崎洋治(こうざきようじ) TRISEC International,Inc.代表 「Pepperの衝撃! パーソナルロボットが変える社会とビジネス」(日経BP社)や「人工知能がよ~くわかる本」(秀和システム)の著者。 デジタルカメラ、ロボット、AI、インターネット、セキュリティなどに詳しいテクニカルライター兼コンサルタント。教員免許所有。PC周辺機器メーカーで商品企画、広告、販促、イベント等の責任者を担当。インターネット黎明期に独立してシリコンバレーに渡米。アスキー特派員として海外のベンチャー企業や新製品、各種イベントを取材。日経パソコンや日経ベストPC、月刊アスキー等で連載を執筆したほか、新聞等にも数多く寄稿。IT関連の著書多数(アマゾンの著者ページ)。