日本語のGoogleアシスタントに新しい声が追加!DeepMindの最先端テクノロジー「WaveNet」で自然な会話を楽しめる

Googleアシスタントは、言語によって“声”を選択してパーソナライズすることができることをご存知だろうか?
これまでとは違うGoogleアシスタントの声を選ぶことで、また違った発見があるかもしれない。

2017年に8言語に対応していた同機能は、現在では30言語以上にまで増えており、この度、日本語を含めた9つの言語向けに新しい “声” が加わることをGoogleが9月19日に発表した。
今週から順次利用できるようになる新しい音声では、DeepMindの最先端テクノロジー WaveNetが使われており、聴き取りやすい自然なトーンとイントネーションでアシスタントとの会話を楽しめる。
対象となる言語は、日本語、ドイツ語、フランス語、オランダ語、ノルウェー語、イタリア語、韓国語、イギリス英語、インド英語だ。なお、米国では既に11種類の英語の音声が使用可能となっている。

アシスタントの音声を変更するには、Googleアシスタントアプリの[設定]画面から、[アシスタントの音声]を選択することで、ユーザーは、性別ではなく色分けで表示された音声から、自分のお気に入りの “声”を選べる。
今回新しく音声が追加された対象言語を利用しているユーザーがはじめてGoogleアシスタントをセットアップする際は、「赤」または「オレンジ」のいずれかの音声がランダムに設定されるようになっている。




DeepMindのWaveNetについて

Google傘下であるDeepMind社のWaveNetモデルは、他のテキスト読み上げシステムよりも自然な音声が生成される。これは、同モデルが一連の合成音声が用意されているだけでなく、生の音声波形をゼロから作成するからだ。
大量の音声サンプルを使ってトレーニングされたニューラル ネットワークを使用し、トレーニング中、同ネットワークでは、やりとりしている声調、実際の音声波形など、音声の基になる構造を抽出する。テキスト入力すると、1秒間に最大24,000のサンプルより、個々のサウンド間のシームレスな遷移を使用して対応する音声波形をゼロから作成できる。

WaveNet、他の合成音声、人間の音声の比較を示すグラフ
DeepMind / WaveNet launches in the Google Assistant(英語)
https://deepmind.com/blog/article/wavenet-launches-google-assistant

ABOUT THE AUTHOR / 

ロボスタ編集部

ロボスタ編集部では、ロボット業界の最新ニュースや最新レポートなどをお届けします。是非ご注目ください。

PR

連載・コラム