あなたの声を最先端テクノロジーで高品質に再現 個人向けの「デジタルボイス・プレミアム」をコエステが提供開始

エイベックス子会社のコエステ株式会社は40年以上にわたる研究開発により培われた音声合成技術をもとに、エイベックスのスタジオで収録する音源から個人の声の特徴を学習し、いつでも音声出力できるようになる「デジタルボイス・プレミアム」を2020年9月8日より提供開始することを発表した。価格は50万円(税抜)。


今の「声」を残しておきたい個人向けサービス

「デジタルボイス・プレミアム」は自分の声をさまざまな分野で広く活用したい、もしくは病気などの理由で今の声を残しておきたいと考える個人に向けたもので、収録した音声からその特徴を抽出した声の分身=「コエ」を作成しておくことで、テキストを入力するだけでその人の声色や喋り方を再現した合成音声をいつでも生成できるようになる。


エイベックスのスタジオで音源を収録

活用できるシーンは多岐にわたり、たとえば忙しい経営者に代わって本人不在の場でも広く講演やプレゼンテーションを行ったり、創業者の「コエ」で何代にもわたって従業員に新しいメッセージを届けたりできるようになる。また自身の葬儀や大切な人の冠婚葬祭などで、生前の「コエ」でメッセージを送ることや、もし病気や怪我などで声を失っても、自身の「コエ」でリアルタイムにコミュニケーションを取り続けることなどが可能になる。



今後はSNSメッセージを送信者本人の「コエ」で送ったり、スマートスピーカーの音声を身近な人の「コエ」で出したりなど、各種サービス企業との連携実現を目指している。


人間に近い自然な発話を再現する「コエステーション」

音声合成は人間の音声を人工的に作り出す音声情報処理の一分野。昨今IoTの普及などで音声インタフェース(Voice UI)の重要性が高まり、スマートスピーカーの音声や動画のナレーションなど活用される場が急速に広がっている。

一般的に音声合成はロボットのような無機質な機械音のイメージが大きいが、コエステが提供する「コエステーション」は収録音声の音色や抑揚、リズムなどの特徴を合成音声に最適に反映する技術や、統計的な学習に基づく滑らかなパラメーターを生成するコア技術により、人間に近い自然な発話が可能で、再現性の高さが特徴。

今後IoT化が加速し、音声インタフェースを持つサービスやデバイスがさらに広がっていく中、特定の個人や有名人の「コエ」による音声出力へのニーズは高まっていくことが予想される。同社は「コエ」を活用できる可能性のある多方面の分野における各種サービス企業との連携を進め、活用できるシーンをこれからさらに広がっていく予定。

ABOUT THE AUTHOR / 

山田 航也
山田 航也

横浜出身の1998年生まれ。現在はロボットスタートでアルバイトをしながらプログラムを学んでいる。好きなロボットは、AnkiやCOZMO、Sotaなどのコミュニケーションロボット。

PR

連載・コラム