AIで超高精度な歌声合成を再現! もはや人間との判別も不可能?

株式会社テクノスピーチと名古屋工業大学 国際音声言語技術研究所は、人間の声質・癖・歌い方をこれまでになく高精度に再現できる歌声合成技術を開発したことを発表した。

テクノスピーチと名古屋工業大学は共同で音声合成・歌声合成技術の研究・開発に取り組んでおり、これまでに業務用カラオケ機器「JOYSOUND」や音声創作ソフトウェア「CeVIO Creative Studio」等に音声合成・歌声合成技術の導入を進めてきた。

今回発表された研究では、特定の歌唱者の約2時間の歌声データベースに対して、深層学習等のAI技術を適用することにより、歌唱者の声質・癖・歌い方を学習。合成の際は、任意の歌詞付き楽譜を入力するだけで高品質な歌声を合成することもできるという。

視聴用ページから「現行技術」と「新技術」をアカペラで聴き比べてみると明確に違いがわかる。

アーティスト(故人を含む)の歌声再現、楽曲作品制作やゲーム開発への応用、バーチャルユーチューバーによる配信・イベント、バーチャルアクターによるアフレコシステム、人工知能や音声対話システムの発声モジュールへの導入、外国語教育・歌唱教育における柔軟な参照音声の生成、ALS・喉頭がん等の患者様が用いる発声デバイス、介護施設用デジタルサイネージなど、様々な分野での活用を見込んでいる。

ABOUT THE AUTHOR / 

ロボスタ編集部
ロボスタ編集部

ロボスタ編集部では、ロボット業界の最新ニュースや最新レポートなどをお届けします。是非ご注目ください。

PR

連載・コラム