マジですごい! 自分の声の分身が作れる「コエステーション」を使ってみた

東芝デジタルソリューションズ株式会社は、東芝コミュニケーションAI「RECAIUS」(リカイアス)」の音声合成技術を活用して「声」を収集・蓄積・提供するプラットフォーム「コエステーション」を本日より提供開始したことを発表しました。

「コエステーション」とは、自分の声の分身「コエ」を生成できるサービスです。スマホのアプリ(現在はiOS版のみ提供)で自分の声を収録していくことで、自分自身の声を音声合成することができるようになります。



コエステーションの主な機能

「コエ」をつくる

コエステーションのアプリで、いくつかのセリフを読み上げるだけで、「コエステーション」が声の特徴を学習し、声の分身「コエ」が生成されます。読み上げ用のセリフは、最短10文・5分程度から行うことができ、「コエ」の生成は約15~20分程度で行うことができます。

声を作ってみると、画面上には「1時間から数日間」と出るが、現在のところ十数分で完成する


「コエ」で読み上げる

入力したテキストを自分の「コエ」で読み上げることができます。また年齢や明るさなど、自身の「コエ」を自由に変えることが可能です。SNS(LINE、Facebook、Twitter)に投稿し、自分のコエで読み上げた音声をシェアすることができるようです。


「コエ」を育てる

コエは、セリフを読めば読むほど自身により近いものに成長していきます。10フレーズを読み上げて作る「レベル1」から、200フレーズを読み上げる「レベル5」まで5段階の声のレベルがあります。






早速自分の「コエ」を作ってみた

早速スマホでアプリをダウンロードして、コエを作ってみました! アプリは現在のところiOS版のみリリースされているので、Androidの方はリリースを楽しみにお待ちください。利用規約はよく読んでおいてくださいね。

アカウントを作成したのち、アプリの流れに沿ってコエを作っていきます。まず10フレーズを読み上げることで、レベル1の「コエ」を作ることができます。この「コエ」は、さらに読み上げるフレーズ数をこなしていくことでレベルをあげることができ、レベルをあげることでより自分自身のコエに近づいていくのです。

それではここからレベルが上がるに連れて精度が上がる「コエ」を音声で聞いてみてください。レベル1はなぜかコエの生成に失敗したため、レベル2からレベル5の比較になっています(※ 後ほど試したところレベル1も生成することができました)。

こちらがレベル2。動画の前半部分の声は筆者の声。後半部分が声ステーションで読み上げた声。なんとなく似ている。なおレベル1にするには10フレーズの読み上げが必要(実際にはレベル1は作れなかった)で、レベル2にするためにはプラスして50フレーズ読み上げる必要がある。
続いてレベル3。ここでも追加で50フレーズを読み上げた。進化がわかるだろうか。
続いてレベル4。ここでも追加で50フレーズ。自分の声に近づいてきているのがわかる。
そしてレベル5。最後にまた追加で50フレーズを読み上げることで進化した。撮影場所が変わり、音が反響してしまっているが、実際には本当にそっくり。

レベル5になると自分そっくりのコエになりました。自分ではあまりわかりませんが、周りの人は「聞き分けがつかないレベル」だと言っていました。驚きです。

さらに、コエステーションではパラメータをいじることで声の調子を変えることができます。

また、この声はパラメーターをいじることで声の調子を変えることができる。パラーメーターには喜び・怒りなどの感情や、声の高さや話すスピードなどがある

これは本当におすすめです! ぜひアプリをダウンロードして試してみてください。

今後は、既にメディアコンテンツ業界向けに協業を開始している株式会社クリーク・アンド・リバー社をはじめとする多様な業種・業態との共創をすすめ、自分の「コエ」に加え、タレントや声優などさまざまな「コエ」をあらゆる場面でセキュアかつ自由に使える新しい音声文化の醸成を目指す方針だといいます。

例えば、車のナビを自分の子供の声にしたり、SNSなどのメッセージの読み上げが本人の声でできるようになったりしたら、世界がガラリと変わりそうですよね。いやぁ、東芝すごいです。

ABOUT THE AUTHOR / 

ロボスタ編集部
ロボスタ編集部

ロボスタ編集部では、ロボット業界の最新ニュースや最新レポートなどをお届けします。是非ご注目ください。