ニュースディープラーニング音声合成 AI音声アシスタント音声コンテンツ NABLAS株式会社

東大発AI総合研究所のNABLAS、テキスト読み上げAI音声合成デモを無料一般公開　自然言語処理技術で音声に関する課題解決やDX推進へ

2022年8月19日 By ロボスタ編集部

AI総合研究所として活動する東大発企業のNABLAS株式会社は、2022年8月18日、ディープラーニングをベースとした音声合成モデルを用いたテキスト読み上げAIのデモサイトを無料一般公開したことを発表した。

第三次AIブームの中心技術であるディープラーニング技術は、あらゆる産業に大きな変革をもたらしている。その一方で、同社は「何ができるのか」「何ができないのか」という点については、十分に理解が広がっていないことも事実だと考えている。
今回のデモ公開を通じて、技術の可能性をより多くの方に知ってもらうことで、先端AI技術について広く技術理解が進むこと、そしてひいてはAI技術の社会実装がより一層進んでいくことに貢献したい、と述べている。

・テキスト読み上げAIデモを無料一般公開。
・ディープラーニングをベースに大規模ボコーダーを活用した音声合成モデルにより、自然な音声の生成を実現。
・音声化は日本語のひらがな、カタカナ、漢字、数字から、簡単な英単語にも対応。
・メール・原稿の読み上げや聴覚障害者のアシスト、音声ガイダンスなどの音声に関する課題解決やDX推進のために応用が可能。
・今後デモページには、NABLAS社が取り扱うディープラーニング技術を幅広く公開していく予定。

一般公開されたテキスト読み上げAIのデモサイトについて

公開したテキスト読み上げAIは、ディープラーニングによる自然言語処理技術を用いて大規模ボコーダー(ヴォコーダー)を活用した音声合成モデルで、任意で入力されたテキストデータをAIが4種類のボイスで音声化する。日本語のひらがな、カタカナ、漢字だけでなく、複雑な熟語にも対応し、数字や簡単な英単語などの入力データからでも自然な音声の生成が可能で、メール・原稿の読み上げや聴覚障害者のアシスト、音声ガイダンスなど、音声に関する課題解決やDX推進といった幅広い場面で産業的な価値をもたらすと期待されている。

今後の展開

AIが人間の言葉を自然な音声で出力する音声合成技術は、ここ数年の進化が著しい分野の1つでもある。同社は、引き続き音声読み上げAIモデルの精度向上に取り組むと同時に、多くの産業やユースケースに対して応用が可能なAI技術の開発を進めていくと述べており、同社が取り扱うディープラーニング技術を活用したデモは、今後もデモページにて幅広く公開していく予定とのことだ。

テキスト読み上げAIデモ：https://demo.nablas.com/tts

関連サイト
NABLAS株式会社