HOYA株式会社は、開発を手掛けている『ReadSpeaker』の「AI音声合成」がデジタルヒューマン株式会社のデジタルヒューマンの対話機能に採用されたことを発表した。
デジタルヒューマンとは?
「デジタルヒューマン」はAIの頭脳を持ち、映画やゲームで利用できる品質のリアルな3DCGキャラクター。また、対話することができるAIアバターとして、対話型AIやチャットボットと連携して、顔の表情やリップシンク(セリフと唇の同期)したアバター映像をリアルタイムに生成して配信する。
ビジネスシーンでは、受付や案内業務、コールセンター対応業務などに、他にはエンタテインメントシーンでの活用が期待されている。
また、昨今はメタバースのデジタル空間で、人に代わって業務をおこなう新たなデジタルワークフォースとしても活用されていくと予想される。
デジタルヒューマンに必要なリアルな音声合成
これまで消費者が企業に問い合わせる手段は「電話」が選択肢の大部分を占めていた。
近年のテクノロジーの進歩に伴い、消費者が企業とコンタクトを取る接点は電話から、「ウェブ」や「チャット」を経て「メタバース」へ至る「オンライン」にシフトしつつある。
また、新型コロナウィルスの感染拡大防止や、少子高齢化による労働人口減少対策のために、駅、店舗など「リアル」に存在する場にもデジタルサイネージなどの端末を使った「オンライン」の接客ツールが登場している。
そして、オンライン接客ツールに欠かせない要素は二つある。「顔」と「声」だ。「顔だけ」「声だけ」のオンラインツールでも、接客を行うことも可能ですが、「しゃべるデジタルヒューマン」が対応する接客では、「親しみやすさ」や「ちょっとした感情的つながり」といった、あたたかみのある「人間的なつながり」 も築くことが可能になる。
HOYAは、「ReadSpeaker」の「AI音声合成」がデジタルヒューマンの「AIアバター」の声として採用されたことで、「しゃべるアバター」を使ったオンライン接客システムを簡単に実現できるようになった、としている。
「ReadSpeaker」のAI音声合成は「ディープラーニング」テクノロジーによる「機械学習」を使用した、高性能な「音声合成」。デジタルヒューマンのAIが生成する会話を、流暢かつ明瞭な音声で相手に伝えることができ、より一層の自然な会話を実現できる。
クローンとオリジナルボイス
「ReadSpeaker」には、本人の声をAIが学習して、本人に似た声で発話する技術がある。
デジタルヒューマンで実在の人物のクローンキャラクターを作るソリューションと、ReadSpeakerのオリジナルボイス(実在の人物のクローンボイスを作るソリューション)を組み合わせることにより、さらに再現度の高い「分身」「クローン」をオンライン上に再現し、稼働させることが可能になる。
「ReadSpeaker」とは
「ライフケア」「情報・通信」の分野で、国内外トップクラスのシェアを多数持つHOYA株式会社の事業ブランドのひとつ。AIを使った音声合成、人工音声ソリューションを開発している。
同社は、20年以上前から音声合成ビジネスを行っており、大手企業をはじめとして国内1,700社以上、グローバルで10,000社以上が利用している。