対話コミュニケーションにおいて「誰の発言なのか」という情報は極めて重要だ。
フェアリーデバイセズ株式会社は、音声認識クラウドAPIサービス「mimi cloud API service」において、これまでβ版として提供してきた話者識別API「mimi SRS」を正式サービスとしてリリースしたことを7月10日に発表した。
同システムは、入力された音声データから発話者を識別する機能で、事前に音声を学習させた複数の話者が所属する話者グループの中から音声によって話者を特定し、どの話者が発話したか、もしくは話者グループには含まれない別の話者であるとして識別する。
また、mimi cloud APIを通じて「話者」の登録や学習、識別候補者の集合である「話者グループ」の作成や編集も可能だ。
「mimi」 について
mimiは、同社が展開する、機械が音の情報を今よりも深く幅広く認識するためのテクノロジーの総称であり、音声対話システムのためのクラウドAPIシステムとしてサービス提供されている。
同サービス利用製品は累計200万台に達しており、高度な音声対話システムを構築するための疎結合なソフトウェアスタックであり、マイクアレイ・フロントエンド処理機能を担う「mimi XFE」、多言語での音声認識及び翻訳機能、音声合成を担う「mimi ASR/TRA/TTS」、話者識別機能を担う「mimi SRS」、環境音識別機能を担う「mimi ESR」等からなるクラウドAPIサービスだ。
なお、Googleアカウントでログインすると1日50回までの無料評価試用が可能となっている。
https://console.mimi.fd.ai/
http://www.fairydevices.jp/mimi_about.html
■【動画】mimi ASR 認識速度デモ
mimi SRSの特徴と利用イメージ
同システムは、どんな発話内容でも事前学習と話者識別が可能。数秒程度の発話から、高精度に発話者を識別でき、mimi cloud API serviceの他API群とシームレスに連携する。
家族でコミュニケーションロボットを共用する場合
家庭にあるコミュニケーションロボット一台を家族みんなで共用するような場合、話者識別なしでは、ロボットからは画一的な応答になりがちだが、同システムはユーザーに意識させることなく自然に話者識別を行うため、コミュニケーションロボット等による「パーソナライズされた応答」を可能にした。
議事メモ等で利用する場合
会議での発言内容を記録するソリューションなどでは音声認識によって発言内容をテキスト化することはできても、それのみでは「誰の発言内容であるか」まではわからない。そのような場合、mimi SRSで発言内容と発話者を紐づけることで、より効果的なソリューションに進化できる。
クリアな音声集音による高精度な音声認識、話者識別結果
複数人で利用するような場合、会議室などの実際の業務現場はさまざまな雑音に満ちているため、「認識しやすいように」マイクに向かって大きな声で発話させるようなものではユーザー側に負担を強いるだけでなく、コミュニケーションの妨げにもなる。
同社の音前段処理「mimi XFE」に含まれる「音源定位」「音源分離」などと組み合わせることで、発話者の方向を特定し、その声だけをクリアに抽出することができるため、音声認識と話者識別の精度を高めること可能。ユーザーもマイクを意識する必要がない。
なお、mimi XFEは音声認識技術のフロントエンド処理を担い、「mimi」の開発と運用で培われた知見を基に開発されたマルチマイクハードウェアのFairy I/Oシリーズに搭載されている。
今後の展開について
同社は人間と機械とのコミュニケーションをより自然なものとするため、音声認識処理に関連するソフトウェア開発と、音声を正確に集音するためのハードウェア開発の両面を合わせて行うことで、人と機械の境界面を革新しようとしている。
具体的には、「話者識別機能」に加え、多言語での「音声認識・翻訳・音声合成」、「環境音認識」などを組み合わせることで、企業研修、社内ブレスト、接客カウンターでの活用など様々な業務現場でのビジネスやソリューション開発を支援することも可能と考えており、業務現場における音声AI技術活用のリーディングカンパニーとして、デジタルトランスフォーメーションのさらに先の世界を見据え、これまでの音声認識技術では踏み込めなかった領域を、ソフトウェア・ハードウェアの一体開発によって切り拓いていくと述べている。
下北沢駅にオムロンの案内ロボが入社へ フェアリーデバイセズの音声処理技術を活用
日本発ビジネス用スマートスピーカー「Tumbler」、GoogleやNICTとの連携も選べる音声・翻訳システムをフェアリー社が開発
フェアリーデバイセズ株式会社