NTTドコモが音声対話開発キット「codama」(こだま)を発表!電子機器やIoT機器に音声対話機能を短期間で実装できる

株式会社NTTドコモは、IoT機器に音声対話機能を実装できるRaspberryPi対応の音声対話開発キット「codama(こだま)」を発売することを12月3日に発表した。
「こだま」はXMOS Ltdのボイス・プロセッサーとボイス・テクノロジーを採用し、ユカイ工学株式会社との共同開発で商品化。12月21日よりユカイ工学から発売される。

音声対話開発キット「codama」はドコモAIエージェントAPIとの連携により、「RaspberryPi」に直接搭載することができる拡張ボード。開発者はこのキットを活用することで、電子機器やIoT機器に音声対話機能を実装することが短期間の開発で可能になる。

左が本体(64mm(W)x55mm(L)x20mm(H))。右マイク・ボード。ほかにマイクと本体を接続するフラットケーブルが付属

またキットには、XMOSのボイス・テクノロジーが採用され、製品が部屋の隅に置かれている場合でも、あらかじめ設定した音声キーワード(ウェイクアップワード)で起動。クリアに音声をキャプチャーし、音声によるAIサービスへのアクセスを可能する。

【音声対話開発キット「codama」の主な機能】
・Raspberry Pi (ラズベリーパイ) 標準の40PINに接続し作動。簡単にセットアップ可能。
・4つのリニアー・マイクアレイ搭載。マイクアレイボードは分離し、ケーブルで自由配置可能。
・ウェイクアップキーワード検出エンジンを搭載。任意のウェイクアップキーワードを設定可能。
・バージイン機能を搭載し音声発話中でもユーザの声を認識可能。
・適当型ビームフォーミングを利用可能。4マイクで任意の方向からの音声を高感度で収集。
・ノイズ抑圧処理、残響処理機能を搭載。高ノイズ環境下での音声認識が可能。
・オートゲインコントロール機能を搭載。マイクのゲインコントロールなしで、入力を安定的にコントロール。
・音源方向推定機能。音源の方向をAPI経由で取得することが可能。
・全二重音響エコーキャンセラ(AEC)を搭載。音声の回り込みを自動的にカット。

同キッドの、発売日は2018年12月21日、販売価格はオープン(予定価格 15,000円)。また、今回発表した内容の詳細が、「DOCOMO open House 2018」にて紹介される。同イベントは、2018年12月6日(木)~7日まで開催。

ABOUT THE AUTHOR / 

山田 航也

横浜出身の1998年生まれ。現在はロボットスタートでアルバイトをしながらプログラムを学んでいる。好きなロボットは、AnkiやCOZMO、Sotaなどのコミュニケーションロボット。

PR

連載・コラム