議事録の作成はとても大変な作業だが、AIとスマートスピーカーを活用して自動化するシステムに注目が集まっている。東京ビッグサイト 青海展示棟で、4/3〜5まで開催中の「第3回 AI・人工知能EXPO」において、TISインテックグループは「COET Record Meeting」(コエット・レコード・ミーティング)を展示している。3月28日に発表されたばかりで、4月に提供が開始される予定のスマートスピーカーを使ったクラウドサービスだ。
声の方向から話者を特定
「COET Record Meeting」は会議全体を録音するとともに、発言ごとに誰のものかを認識しつつテキスト変換を行ってくれる。話者を識別するのは声のする方向検知を使う。使用するスマートスピーカーには16個ものマイクロフォン(マイクアレイ)を装備していて、声のする方向(発話方向)を1度単位で検知できると言う。この機能を活用して話者を特定する。
認識した音声はSNSのように発言単位でまとめてテキストに変換される。そのためピンポイントで発言内容を確認できるほか、テキスト変換の対象となった音声も対になって保存されているので、テキスト変換が正しくないなと感じたらすぐにその音声を再生して確認したり、変換した文字を修正することができる。
会議ごとにQRコードを発行(セキュアに共有)
「COET Record Meeting」の構成は、スマートスピーカー、小型のディスプレイ、スマートフォンのアプリ。小型のディスプレイには会議ごとに発行するQRコードが表示されるので、スマートフォン用のアプリでそのQRコードを読み込むと、音声がリアルタイムにテキスト変換される会議のスレッドに入ることができる。そのため、会議の内容は参加者のみセキュアな環境で閲覧できるしくみとなっている。
会議のリアルタイム翻訳も可能
リアルタイム翻訳機能も備えている。リアルタイムにテキスト変換されるアプリ画面を見ながら会議に参加できるので、外国語を話す発話者の会話が聞き取れなかったり、聞き逃した場合も、直前の発話をアプリでチェックすることができ、会議の流れに置いて行かれる、といった事態を防ぐこともできる。
「きのこvsたけのこ あなたはどっち派?」体験
会場ブースでは「きのこvsたけのこ あなたはどっち派?」という熱い議論を「COET Record Meeting」がリアルタイムで議事録をとる体験に参加できる。参加することで、「COET Record Meeting」による記事録の自動作成の作業手順や主な機能が体験できる。その様子を動画で撮影したので参考にして欲しい。
■「きのこvsたけのこ あなたはどっち派?」熱い議論の議事録を自動作成
インバウンドの観光受付などにも活用できる
なお、「COET」事態は、AI活用の潮流であるVUI(Voice User Interface)による新たなソリューションで、記事録の自動作成のような音声認識機能のほか、観光案内所などでは外国語を話す来所者との会話を自動翻訳、音声合成で読み上げる機能なども持っている。その意味では対話エンジンを組み合わせた音声・対話AIサービスとなっている。
今後は、FAQや翻訳機能を提供するインバウンド対応サービス、音声認識・音声合成などの技術とAIスピーカーなどのデバイスやロボットを組み合わせて自動対話を実現するクラウドサービスなどのメニューを提供していく予定だ。
ABOUT THE AUTHOR /
神崎 洋治神崎洋治(こうざきようじ) TRISEC International,Inc.代表 「Pepperの衝撃! パーソナルロボットが変える社会とビジネス」(日経BP社)や「人工知能がよ~くわかる本」(秀和システム)の著者。 デジタルカメラ、ロボット、AI、インターネット、セキュリティなどに詳しいテクニカルライター兼コンサルタント。教員免許所有。PC周辺機器メーカーで商品企画、広告、販促、イベント等の責任者を担当。インターネット黎明期に独立してシリコンバレーに渡米。アスキー特派員として海外のベンチャー企業や新製品、各種イベントを取材。日経パソコンや日経ベストPC、月刊アスキー等で連載を執筆したほか、新聞等にも数多く寄稿。IT関連の著書多数(アマゾンの著者ページ)。