6社の音声認識APIの精度を比較する「もじひかクン」、開発元は東大発のAIベンチャー

東大発のAIベンチャー・ストックマーク株式会社は、株式会社TBSテレビの音声認識API比較システム「もじひかクン」を開発したことを発表した。

テレビ番組の制作現場では、あらゆる番組の音声データをスタッフが文字起こをしているため、現場の大きな負担となっている。そこで、TBSでは、働き方改革の一環として、音声認識技術を用いて、文字起こし作業を効率化する専用エディタ「もじこ」を開発。「もじこ」は動画素材のキャプション作成や、記者会見などのリアルタイム音声のテキスト化、録音データからの議事録作成など、現場スタッフの労働時間を削減してくれるシステムだ。

今回ストックマークが開発した「もじひかクン」は、「もじこ」で利用する国内・海外主要6社の音声認識APIの精度を比較するシステム。


GCP、IBM Watson、Microsoft Azure、AWS、NTT、Amivoiceの6社の音声認識APIの精度を比較できる

各社の音声認識技術の精度、得意分野を比較し、現場、内容ごとに最適な音声認識APIを採用する判断材料とすることで、文字起こし作業の軽減を目指していく。

今後はストックマークが有するテキストマイニング及び機械学習・ディープラーニング技術を用いて、文字起こし精度の定量的な分析、自動文章校正、自動ニュース原稿作成等、現場スタッフがよりテレビ番組制作の企画・編集等コア業務に集中できる環境構築をサポートし、働き方改革の実現に向けて貢献を行う。

TBSは11月14日(水)より幕張メッセで開催される「Inter BEE 2018」の出展ブースにて「もじこ」の出展及び講演を行う予定だ。

ABOUT THE AUTHOR / 

山田 航也

横浜出身の1998年生まれ。現在はロボットスタートでアルバイトをしながらプログラムを学んでいる。好きなロボットは、AnkiやCOZMO、Sotaなどのコミュニケーションロボット。

PR

連載・コラム