ビッグデータ、人工知能、機械学習に関する研修・コンサルティング事業を運営する株式会社データミックスと、株式会社ドコモgacco(大学講座「gacco(ガッコ)」を運営)、デジタルデータの産業活用を進めている株式会社データグリッドの3社は、2022年6月27日、無料オンライン講座プラットフォーム「gacco」で提供するAIを活用した学習向け動画コンテンツを活用し、AIで生成した講師動画の視聴者への影響の調査結果を発表した。
これによると、AIで生成した講師動画と人間による講師動画の受講状況や、動画視聴後テストの正答率に大きな差はなく、AIで生成された音声・動画について、受講者の約6割が自然だと感じたということがわかった。
AIによる人物動画生成と音声合成の技術を活用したMOOC講座
AIで生成した講師動画(AI動画)によるMOOC(Massive Open Online Courses/大規模公開オンライン)講座は、NTTテクノクロスの音声合成サービス「FutureVoice Crayon(フューチャーボイス クレヨン)」を活用して、テキストデータから講座内の音声データを生成する。テキストデータを「FutureVoice Crayon」にインプットすることで、人間の声と遜色ない自然な音声データの生成が可能となる。次に、データグリッドのAIによる人物動画生成技術により、音声データと数分程度の講師動画をもとに、音声に口の動きを合わせ、講師本人が話しているような長尺の講義動画を自動的に生成。この技術は、2つのネットワークが競い合うように学習することで、最終的に精度が高いデータ生成が可能なGAN(Generative Adversarial Network / 敵対的生成ネットワーク)により実現している。
同調査内容について
年齢の平均と標準偏差が近しい値になるようランダムに(i)AIで生成した講師動画(AI動画)を視聴するグループ、(ii)人間による講師動画(リアル動画)を視聴するグループの2つのグループに分け、それぞれにドコモgaccoが提供するコース「ビジネスマナー」と「異文化コミュニケーション」の動画を視聴してもらい、受講結果を比較・分析した。
AIで生成した講師動画と人間による講師動画の受講状況に大きな差はなかった
AI動画、リアル動画の両方において、動画が進むにつれて視聴完了ユーザーの割合が低下する傾向にあるが、AI動画、リアル動画を比較すると、AI動画の方が視聴完了ユーザーの割合が高い場合もあることがわかった。
また、動画をスキップ(seek)した回数をヒストグラムにし、割合を確認したところ、「ビジネスマナー」「異文化コミュニケーション」どちらの動画でも、AI動画とリアル動画を比較すると、AI動画の方がスキップ(seek)した回数が0回の割合が高く、スキップ(seek)せずに視聴していることがわかる。
視聴後のテストの正答率はAI動画、リアル動画で大きな差がない
各動画の課題提出者を対象に、平均値と標準偏差を計算したところ、「ビジネスマナー」においてわずかにリアル動画を視聴したグループの方が高かったものの、大きな差はないことがわかった。
AIで生成された動画は6割の方が自然だと感じた
学習後に行ったアンケートは、AI動画を視聴したグループのうち6割が「とても自然」「まあ自然」と回答。
今後の展望
「ドコモgacco」では、2020年度よりAIを活用した学習動画の作成サービスを提供してきたが、一部のユーザーからその学習効果や視聴、習得への影響に不安を感じるという声がでていた。今回の調査ではAI動画とリアル動画を実際に視聴してもらい、比較することで、AI動画の方が視聴完了率が高く、習得度への影響もほとんどないことがわかった。また、学習後のアンケートでは映像や音声の機械的な印象や違和感など、改良の余地も発見された一方で、AIによる動画の作成は講師による説明のわかりやすさのバラつきを抑えることが期待できると同時に、講師の稼働を軽減しながら動画制作を効率的に行える。今後も引き続きAI動画についての調査分析を行い、ユーザーが各講座をより安心して効果的に受講できるためのサービス向上に取り組んで行くと述べている。
▼調査概要
調査方法 | 動画視聴状況のモニタリングおよびアンケート |
---|---|
調査対象 | 20代から50代の男女73名 ※調査の計画段階では、下記の想定で進め調査対象者を集めた。 ・今回の分析では、同一コースにおいてAI動画とリアル動画を比較するためにスチューデントのt検定を実施。 ・同一コースで同じテストを行うため等分散を仮定。 ・その際に、以下の条件下で必要なサンプル数を算出し、調査対象人数を決定。 有意水準:5%、検出力:80%、効果量:0.77(2群の差:0.1/標準偏差:0.13)取得後、テストの受講者の人数と実際の標準偏差を考慮し以下の条件で検定を行なった。 ・有意水準:5%、検出力:80%、効果量:0.72(2群の差:0.16/標準偏差:0.22) |
調査期間 | 2022年2月28日(月)10時~2022年3月6日(日) |
調査機関 | データミックス |