大規模言語モデル連携で人間らしい電話応対をするチャットボット 飲食店の予約受付の事例動画を公開 サイバーエージェント/AI Shift

株式会社サイバーエージェントの連結子会社である株式会社AI Shiftは、電話応対を自動化する「AI Messenger Voicebot」に大規模言語モデル(LLM)を連携し、人間らしい電話応対を実現することで、ユーザーの話し方に合わせた柔軟な自動応対を実現したと発表した。


同社は、電話での飲食店の予約受付を例にした対話の動画を公開した。同社の技術とLLMの特徴が活かされている、LLM連携をしたボイスボットとユーザーの飲食店予約を想定したデモ動画はこちら。

■【AI Messenger Voicebot × 大規模言語モデル】人間らしい電話応対を実現


200社以上の導入実績、知見を活かす

2022年11月に「ChatGPT」が登場し、LLMが注目を浴びたことで、様々な業界で活用方法が模索され、各企業で実施している顧客応対でもその活用が進んでいる。特に、WEB上での問い合わせ応対を自動化するチャットボットでは、回答範囲の拡大による大幅な正答率向上などが見込まれ、LLMの活用が加速している。
その一方で、電話応対を自動化するボイスボットでは、応答速度や回答制御などの課題から、LLMの活用が難しいとされてきた。しかし、LLMの進化や、ボイスボットに必要な音声認識・音声合成技術のアップデートにより、ボイスボットへLLMを適用することの実現性が高まっているね。
さらに、同社では2020年から200社以上にボイスボットを提供してきた。それらの音声対話に対する知見を持っていることから、知見を活かして、より利便性が高いボイスボットの実現を目指し、従来のボイスボットへのLLM連携を実施した。


LLM連携を行ったボイスボットの特徴

当社におけるボイスボットへのLLM連携は、意図理解、対話管理、言語生成の3つの領域に分けて実施している。

LLM連携を行ったボイスボットの特徴と構成図


1.【意図理解×LLM】ユーザーにより異なる発話を柔軟に理解

ユーザーの発話に含まれる複数の情報をボイスボットが整理し、理解することが可能になった。例えば、「明日の19時に4人で予約したい」という発話から、「日付:明日、時間:19時、人数:4人」という情報を抽出する。さらに、ユーザーが様々な言い回しを用いても理解ができるようにしている。
例えば、「大人2人と子供1人で。」のような発話から、「人数は合計で3人である」ということが認識できる。従来のボイスボットでは、精度を担保するため、限定的な質問をすることで対話内容を制御していたが、これからはユーザーの自由な発話内容に応じて柔軟に理解することが可能となる、としている。


2.【対話管理×LLM】ユーザーに合わせた電話応対の実現・ボイスボット構築時間の大幅削減

ユーザーの発話内容から必要な情報が欠けている場合、ボイスボットは次の発話内容を柔軟に選択することで、足りていない情報を考慮してヒアリングできるようになった。例えば、「明日の19時に予約したい」という発話に対し、「何人での予約ですか?」と人数をヒアリングすることができる。これまではユーザーのあらゆる発話内容を想定し、認識失敗時の応対なども含めた膨大な対話シナリオを構築する必要があった。しかし、今回のLLM連携により、必要なヒアリング項目を設定するだけで対話シナリオを構築できるようになり、ボイスボットの構築時間が大幅に削減された。


3.【言語生成×LLM】誤った案内をしない安全なLLM連携ボイスボット

LLM連携により、各項目のヒアリングに必要な発話内容を事前に準備するだけで、ボイスボットの構築が可能になった。これらの項目は予め決まっているため、LLMの言語生成を利用してボイスボットの発話内容を事前に作成できる。そのため、必要な作業はLLMが作成した発話内容の確認・修正作業のみとなり、ボイスボットの構築が大幅に簡易化される。
また、ユーザーへの案内文言を事前に設定ができるため、LLM連携後も、ユーザーへの案内時にLLMが自動生成した不適切な文言が直接ユーザーに発話されることを防ぎ、安心して利用できるとしている。


今後の展望

同社では、生成AIを活用したプロダクトにより、これからも問い合わせ応対の自動化を加速させていく。さらに、多くの企業が生成AIを活用し、「人が人にしかできない仕事に集中できる世の中」を目指し、企業の生産性に貢献する考えだ。

ABOUT THE AUTHOR / 

ロボスタ編集部

ロボスタ編集部では、ロボット業界の最新ニュースや最新レポートなどをお届けします。是非ご注目ください。

PR

連載・コラム