ヘッドウォータースが「Agentic Voice RAG」サービスを開始 「GPT-4o Realtime API」を活用したAIエージェント

ヘッドウォータースは、音声対話ソリューションのサービスラインナップに、「GPT-4o Realtime API」を活用したAgentic Voice RAGを追加したことを明らかにした。

これにより、生成AIとリアルタイムに音声対話するソリューションに企業独自のナレッジを追加するAgentic RAGシステムの構築サービスと、AIエージェントが自律的にタスクを実行するAgentic Workflowを強化するとしている。

「Agentic Voice RAG」サービスについて

ヘッドウォータースでは、以前よりMicrosoft Azureを活用した音声認識や自然言語認識、クラウドコンピューティングとヘッドウォータースの技術力を活かしたAIシステムを企業向けに提供している。

また2015年よりコミュニケーションロボットを活用した「音声対話機能」、2018年からはスマートスピーカーによる「音声UI」に取り組み、「音声によるQ&A」、「音声認識×IoT」、「音声UI×システム開発」に関する多くのナレッジとコンポーネントを蓄積しており、加えてヘッドウォータースが提供するRAGは90%を超える精度を実現しており、各企業の生成AIを活用したサービスに複数導入されている。

今回、「GPT-4o Realtime API」を活用し、生成AIとの音声対話を日常の対話と同じスピードで回答する「リアルタイムスピーチ」にAgentic RAGを統合することで、「生成AIリアルタイム音声対話×企業独自ナレッジを付与した根拠のある応答」のAIエージェントを提供することが可能となった。

これによりヘッドウォータースが提供する音声対話コンタクトセンターソリューション、デジタルヒューマンソリューション、対話型ロボティクスソリューション、車載エッジAIソリューションを進化させ、人との対話のような自然な生成AI体験だけでなく、AIエージェントにタスクを自動実行させるソリューションを実現していくとしいてる。

Agentic Voice RAGのユースケース

・金融向けAIコンタクトセンターのAIエージェントにて、音声対話型で口座開設手続きを行う
・駅に設置したデジタルヒューマン型の案内係に、対話内容に応じた運行案内を行い特急券の購入まで行う
・自律移動型の対話型ロボティクスが、音声対話から要望に応じて自律移動してフロア案内を行う
・店舗に設置したデジタルヒューマン型の店員係が、接客とレコメンド、オーダーにレジ決済までを行う
・車載AIエージェントへドライバーが音声で目的地を指定すると、経路案内を行い、利用する度にパーソナライズを行う
・証券業界にてAIアバター型投資アドバイザーが音声対話型で投資アドバイスやNISA口座開設申込を行う
・保険窓口業務でAIエージェントがCRMと連携して対話型でパーソナライズ提案や見積/契約処理を行う

今後について

ヘッドウォータースは、リアルタイム音声対話AIをあらゆるプラットフォームに適用可能であると考えており、今後は、人と同じ自然な会話速度の利便性とUXを追求し、合わせてXRスマートグラスや未来型UXアプリ、エッジ端末やモバイルデバイス、Microsoft Teams上で稼働するソリューションの展開を行い、一般消費者が当たり前のように生成AIを使うことができる社会の実現に貢献するとしている。

また、ヘッドウォータースはアライアンス戦略によって顧客企業ともビジネスパートナーとなり、共に生成AI経済圏を拡大するための取り組みを行っていくとしている。

ABOUT THE AUTHOR / 

ロボスタ編集部

ロボスタ編集部では、ロボット業界の最新ニュースや最新レポートなどをお届けします。是非ご注目ください。

PR

連載・コラム