回転寿司チェーン店最大手「スシロー」の自動受付・案内システムの舞台裏 音声合成技術にHOYA「ReadSpeaker」を採用

コロナ禍で外出などの自粛が要請されてから、大きな打撃を受けている外食業界。その逆風の中でも回転寿司チェーン『スシロー』は最高の業績を実現した。スシローを運営している株式会社FOOD & LIFE COMPANIESは、お客様満足度の向上のために、さまざまなアイディアを取り入れている。


スシローは非対面・非接触が求められるコロナ禍に、かねてから進めていた新店舗のオープンを加速、その一環として自動受付・案内システムを導入した。案内システムの音声には肉声感と明瞭感が特徴の TTS(音声合成)技術の「ReadSpeaker」を採用した。既に店舗で体験したことのある読者も多いことだろう、この(下)の動画のような案内システムだ(筆者もいつも利用しているスシロー店舗には、このシステムが稼働していて、完全に自動化されている)。

■動画 あきんどスシロー – 自動受付・案内


スシローの自動受付・案内システム

スシローの自動受付・案内システムは、来店客がタッチパネルでチェックインをすませると、自動受付・案内システムから音声が流れ、人手を介さずに来店客を席まで案内することができるように自動化設計がなされている。


また、待合スペースにも案内システムのスピーカーとモニターが設置され、チェックイン後、席が空くまで待機している来店客にも音声で順番が来たことを知らせ、席までスムーズに誘導することができる。

スマホアプリで順番待ちを指定すると、順番待ち番号(予約番号)が表示され、順番が近付くと通知がくる。来店してこの機械に番号を入力するとQRコードが印字されたプリントが発行されてチェックインとなる。スマホで予約していない来店客も、この機械で順番待ち番号を発行して待合室で待つ

自分の順番になると番号が呼ばれるのでコードリーダーにQRコードをかざすと席番号が与えられ案内される。その一連の動作は音声合成によって店内に音声で案内されるので迷うことはない




「お客様が”自然”に聞き取れる音声が必要だった」スシロー

この一連の流れには、非対面・非接触を求める来店客のニーズと、店舗オペレーションの省力化の両面において、大きなメリットがある。
自動受付・案内システムへ「ReadSpeaker」のTTS(音声合成)を検討した理由を、ReadSpeakerのインタビューに対してスシローの担当者は次のように語っている。ちなみにReadSpeakerは、HOYA株式会社 MD部門 ReadSpeakerのこと。

– 今回スシローでReadSpeakerの音声合成(TTS)を検討された理由をお聞かせいただけますか?
店舗オペレーションの省力化が課題となっていた中、コロナ禍で非対面・非接触という接客業では難しい課題が求められるようになり、お客様対応の部分において、システムの導入や、自動化を進めていきたい場面が増えてきました。特に、ご来店いただいたお客様に最初にご利用いただく自動受付・案内システムにおいては、自動化を実現しつつ、お客様にはいかにストレスなくご使用いただくかが鍵になっていました。

そうした中、自動受付・案内システムとしては、人間の肉声に替わる案内ができ、店舗の出入り口に近い場所でも聞き取りやすい明瞭な声質で、お客様が自然に聞き取れる音声が必要でした。 音声合成の導入も視野には入れていましたが、今までの音声合成では、どうしても機械的な感じがしてしまい、スシローが考えるお客様満足度の向上には向かないと考えていました。 新たな自動受付・案内システムの導入を決定した際に、複数社のTTS(音声合成)を検討した結果、業界トップレベルの品質を実現しているReadSpeakerが候補にあがりました。

– 複数社の中からReadSpeakerを選ばれた、大きな理由はなんでしたか?
まずは、その品質です。人間の声にかなり近く、さらに明瞭度という部分においては、店内の環境でもはっきりと聞き取れる声質でした。さらに、日本国内の店舗だけではなく海外の店舗への導入も視野に入れますと、英語、中国語などに対応しているという点も大きな理由になりました。 通常、音声案内の場合には、スタジオでナレーターさん、声優さんなどにナレーション収録をしていただくことになるのですが、ReadSpeakerのTTS(音声合成)ならばそういった工数を必要とせずに、ガイダンス音声を柔軟に変更できるという点も、高い評価に繋がりました。

また、声の品質のみならず、SDK(ソフトウェア開発キット)を使うことにより音声合成機能が比較的簡単に実装できる点、外国語の音声を使う場合でも共通のインターフェイスで開発できる点もメリットでした。

– TTS(音声合成)を導入するにあたり、克服すべき障害などはありましたか?
大型店では受付端末を複数台用意する必要があります。そのような場合は、声色を分けなければ、どの端末からの案内なのかをご来店いただいたお客様が直感的に判断することができせん。ReadSpeakerは、複数の声色に対応しているので、端末ごとに声色を分け、お客様をスムーズにお席まで誘導することができました。

– 将来の拡張性を見越した導入となりましたが、これからの展開を教えていただけますか?
スシローは、韓国・台湾・香港・シンガポール・タイ・中国大陸にも展開しています。ReadSpeakerは37ヶ国語以上に対応しているので、それぞれに立地に合わせて使用する言語を変えることができます。

日本においては、少子高齢化による労働人口の減少など、さまざまな課題がありますが、ReadSpeakerのTTS(音声合成)を使う自動受付・案内システムはお客様満足度の向上とオペレーションの省力化を同時に実現できると考えています。


ReadSpeakerのspeechEngine SDKは、Windows、Linuxをはじめとする、様々なプラットフォームで稼働する。アプリケーションなどへも容易に実装することが可能で、トップクラスの品質の音声合成を、自社開発のシステムに容易に連携させることができる。
ニューノーマルと呼ばれる時代の、新しい顧客体験の創出にも、ReadSpeakerのような音声合成技術が大きく寄与している。

ABOUT THE AUTHOR / 

ロボスタ編集部

ロボスタ編集部では、ロボット業界の最新ニュースや最新レポートなどをお届けします。是非ご注目ください。

PR

連載・コラム