【試用レビュー:動画】世界初をうたうウェアラブル音声翻訳デバイス「ili」(イリー)を体験してきた

世界初をうたうウェアラブル音声翻訳デバイス「ili」(イリー)」がついにベールを脱いだ。最速0.2秒でリアルタイム翻訳(通訳)することができる。昨年のCES 2016で株式会社ログバーが展示し、注目を浴びた製品だ。

イリーの概要は「速報」を読んで頂くとして、今回は製品の詳細や使用感をお伝えしたい。

ili-01


iliのハードウェア

イリーの最大の特徴は、ハードや機能がシンプルに絞り込まれた点にあるようだ。

まずはハード面を見てみよう。
外観は白い薄型のスティック型。本体の中央に大きな操作ボタンが配置されている。翻訳操作中は大きなボタンひとつで操作するだけのシンプルな設計だ。小さなボタンが側面にもあって、これはクイック起動するためのもの。イリーをサッと出して側面のボタンをピッと押して起動、大きなボタンを押して「トイレどこですか?」と言うとイリーが翻訳して発話してくれる(音声認識や翻訳は速報で伝えたとおり、フュートレック社が開発し、同社とログバーでチューニングしたもの)。

ili-02

イリーのオモテ面

ili-03

イリーの背面

マイクは端末の上端に2基内蔵されている。
1基は話者の音声を拾う指向性の高いもの、もう1基は広範囲を集音するノイズキャンセリング用で話者の音声からノイズを除去するために用いている。もちろん、ユーザーは意識することなく、本体トップのマイクに向かって話しかければいい。

CPUは汎用のものを採用しているがメーカーや型番は非公開、メモリやストレージ容量、収容されている語数など、詳細の仕様は現時点では公開していない。
今回、発表されたイリーはビジネス向けだ。一般市販用の製品の発売も予定されているものの、価格もまだ決まっていない。2017年中の発売を目標としている。


ボタンを押したままでしゃべり、ボタンをはなすと翻訳

使い方も実にシンプルだ。
大きなボタンを押したまま「こんにちわ」と言って相手にイリーをさしだし、ボタンをはなすとそのタイミングで「Hello」と翻訳された声が相手に聞こえる。
本体の上端にマイクとスピーカーがほぼ並列に配置されている。同社はこれを「ナチュラルボイスライン」と呼び、話した声と翻訳した声が一直線にイメージできることで、違和感を感じない設計を意識したという。
操作の流れはこんな感じ。私が考えた例題「シャワーの水がぬるいです」と言ってもらった。

当初はイリーを店舗に置いておき、外国人が来店した際にそれを渡して日本語に通訳して対応する用途が、使い方のひとつとして想定されている。上の動画のシチュエーションで言えば、アメリカのホテルが日本人観光客にイリーを渡すことで、英語を話さない日本人とコミュニケーションをとるカタチだ。


現時点では一方向の翻訳のみ

現在は日本語、英語、中国語に対応しているが、どの言語からどの言語に翻訳するかを、頻繁に切り換えて使うことは想定されていない(具体的には「日本語→英語」や「英語→日本語」はイリーをタブレットに接続してイリー内部の設定を変更して切り換える仕様だ)。

そのため「こちらからの質問は通訳してくれるが返ってくる返事は通訳してくれない」という点は承知しておかなければならない。
例えばアメリカを旅行しているとして、イリーを使って「ボートの乗り場はどこですか?」という質問をこちらからした場合、それは英語に通訳してくれるので相手に通じるが、相手が「The other side of that yellow factory」と返答してくれたとしても、英語は日本語に変換してはくれないのでボート乗り場がどこかはわからないだろう。
ただし、「日本語→英語」設定と「英語→日本語」設定の2台のイリーがあれば次の動画のようにコミュニケーションをとることができる。

ちなみにログバーのCEO吉田氏によれば、両方向翻訳が可能なイリーもプロトタイプは開発していると言う。実証実験でそれを旅行者に使ってもらったところ、実際に使ったのはほぼ一方向だけだったこと(相手がイリーのことを知らないと聞かれた方は自然に母国語で返しにくい)から、想定していたほど満足度が上がらなかった。一方向に限定することで、イリーのメモリーやCPUの能力を一方向だけに集中でき、結果的に翻訳の精度や語彙数など性能面での向上が大きいと言う。まずは一方向で製品化し、今後の要望によって両方向を開発していきたいとした。

また、一方向の場合、質問する側が相手の回答がシンプルになるようにきき方を工夫するようになると言う。「Yes」「No」、数字など、シンプルな回答を期待した質問をすることで、結果的に会話全体がシンプルになり、イリーの変換精度を上げることに繋がる。例えば「ボートの乗り場はあっちですか?」と手真似を含めて聞けば、YesかNoでまず答えてくれることが期待できるし、レストランで「この料理には何が使われていますか?」と聞くより、「この料理にはタマネギが入っていますか?」と聞けば「Yes」か「No」で回答され、その方がコミュニケーションがシンプルに進行できる。



機能を絞り、用途は「旅行」に絞った

イリーは小型のモバイル・デバイスであり、インターネット接続も不要のため、どこでも気軽に使える一方で、ストレージやメモリーの容量に制限が出てくる。快適に使うためにはハードウェアもソフトウェアもシンプルにして翻訳時間を短くする必要がある。その結果として、現時点では自由に言語が選択できる機能は切り捨てることになった。
ディープラーニングなどの機械学習も使っているが、それは翻訳アルゴリズムを作る段階に機械学習を使っていて、学習したアルゴリズムは小さく圧縮してイリーに内蔵している。イリーの内部で翻訳のログをとっていて、法人向けの「ili for Guest」ではログを導入企業に提供することで顧客の疑問点が把握でき、サービス向上に繋がるとしている。また、そのログは繰り返し機械学習に反映することで、翻訳精度の向上に活用もできる。

ili-11

「ili for Guest」(法人向けサービス)の採用を決めた法人パートナーと。左からイオンモールの趙明氏、ビジョンの佐野健一氏、ログバー代表取締役CEOの吉田卓郎氏、東京地下鉄の小泉博氏

今回発表のあった「ili for Guest」は法人向けのため個人が旅行に持っていくための販売を想定しているのではなく、東京メトロの改札に置いたり、イオンモールの案内所や店舗におき、外国人観光客とコミュニケーションをとる想定で導入する。ただし、ビジョンは空港でモバイルWi-Fiのレンタルなどを手がけている会社なので、イリーを空港レンタルすることになれば個人向け用途で利用できるチャンスになる。

ちなみに日本語の場合、標準語に対応し、現時点では関西弁をはじめ方言には対応していない。

用途も絞り込んだ。イリーの用途を「旅行」に限定し、旅行者が旅行時によく利用する会話に限定することで、語彙や文章が限定できるので翻訳精度の向上に繋がっているという。
バッテリーの持ち時間の目安はスリープモードを使って約一日、ずっと翻訳させ続けた場合は2時間程度という。
法人向けに提供する場合は、製品名やサービス名、業界の専門用語などのカスタマイズを施した上で納品する準備はある。


iliを体験してみた

報道関係者向けの体験会は3分間が与えられた。先ほどの動画、女性2名がイリーでやりとりする場所とは別のところで体験会が行われたが、照明が暗くて静かな場所だったので、残念ながらその様子の写真は撮っていない(一眼レフカメラのシャッター音が他のメディアのノイズになると迷惑になるため)。

私が体験したシチュエーションは「ホテル」。ホテルや旅先でよく使われる文章トップ3とホテルでのトラブル時に使われる会話の例題がいくつか日本語で書かれたカードが机に置かれていた。ホテルのスタッフ役の外国人がそこにはいて、イリーを使って質問や意思を伝えるという形式だった。イリーでの会話はその例題を使ってもいいし、自分自身でホテルを想定して考えた内容でも良いとのことだった。

私は最初、その例題の中から選んでしゃべり、イリーに翻訳させたが、それでは一般のシナリオベースの会話認識技術でもスムーズに変換が行われると予想できるので、私が考えた文章も混ぜて私が発話したものをイリーに翻訳させてみた。

【私自身が実際にイリーに話しかけて翻訳させた文章】

  • いま、チェックインできますか?
  • タクシーを呼んでもらえますか?
  • 荷物を預かってもらえますか?
  • 部屋の鍵を部屋の中に忘れてきました
  • 景色の良い部屋は空いていますか?
  • 8人で止まれる部屋は空いていますか?
  • Wi-Fiが遅いです
  • インターネットに接続できません
  • お湯がぬるいです

これら全ての日本語は待ち時間なく、すぐに翻訳できて外国人とコミュニケーションがとれた(ほぼ100%)。
なお、実際の旅行先では雑音があり、発音の影響も音声認識は大きく受けることになる。
次の動画のように「パクチー」のような単語を認識する一方で、「ピーマン」を「いま」に誤認識することがあった。

■ 動画 パクチー(Coriander)が嫌いです

■ 動画 「ピーマン」を「いま」に誤認識→イリーがどんな日本語だと認識したかを確認

認識は技術的にまだ限界があり、精度があがるのを期待するほかないが、イリーは自分が言った日本語をどう認識(誤認識)したかを確認することができる。これは便利な機能だ(上の動画参照)。
自分の発音をイリーが理解しやすいように修正するのに役立つかもしれない。
今回は時間が限られていたが、次回は長時間、思う存分「翻訳コンニャク」の世界を海外でも試してみたい。

ABOUT THE AUTHOR / 

神崎 洋治
神崎 洋治

神崎洋治(こうざきようじ) TRISEC International,Inc.代表 「Pepperの衝撃! パーソナルロボットが変える社会とビジネス」(日経BP社)や「人工知能がよ~くわかる本」(秀和システム)の著者。 デジタルカメラ、ロボット、AI、インターネット、セキュリティなどに詳しいテクニカルライター兼コンサルタント。教員免許所有。PC周辺機器メーカーで商品企画、広告、販促、イベント等の責任者を担当。インターネット黎明期に独立してシリコンバレーに渡米。アスキー特派員として海外のベンチャー企業や新製品、各種イベントを取材。日経パソコンや日経ベストPC、月刊アスキー等で連載を執筆したほか、新聞等にも数多く寄稿。IT関連の著書多数(アマゾンの著者ページ)。