IBM Watson日本語版が会話を理解して最適な答えを助言する日〜「ロボット」と「人工知能」(AI)の最前線

IT業界のみならず経済界においても最も注目されているキーワードが「ロボット」と「人工知能」(AI)です。「どれだけ役に立つものなの?」と懐疑的な人も多いですが、どちらも実用化に向けてたくさんの企業がしのぎを削っており、この事実だけを見ても時代が動く予感を感じます。

ロボットと人工知能には大きな関わりがあります。ロボットがスムーズに会話し、必要な情報を提供し、最適なアドバイスを行うためには高度な自然会話エンジンや人工知能が不可欠です。そして、人工知能の活用にはパソコンやスマートフォンと並ぶ次世代のデバイスとしてロボットが有力視されています。

2016年2月18日、日本アイ・ビー・エム(以下、日本IBMと表記)とソフトバンクはIBM Watson日本語版(以下、Watson)として6種類のサービスの提供開始を発表しました。Watsonの特長をひとことで言うと、コンピュータでありながら人間と自然な会話ができ、質問を理解して最適な回答をみつけて返すことです。一部の機能では人工知能技術として注目されているディープラーニングも使われています。

このWatsonが日本市場に向けて船出しました。これはいったい何を意味するのでしょうか。Pepperをはじめとしてロボットとはどのように関わっていくのでしょうか。そしてWatsonはこの分野で覇権をとることができるのでしょうか?


Watson-0218-01



Watsonは実際にどこまでできるのか? この目で見てみたい

箱崎にある日本IBM本社の記者発表会会場は、多くの報道陣とテレビカメラが詰めかけ、緊張感のある独特の雰囲気に包まれていました。「Watson日本語版は実際にどこまでできるのか? この目で見てみたい」最新のITテクノロジーを追うジャーナリストたちのそんな声が聞こえてくるようでした。私もこの2年間、Watsonの動向を追いかけ、取材をしてきましたが全く同じ気持ちでした。

しかし、残念ながら会場ではその実力をじっくり見る機会はありませんでした(その理由の一端は後述します)。Watson日本語版の実力が見られるのはもう少し先のこと、導入した企業が実際に稼働させはじめてから改めて取材する必要がありそうです。

さて、Watsonはいったいどんなことができるのでしょうか。

Watsonは、コールセンターにかかってきた電話の内容を横で聞いていて、顧客からの質問に最適な回答をオペレータに耳打ちすることができます(Watsonコラム第1回参照)。オンラインショッピングサイトでは顧客個人の趣味趣向を理解し、相談に応じて最適な商品を紹介することができます。これがWatsonの会話を理解し、会話ができる部分です。

更にWatsonは1秒間に8億ページもの人間用に書かれた文章を読む能力を持ち、自らディープラーニングを使って自律学習していきます。こうして構築されたデータベース(コーパス)から質問に対して瞬時に複数の回答をランク付けして回答することができます(Watsonコラム第3回参照)。


Watson-0218-02

Watsonは「コグニティブ・システム」と呼ばれる。人間の会話、すなわち自然言語を理解し、文脈から推察し、経験等から学ぶ。ディープラーニングで自律学習する技術も使われている



三菱東京UFJ銀行が描く「Watsonとロボットによる未来の接客」

この記者発表会の会場にはPepperの姿はありませんでしたが、三菱東京UFJ銀行のデモンストレーション・ムービーの中でNAO(ナオ)とPepperが登場しました。ムービーのタイトルは「IBM Watson+ロボットによる未来の接客」。そのストーリーはこのようなものでした。


Watson-0218-03
受付に待機している小型のロボットNAOが来店した顧客をいち早く認識して個人認証を行います。


Watson-0218-04
顧客の使う言語にあわせて英語で「ナーム様、いらっしゃいませ」と挨拶します。


Watson-0218-05
顧客は「税金がかからない投資が流行っていると聞いたんだけど?」と英語で質問すると・・


Watson-0218-06
NAOはWatsonにアクセスして回答が「NISA」であると判断して・・


Watson-0218-07
説明窓口の方向を案内します。


Watson-0218-08
顧客がNAOにお礼を言って移動するとそこには接客担当のPepperが。顧客は「NISAってタイでの投資信託とどう違うのかな?」と質問します。


Watson-0218-09
PepperはWatsonに打診して「タイの投資信託は、値上がり益は非課税ですが、普通分配金は金額に応じて課税されます」と答えます。


Watson-0218-10
更に、時間の無い顧客に対しては個別に作ったシミュレーションを顧客のスマートフォンに送信します。

ちなみに三菱東京UFJ銀行では既に多言語に対応したNAOを導入した実績があり、一部店舗の受付で活躍しています。ちなみに大阪弁にも対応しています。

Watsonについてソフトバンクに取材したとき、WatsonとPepperの連携について聞きました。Pepperとの連携では、Pepperと人との会話に常時Watsonを使用して知識の検索や照合を行うのではなく、会話は原則としてPepper単体(Pepperの人工知能)で行い、質問に対してロボットが回答に窮したときにWatsonプラットフォームに対して回答を打診する方法がとられる予定です(詳細はWatsonコラム第2回参照)。



海外で着実に実績を上げるWatsonテクノロジー

どのような内容で記者発表会が行われたのかを解説しましょう。

冒頭のスピーチでは日本IBM 代表取締役社長 ポール与那嶺氏、ソフトバンク 代表取締役社長 兼 CEO 宮内謙氏、米IBM Watson ビジネス開発担当 シニア・バイスプレジデント マイク・ローディン氏が登壇しました。与那嶺氏はWatsonの原点は日本の大和研究所で開発していたテキストマイニングにあると説明、宮内謙氏は発売前に既に150社以上から問い合わせがあり、これほどの引き合いがあったサービスは前例がないとそれぞれ笑顔で話しました。


Watson-0218-11

左上:日本IBM 代表取締役社長 ポール与那嶺氏、右上:ソフトバンク 代表取締役社長 兼 CEO 宮内謙氏、左下:米IBM Watson ビジネス開発担当 シニア・バイスプレジデント マイク・ローディン氏、右下:日本IBM 執行役員 ワトソン事業部長 吉崎敏文氏

また、米IBM Watson ビジネス開発担当 シニア・バイスプレジデントのマイク・ローディン氏によれば、海外では36ヶ国で29の産業、8万人の開発者がWatsonに関わっていて、世界的にも有名な東南アジア最大の私立病院であるタイ・バンコクのバムルンラート病院では年間110万人のがん患者の情報解析を支援するなど、世界規模で活用の拡がりが既に始まっていることを紹介しました。


Watson-0218-12

36ヶ国、29の産業、8万人の開発者、世界中で利用が始まっているWatsonテクノロジー。パートナーは400社を超えている



Watsonの導入事例「かんぽ生命は保険の支払い請求業務をWatsonが支援」

既に導入されている実績を踏まえ、Watson導入を想定している業界が紹介されました。金融、医療、メディア、製造、営業支援などがあげられ、海外の事例として金融ではシンガポールのDBS銀行(資産運用)、医療ではMDアンダーソン(先進医療:がん研究)、メディアではロイター(新サービスの運用)など、新しいビジネスの創造や活用にWatsonが利用されていることを紹介しました。

国内の事例では、かんぽ生命が保険の支払い請求をWatsonで支援するためのコーパスの構築を始めているということです。また、東京大学の医科学研究所では、がん治療で将来の診断のためにWatson英語版での利用に着手していて、人間では調べるのに1ヶ月半かかる大量の関連文献データをWatsonでは約20分で関連する情報を検知したり、約2400万件のデータベースや20万件のがん細胞に関する情報のデータベースにアクセスできるようになっていると言います。

また記者発表会の後半は導入予定企業が5社紹介され、それぞれプレゼンテーションが行われました。

例えば、第一三共は、大量の化合物のスクリーニングや組み合わせ、2,000個の誘導体合成、臨床試験などを経て、創薬発売までには約10年、1,000億円がかかっていて、その膨大な量のデータをWatsonが収集・解析し、更に組み合わせのシミュレーションを行い、多くの研究者の英知、文献データなどの分析を行った上での最適解を発見して提示してくれることによって、創薬のプロセスが劇的に短縮化、効率化するのではないか、と期待を寄せています。

・カラフル・ボード (http://www.colorful-board.com/
ユーザーの好みを理解するアプリSENSYで個々人の感性を学習して人工知能がファッションコーディネート&相談に対応/アドバイス。

・FiNC (https://finc.com/
ヘルスケア・パーソナライズ、ダイエット関連。ユーザ向けに人工知能が適切な食事指導。専門家向けのコールセンターでアドバイス支援。

・第一三共 (http://www.daiichisankyo.co.jp/
製薬会社。新薬開発、医薬品の研究開発プロセスの効率化。

・フォーラムエンジニアリング (http://www.forumeng.co.jp/
エンジニア、学生の求人情報、最適な人材マッチングに活用。

・三菱東京UFJ銀行(MUFG) (http://www.bk.mufg.jp/
記者発表会当日より、LINEによるWatsonを使った顧客からの応答サービスを提供。Watsonを使ったeフィナンシャルプランナー(資産管理/資産活用)。ロボットとWatsonの組み合わせによる受付管理(多言語対応)。



Watson-0218-13

第一三共のプレゼン画面「医薬品研究開発のプロセスとWatsonの適用」より。Watson導入によって、研究開発管理プロセス、創薬・R&Dサイクル等の短縮化がはかれるのではないかと期待を寄せる



ついに日本語を学習したWatson、6つのサービスとしくみ

ここからは少し技術的な話も入ってきます。

Watsonの最大の特長は前述の通り、人間と自然な会話ができ、人間の問いかけに対して、人間が気付かなかった発見を含めて最適な回答を返すこと・・

日本語でそれを実現するために、今回は6種類のサービス(API)が日本語化されました。人間と自然な会話ができる「会話(音声)」(2種類)と、質問を理解して最適な回答をみつける「自然言語処理」(4種類)です。実際にはWatsonは30以上のサービス(API)が英語版でリリースされているので、今回はその第一弾として、まずはこの6種類が日本語化されたことになります。それぞれの機能は次の通りです。

【IBM Watson日本語版の6つの機能と技術】

[自然言語処理 : 日本語を理解して最適解をみつける技術]

1.自然言語分類(Natural Language Classifier)
 人間の会話(自然言語)から意図や意味を理解するための技術

2.対話(Dialog)
 個人的なスタイルに合わせた会話を行う技術

3.文書変換(Document Conversion)
 PDFやWord、HTML等の人間が読める形式のファイルをWatsonが理解可能な形式に変換する技術

4.検索およびランク付け(Retrieve and Rank)
 膨大なデータの中から最適解を導き出すための、機械学習を利用した検索技術と複数回答のランク付け

[会話(音声) : 日本語で会話するための聞く/話す技術]
5.音声認識(Speech to Text)
 人間の話した声を文字に変換する技術

6.音声合成(Text to Speech)
 人間の声を人工的に作りだし、発話する技術




膨大なビッグデータを活かせるのは誰だ?

「自然言語処理」と「会話(音声)」であげた技術の、ひとつひとつをとってみると「以前から実用化されているんじゃないか」と感じる読者の方も多いことでしょう。Watsonが特に注目されている理由は、米国のクイズ番組で人間と対戦して勝利したという輝かしい実績と、人間用に作られた文書ファイルや画像等を自律的に学習して賢くなり、自然な会話によって最適な解を含めて複数の回答を出してくれること。実はこれ、ビッグデータを活かすことができるかに関わってきます。

現在、凄まじい勢いでデータが日々蓄積され続けています。例えばインターネットでは、Facebook、Twitter、ブログ、インスタグラム、YouTubeなどを中心に、膨大な量のメッセージや画像が刻一刻と投稿されています。これらを非構造化データと呼びます(人間は理解できるけれど、コンピュータ用には構造化されてないデータ)。更に、天気、株価等のマーケット情報、ニュース記事など、ひっきりなしに情報が更新され、新しい研究論文はネット上にあふれかえっています。また、いたるところに搭載されたセンサー類からも逐次膨大なデータが集まります。

この膨大なビッグデータを活用しようとしたとき処理できるのは人間でしょうか、それともコンピュータでしょうか?

答えはどちらも「NO」。人間ではとても処理しきれない量ですし、コンピュータに人間の文字、文章、その中に書かれている意味や意図が理解できません。ビッグテータの実に80%以上が非構造化データなのです。人間にも従来のコンピュータにもできないことを可能にする手段のひとつとして、人間用に作られたデータが理解できるシステムが求められています。そしてその技術で先行しているのが「IBM Watson」であり、いま注目の的となっているのです(詳細はWatsonコラム第3回参照)。


Watson-0218-14

ビッグデータは毎年約2倍のペースで増加していく一方、その80%以上がコンピュータが理解できない非構造化データであり、従来のコンピュータでは活用ができなかった



日本語版のパートナーがソフトバンクである理由

記者発表会で日本IBMは、短期間で日本語版を提供することができたのはソフトバンクのおかげだと言っていました。また、ソフトバンクのセールス・ネットワークにも期待しているようです。

日本IBMとソフトバンクが提携し、Watson日本語版を開発する計画を発表したのは2015年2月。約1年かけて日本語版提供の土台を作りました。Watsonの開発は日本IBMが行っていますが、ソフトバンクはネットワークやサーバ機器といったWatsonプラットフォーム施設の物理的な運用を行っています。また、Watsonの日本語化開発の支援を行っているだけでなく、販売面ではマスターディストリビューターと位置付けられています。日本IBMもソフトバンクと同様に販売を行い、その他のSIer、エコシステムパートナーと連携して開発や販売が行われる予定です。ソフトバンクは開発パートナー(エコシステムパートナー)制度の構築を行い(認定審査あり/年間180万円(税抜))、開発者の育成の一端を担っています。

IBMが日本語版でソフトバンクと提携した理由として、同社が通信キャリア等として持つ、全国2,000店舗に及ぶソフトバンクショップや多くの企業ネットワークに期待しているとともに、日本語版開発に有力な情報源となる大規模なコールセンターを運用している点だと見られています。そしてなにより「Pepper」の存在も大きく影響しているでしょう。自然言語での会話や回答提供のデバイスとしてコミュニケーション・ロボットは、今後の展開が最も期待されている分野です。実際に2014年の9月の時点ですでに、Pepperの技術者イベントで米国に設置されている英語版Watsonとの連携が公開され、デモンストレーションされています。その後に共同開発のニュースを経て、2015年2月に正式に提携が発表されました。また、今年の1月のラスベガスの大型イベントでは米IBMのプレゼンテーションのステージにPepperが登壇し、Pepper向けのWatsonを開発することも示唆しています。


Watson-0218-15

ソフトバンクはIBM Watsonエコシステムパートナー制度を通じて、開発環境やノウハウ、データ等を提供



Watsonの実態は? ビジネスモデルと利用方法

技術的な解説は日本IBM 執行役員 ワトソン事業部長 吉崎敏文氏が行いました。日本市場のニーズに合わせて最も顧客が必要としている、日本語依存が高い6種類のAPIを選んでまずは今回の日本語対応しました。WatsonはSaaS(Software as a Service)で、実態はネット上に構築されたクラウドシステムとそれを制御するためのAPI群です。APIはIBMが提供している開発者向けのクラウドサービス「IBM Bluemix」から入手して利用することができます(下記の図表では青い部分(赤枠A:編集部で追加))。IBM Bluemixには、この日から日本語版の提供を開始した6種類を含む、30以上のAPIが既に公開されていて、開発者は自分が開発したいシステムに必要なAPIを選んで使用することができます。

利用するための金額としては、Watsonの開発予算として個別のシステム開発と利用契約による方法と、Watson利用に対する従量課金制が用意されています。


Watson-0218-23

自然言語処理は4種類(自然言語分類、検索およびランク付け、文書変換、対話)、音声は2種類(音声認識、音声合成)の日本語版をこの日よりリリース開始。各APIはIBM Bluemixで利用できる

大手企業は日本IBMやソフトバンクと個別の開発契約を締結し、Watsonを利用したシステム開発を行っていくと思われます。また、ほかにWatsonのビジネスモデルとして、Watsonを利用して構築したサービスの売上の一部を支払う「レベニューシェア」、Watsonプラットフォームを実際に利用したデータ量や時間によって料金が発生する「従量課金」のビジネスモデルも用意されています。開発者が自由に選択して自社のソフトウェアに組み込んでWatsonプラットフォームを従量課金で利用できるAPIは、クラウド「IBM Bluemix」によって提供されています。(https://www.ibm.com/developerworks/jp/bluemix/

WatsonのAPIを使うとどのようなシステムが作れるのでしょうか。例えば、顧客からの問合わせに対して営業やオペレータがWatsonのアドバイスを受けながら即座に回答を返すことができます(スキルの向上/均一化/正確な応対)。Watsonには今話題の機械学習、ディープラーニングの技術が使われていて、過去の履歴ややりとりをベースに最適な回答をアドバイスします。あるいはオペレータがいなくてもWatsonが直接的なやりとりを行うことも可能です。顧客に対して提案をして、見積や契約書を出すことも視野に入り、時間と場所を選ばない自動応答システムによるビジネス展開の可能性を拡げるとしています。


Watson-0218-24

顧客からの問合わせに対して、ライブチャットでの応答やスタッフを解しての応対には4種類の「自然言語処理」技術でWatsonが回答したり支援を行い、音声での問合わせについては更に「音声」(音声認識、音声合成)対応技術でWatsonが直接応答することができる



Watson導入までの3つのステップ

Watsonでは導入企業ごとに専用のコーパスを作成します。コーパスには導入企業ごとの社内データ、スキルを含めた知識や概念、業界独特の言い回しや専門用語などの文脈情報が含まれ、これらを学習させることによってWatsonは賢く成長します。この作業がWatsonの実力に大きく関わってくると言われ、開発期間がかかる一因にもなっています(下図の赤枠A:編集部で追加)。業界や団体ごとに蓄積された知見を学習させることも重要で、導入企業にとってはコーパスの知見こそが他社との差別化要因のひとつになると考えられます。


Watson-0218-25

Watsonの精度に重要なのは、顧客ごとに作成する「コーパス」で、主に社内データ、知識・概念、文献情報から構成されたデータ(赤枠A:編集部で追加)

Watson導入までには3つのステップがあり、Watsonを学習させるための教育期間(コーバスの構築期間)を見込まなくてはなりません。導入までの期間もコストになります。いち早く導入したいと考える顧客(導入企業)は多いとは思いますが、ココを端折るとWatson自身がスキルの低いまま実践の現場に出ることになり兼ねません。

「Watsonの実力はいかほどなのか?」と感じる読者も多いことでしょうが、実際にはコーパス構築によってWatsonの実力がそれぞれのシステムよって大きく左右されることから、日本語版の提供がはじまったばかりの現時点では、Watsonの実力はまだ十分に見ることができません。


Watson-0218-16

「戦略・企画立案・データ検証」は導入前のコンサルティング業務、「特定の適用領域でのWatson訓練・アプリ開発」にWatsonのトレーニング(学習・訓練)という言葉が使われているところが従来のシステム構築とは少し異なる点

日本IBMとしてはWatson関連事業部の人員を3倍に増員し、全社をあげてWatson Groupの強化をしていき、また、ハッカソンなどを利用して社内で100のユースケースを年内に作成するとしています。



最前線の現場から思うこと

Pepperの誕生によってコミュニケーション・ロボットの新しい時代がはじまったように、IBM Watson日本語版のリリースによって、コンピュータと自然言語の新しい時代が幕を開けました。

また、ディープラーニングの登場が画像認識や人工知能技術を新しいフェーズに導いたように、自然言語解析技術の進化が人類とコンピュータにとって最も簡単なインタフェースである「会話」をより高度なものへと導くでしょう。コンピュータが人間の言葉を理解し、文章を読んで自律学習したり、人間が気付かなかった新しい発見を膨大なデータの中から見つけ出す時代がはじまっているのです。これまでのコンピュータの考え方が変わり、ビジネスや社会が変わる大きな可能性を持っています。

では、IBM Watsonがこの覇権を握るのでしょうか。

IBMからは「この技術をデファクトスタンダード(業界標準)に押し上げるためにとにかく普及を急ぐという姿勢」は感じません。例えば、Watson導入には導入企業独自のコーパスの構築とトレーニングが必要で、これには3〜6ヶ月程度の期間やコストを考える必要があります。Watsonを賢く教育し、実務の精度を向上させるための鍵となる部分です。いわばストロングポイントであり、裏を返せばウィークポイントにもなりえます。

Watsonのコグニティブ・システムと同様の技術に着目している企業は多く、急速に研究も進められています。今後は人工知能の名前で次々と新しいシステムが登場するでしょう。OSメーカーやキャリア、プラットフォームのメーカー等は、自社で開発した人工知能のプラットフォームをデファクトスタンダードとして普及させるために、このような技術をできるだけ安価に、あるいは無償で、しかも教育期間が短くて済むように予め万能に近いコーパスを搭載し、ある程度の学習を済ませた状態でサービス提供しようと画策するかもしれません。もちろん、簡単に真似ができる技術ではありませんが、市場が大きいだけに多くの企業がその座を狙っているでしょう。

圧倒的なブランド力と技術力、先進性で先陣を切ったWatsonですが、新しい「Think」はまだ始まったばかり。圧倒的な驚きを日本語版でも見せることができるのか。その答えはまだ少し未来にあります。

そして追従するセカンドプレイヤーはどこなのか、ワクワクが止まりません。


Watson-0218-31

圧倒的なブランド力と技術力、先進性でコグニティブ・コンピューティングの時代を切り開くIBM Watson日本語版。その動向に今後も目が離せない



ABOUT THE AUTHOR / 

神崎 洋治

神崎洋治(こうざきようじ) TRISEC International,Inc.代表 「Pepperの衝撃! パーソナルロボットが変える社会とビジネス」(日経BP社)や「人工知能がよ~くわかる本」(秀和システム)の著者。 デジタルカメラ、ロボット、AI、インターネット、セキュリティなどに詳しいテクニカルライター兼コンサルタント。教員免許所有。PC周辺機器メーカーで商品企画、広告、販促、イベント等の責任者を担当。インターネット黎明期に独立してシリコンバレーに渡米。アスキー特派員として海外のベンチャー企業や新製品、各種イベントを取材。日経パソコンや日経ベストPC、月刊アスキー等で連載を執筆したほか、新聞等にも数多く寄稿。IT関連の著書多数(アマゾンの著者ページ)。

PR

連載・コラム