ニュースを3行に要約し、複数単語から文章を自動創作する次世代「大規模自然言語AI」の実力を公開 東大松尾研発イライザが開発

「NVIDIA AI DAYS」では、最先端のAI、ディープラーニング技術が集結し、それらがセミナーやセッションの形式で数多く紹介された。そして、ここ最近で著しく進化している「会話AI」「対話AI」の分野で頭角を現している株式会社ELYZA(イライザ)は、「大規模言語AIによるホワイトカラー業務のDX」というタイトルで、代表取締役 曽根岡侑也氏が講演を行った。


ELYZAは東京大学 松尾研発のAIスタートアップ企業だ。日本語AIサービス「大規模言語AI イライザ」を開発し、講演の前日にプレスリリースを発表したばかり。日本語に特化した大規模AI技術で、日本語を「まとめる、書く、読む、話す」を人間並に実現しよう、というものだ。


会話ロボットや質疑応答・雑談システムなどにおいて、これまであまり評価が高くなかった日本語AI(自然言語処理)を革新し、その分野のDXに挑戦する。


既に成果は出ていて、損保ジャパンやマイナビ、森・濱田松本法律事務所などがこのサービスの活用を開始している。


そして、この「イライザ」の技術群がどれも実に面白い。


「大規模言語AI」の進化に日本は遅れている

講演の中で曽根岡氏は「Google、Apple、Meta、Amazon、Microsoftなどが積極的に技術開発を行い、大規模モデルと大規模データを用いた結果、既に「文字読解」や「レポート作成」等において、人間の能力を超えた検証結果が次々と発表されている」ことを紹介して。

「文字読解」は「文章を読んでなぜAさんは怒ったのですか?」という問いに回答する(正答の部分を抜き出せるか)等でAIが人間を上回った。「レポート作成」は課題に対するレポートを作成させたところ、AIの方が圧倒的に早く仕上げた

AIの登場で、自然言語処理の精度は著しく向上してきたが、2018年10月に登場したGoogle「BERT」によって更に加速し、人間の精度を超える進化を(英語圏では)遂げた・・・

「英語圏に比べて日本語環境の進歩は置いていかれている」と危機感を募らせ、曽根岡氏は「大規模言語AI イライザ」を鍛え上げた。


「大規模言語AI イライザ」でできること

「大規模言語AI イライザ」は「読む、書く、話す」に加えて、「まとめる(要約する)」ことにも対応している。日本語テキストの分類問題においては、既に人間より高い精度を実現しているという。


曽根岡氏が分析した、日本語言語処理における「ELYZA Brain」のタスクを紹介した表も興味深い。○、△、× は、精度を上げるためにはどれだけデータが必要かを示したものとなっている。


なお、イライザでは「まとめる」「書く」「話す」というシステムをそれぞれ個別に開発している。


要約AI「イライザダイジェスト」

要約AI「イライザダイジェスト」はどんな文章もAIが読解して「3行に要約する」システム。既に一般公開しており、公開5日で13万人を突破した。


曽根岡氏がサンプルとして要約例を紹介した。「NVIDIA AI DAYS」のウェブページ(長文)をコピー&ペーストして「イライザダイジェスト」を実行すると、わずか5~6秒で「NVIDIA AI DAYS 2020ではAIを活用してDXを推進するヒントと成功事例を紹介・・・(後略)」と、みごとに要約した。曽根岡氏はこの技術は文章全体を読んで、一文字ずつ紡いで文章を作成することで高精度な要約を実現している、とした。

また、長文のプレスリリースをAIが読解して簡潔に要約したり、会話を音声認識して要約する例も公開した。特に会話の音声認識では、会話特有のフィラー(間投詞)が入ったり、認識精度が低い部分もあるが、それをうまく回避して正確に要約している。なお、SONPOホールディングスのプレスリリースは実際のモノで、イライザが実際にコールセンターに導入されている。

プレスリリースやニュース記事の要約

音声認識したテキストの要約(コールセンター等)


文章執筆AI「イライザペンシル」

文章執筆AI「イライザペンシル」はキーワードをいくつか入力すると、それに関する文章を自動生成するというもの。今年3月にリリースして、11日間で11万ユーザーを突破した。


サンプル例がいくつか紹介されたが、「黒ヤギ様、白ヤギ、手紙、読まずに食べてしまう」というワードからAIが作ったメールの文章が秀逸だった。

文章執筆AIが作ったメールの文章。思わず拍手を送った

このシステムはマイナビしの共同実験を行っているという。

曽根岡氏は、SONPOホールディングスやマイナビのように共同研究を行うパートナーを募集していると語った。
なお、大規模言語AIの活用事例も紹介する「大規模言語AI イライザ」のサービスサイトを公開した。興味のある読者はそちらも確認してみてはどうだろうか。


■「大規模言語AI イライザ」サービスサイト
https://service.elyza.ai/

ABOUT THE AUTHOR / 

神崎 洋治

神崎洋治(こうざきようじ) TRISEC International,Inc.代表 「Pepperの衝撃! パーソナルロボットが変える社会とビジネス」(日経BP社)や「人工知能がよ~くわかる本」(秀和システム)の著者。 デジタルカメラ、ロボット、AI、インターネット、セキュリティなどに詳しいテクニカルライター兼コンサルタント。教員免許所有。PC周辺機器メーカーで商品企画、広告、販促、イベント等の責任者を担当。インターネット黎明期に独立してシリコンバレーに渡米。アスキー特派員として海外のベンチャー企業や新製品、各種イベントを取材。日経パソコンや日経ベストPC、月刊アスキー等で連載を執筆したほか、新聞等にも数多く寄稿。IT関連の著書多数(アマゾンの著者ページ)。

PR

連載・コラム