NVIDIAがディープラーニングの最新状況を学べるイベント開催、AIが人間を超えた分野とは? 自動運転にも注力、ハンズオンは開発者で賑わう

NVIDIA(エヌビディア)はディープラーニングの最新状況を学べるイベントとして「DEEP LEARNING INSTITUTE」(略称:DLI)を1月17日に東京高田馬場で開催した。
NVIDIAは主にビデオチップやグラフィックボードを開発している会社だ。ビデオ分野で開発してきたチップ「GPU」が、ディープラーニング等の並列演算処理については「CPU」が高速なスーパーコンピュータ並みの性能も可能として、AI関連市場の拡大とともに注目度を急激に伸ばしている。先日ラスベガスで開催された「CES 2017」の基調講演では同社のCEOがトップで登壇したほどだ。

当日は、セミナーでは自社製品の導入事例やライブラリ等のツールの紹介、開発者向け機械学習ライブラリトレーニングなどを行い、ディープラーニングと自社技術を更に一般の開発者に対しても訴求した。

dli201701-01

基調講演を行うNVIDIA Corporationの主席研究員のビル・ダリー氏



ハンズオン トレーニングにはたくさんの開発者が参加

特に午後半日をかけて行われたハンズオン トレーニング「DIGITS で始めるディープラーニング画像分類」や「DIGITS による物体検出入門」の講座では、参加者がPCを持ち込み、実際にディープラーニングのライブラリを操作して体験、学習することができた。

dli201701-02

ハンズオン トレーニング「DIGITS で始めるディープラーニング画像分類」の様子。開発者が多数集まり、自身のPCを使ってディープラーニングによる画像分類を体験した。(会場の中程あたりから撮影)

dli201701-05

dli201701-04

セミナー講師はエヌビディア合同会社 ディープラーニング部 森野慎也氏

自社で開発したソフトウェアに今後、ディープラーニングを導入する企業が一気に増えていることを身近に感じるイベントとなった。


ビル・ダリー氏の基調講演「進化は3年で16倍に」

NVIDIA Corporationの主席研究員のビル・ダリー氏(Bill Dally)が基調講演を行った。
ダリー氏はスタンフォード大学のコンピュータサイエンス学部長として12年間勤務した実績があるNVIDIAの主席研究者。
それ以前はマサチューセッツ工科大学でプログラミングモデルからメカニズムの分離の先駆け、低いオーバーヘッドで同期化・通信メカニズムを実行する技術の開発に携わった経験もある。

dli201701-06

NVIDIAのPascalの高速性能は、この4年間でディープラーニングの処理能力が65倍に高まったことを紹介するビル・ダリー氏

NVIDIAは高速で消費電力の少ないGPUを開発していて、GPUは今後エクサスケールのマシンの一部として使われるようになると予測、実現に対して20MW以下で如何にエネルギー効率を上げていくのかが大切で、4〜5年以内にそれを達成したいと考えている、と語った。

dli201701-11

ディープラーニングは、インターネットやクラウド、医療・創薬・バイオロジー、セキュリティや監視、自動運転など、さまざまな分野で活用されはじめている

「ベストサイエンスを発見するために必要なものは、100年前は「高性能な望遠鏡」だったが、50年前に必要なものは「高性能な顕微鏡」となった。そして今は、スーパーコンピュータを持っていることがベストサイエンスにとって大切だ。なぜなら、繰り返しのシミュレーションが必要で、それにはディープラーニングと計算能力の高いコンピュータが必要だからだ。そして、シュミレーションには膨大なデータが必要だ。2006年にはビッグデータが用意できるようになったが、高性能な計算能力がなかった。いま計算能力を高めるためのGPUがそろい、誰もがディープラーニングによってシュミレーションを行う環境が現実的になった。ディープニューラルネットワーク、ビッグデータ、GPUの3要素が揃ったいま、我々は従来なら5年かかる技術の進歩をたった1年で実現できるようになったとも言える」と続けた。




ディープラーニングの登場で人間の能力を超えた分野は

「イメージネット(スタンフォード大学関連組織が開催する国際的な画像認識コンテスト)では画像認識率が多くのチームによって争われているが、ディープラーニングの登場によって画像認識率が一気に向上して、最近ではGoogleやMicrosoftが3.5%のエラー率(誤認識率)を記録している。これは一般的な人の能力を超えている数値だ。
2012年の「Alexnet」は8層レイヤーで1.4GFlop、16%のエラー率だったが、2015年の「Resnet」(Microsoft)は152層レイヤー構造で22.6GFlopへ進化し、3.5%以下のエラー率を実現している。これは16倍の進化となる。同様に音声認識でも百度(バイドゥ)の「Deep Speech」は465GFlopで5%以下のエラー率だ」

dli201701-13

Microsoftの画像認識システムは16倍の性能向上、百度の音声認識は一年間で10倍の学習速度を実現

「これらの技術はGoogleのアプリの「言語の翻訳」でも成果が見られるほか、Androidアプリ、創薬、Gmail、画像認識、地図、感情解析、バイオロジー、医学・医療、セキュリティ、ビデオ監視、顔認識、メディアやエンタメ、ビデオキャプチャーなどで利用されている」

dli201701-12
実際に今、ディープラーニングは特定の分野で、人間と同等、もしくは超えたと言われている。ダリー氏のスライドでは、音声会話、画像分類と検出、顔認識、Atariゲーム(ブロック崩しやスペースインベーダーなど)のプレイ、囲碁などを紹介している。

bill-dl
「そして最も興味深いもののひとつが自動運転だ。10兆円の市場になるといわれているが、自動運転の画像処理にはディープラーニングが効果的だ。道路の認識、周囲の環境認識、人や対向車などを高い精度で認識できる段階にきている」等と解説した。

dli201701-15
「安全な状態にあるか」「障害物を感知したときにどちらにハンドルをきるか」などを判断するとともに、同社のクラウドシステム「パイロットネット」では車載センサーからの情報を得て、人間の操作を素に学習していくという。

dli201701-14

NVIDIAは自動運転用のGPU搭載ユニット「DRIVE PX2」をリリースしている。用途と自動運転の範囲によって、3種類の製品がラインアップされている

基調講演ではカリフォルニア州でスターバックス(コーヒー店)をゴールに設定した自動運転車が公道を走るビデオが上映され、ルーティンの走行では既に正常に到着できる様子をアピールした。

なお、NVIDIAでは今後もディープラーニングのトレーニングや関連情報の提供を今後も続けていく見込みだ。

関連サイト
DEEP LEARNING INSTITUTE

ABOUT THE AUTHOR / 

神崎 洋治

神崎洋治(こうざきようじ) TRISEC International,Inc.代表 「Pepperの衝撃! パーソナルロボットが変える社会とビジネス」(日経BP社)や「人工知能がよ~くわかる本」(秀和システム)の著者。 デジタルカメラ、ロボット、AI、インターネット、セキュリティなどに詳しいテクニカルライター兼コンサルタント。教員免許所有。PC周辺機器メーカーで商品企画、広告、販促、イベント等の責任者を担当。インターネット黎明期に独立してシリコンバレーに渡米。アスキー特派員として海外のベンチャー企業や新製品、各種イベントを取材。日経パソコンや日経ベストPC、月刊アスキー等で連載を執筆したほか、新聞等にも数多く寄稿。IT関連の著書多数(アマゾンの著者ページ)。

PR

連載・コラム