【GTC 2018現地レポート】トヨタAI研究所「Toyota Research Institute」が開発する2モードの自動運転ソフトウェア!AWSや開発環境も公開

トヨタのAI研究所「Toyota Research Institute」(TRI)では、AmazonのAWSを活用して、自動運転用ソフトウェアの開発や機械学習が行われている。TRIが開発するソフトウェアは2つのモードを持つことが特徴だとしている。また、CEOのGill Pratt氏がCES 2016で提唱した「Trillion-Mile Reliability」を実践するプログラムも実施しようとしている。
開催中の「GTC 2018」で、アマゾンのセミナーセッションにTRIがゲストで登壇し、取り組みを紹介して明らかになった。

Amazonのクラウドサービス「AWS」では、いくつかのディープラーニングを使ったAI技術をユーザーが利用できる。そして、ディープラーニングにはNVIDIAのGPUが採用されている。そして、その代表事例のひとつとして、トヨタのAI研究所「TRI」をあげた。

Toyota Research InstituteでMachine Learning Leadを担当するAdrien Gaidon氏

TRI の使命は、AI、自動運転、ロボット技術の進歩によって人間の生活の質を向上させることだ。自社の研究と、業界で最も強力なGPUインスタンスであるAWS EC2 P3インスタンスと他のAWSサービスをどのように組み合わせて使用して、自律型車両とロボットを大規模に活用できるかを紹介した。


AWSではGPUとFPGAのインスタンスを提供

セッションの冒頭では、AWSのSenior Product Managerを担当するChetan Kapoor氏が登壇し、AWSの機械学習のスタックについて、レイヤーごとに簡単に紹介した。

米アマゾンのEC2, Amazon Web ServicesのEC2, Amazon Web ServicesのChetan Kapoor氏

AWSのアプリケーションサービスには、Recognition、Polly、Lex、翻訳などが用意されていることは知られているとおり。


そこには、GPUインスタンスとして、ディープラーニングやビジョン解析などに最適なコンピューティング・インスタンス(P3)と、3Dやポリゴン処理等に最適なグラフィクス・インスタンス(G3)がある。また、そのほかにFPGAを使ったインスタンス(F1)も用意されている。

GPUコンピューティング向けのインスタンスとして「G3」、最高峰の「P3」を提供している。また、そのほかにFPGAを使った「F1」も用意されている。それぞれの違いはスライドを参照

また、AWSでは汎用 GPU コンピューティング用途向けに設計された次世代の EC2 コンピューティング最適化 GPU インスタンスとして「Amazon EC2 P2」を提供してきた。CUDA や OpenCL を使用するのに最適とうたってきた。それに加えて、更に高速なインスタンスとなる「Amazon EC2 P3」を2017年10月に発表した。これには、「NVIDIA Tesla V100 GPU」を最大 8 個を使用し(P2ではV80 GPUを使用)、機械学習 (ML)、ハイパフォーマンスコンピューティング (HPC)、データ圧縮、暗号化など、高度な計算を必要とするワークロードに最適だとしている。
セッションの中では「P2」と「P3」のパフォーマンスの違いを、採用しているGPU「V80」と「V100」を例に紹介した。その差は1.7倍からスケーラブルに使用した場合は7.2倍の高速性になると言う。

AWSの「P2インスタンス」と「P3」の高速性の違いをGPU性能差で紹介。スケールした比較では最大7.2倍


AWS EC2 P3インスタンスは「air bnb」や「ウェスタンデジタル」「TRI」などが導入事例としてあげられた。





トヨタはGuardianとChauffeurの2つのモードを持つ自動運転ソフトウェアを開発中

TRI

自動運転に関するビジョンについてお話しします。
TRIは安全で、ロバスト性のある、多目的で、複数の制御モードを搭載した自動運転のシステムを作ることを目標としています。安全な自動運転を確立するためにTRIが開発している「Autonomy Software」には2つのモードがあります。自動運転車のプラットフォームをテストするために開発したものですが、ひとつのソフトウェアに、2つの違うモードを備えたものになっています。

トヨタが開発するガーディアンとショウファー。ひとつのソフトウェアにふたつのモードを実装する

2つのモードのうち、ひとつは「ガーディアン」(Guardian)で、もうひとつは「ショウファー」(Chauffeur)です。
ショウファーは皆さんが思うような自動運転の形です。人間の代わりになって完全に自動で運転するものです。これが最終的な目標ではあるのですが、実はいま面白いのはガーディアンの方です。私たちはこの技術を通じて、常に人が運転するのを監視し、必要な時にだけ介入(関わる)という技術です。潜在的に潜んでいるクルマの衝突や事故の可能性から守るためのしくみです。
ショウファーは、車が運転しますから車に責任があるわけですが、ガーディアンはドライバーが運転してドライバーに責任があるとされつつも、AIがその手助けをするということです。


この表を見てください。SAE が策定している「自動運転のレベル一覧」です。
本当は、レベル0、1、2、3、4、5、6、7・・・といくつかあるのですが・・誰もが覚えきれないので(笑)、革命的な表現でレベルを示しましょう。



Adrien氏はそう言うと、自身のツイッターを引用し、その画面を見た観客からは笑いがこぼれた。

TRI

「レベル0」では、あなたが運転します。「レベル1」では足を使わない(アクセルペダル)、「レベル2」では手と足を使わない(アクセルとハンドル操作)、「レベル3」では目も使わない。「レベル4」では頭も使わずに運転することができ、レベル5ではついには運転するあなたも必要ない、いうことです。これはとても難しく複雑な課題もあるので、私たちは現状よりもっと前進するために真剣にこれらの問題に取り組んでいこうと考えています。

自動車メーカーの中には、いきなり「レベル4」以降を目指して自動運転を実現しようというアプローチもあります。多くの人はそれが最良だと感じるかもしれません。しかし、私たちは必ずしもそれが正しいとは思っていません。私たちは人と自動運転の「協調性」が重要だと考えてます。
ガーディアンは人が運転し、それをAIが支援する協調性を重視したしくみです。



その後、Adrien氏はセマンテック・セグメンテーションを示す動画を紹介した。トヨタのビジョンシステムが画像から周囲の人や車、木など、あらゆるものを認識し、識別しようとするものだ。
動画の23秒くらいから左右に二分割の画面になっていくが、左が以前のバージョン、右(空が黄緑)が最新のバージョンだ。右は最新の機械学習技術で鮮明度や認識率が高いとしている。




トヨタが取り組む「Trillion-Mile Reliability」

TRI

どの程度のデータがあれば十分だと言えるのでしょうか?
解答は当然ですが「データはとてもたくさん必要」です。
トヨタは、「ガーディアン」のように協調性のあるシステムを開発しているとともに、たくさんのユーザを持つ企業だからこそ、膨大な走行に関するデータを収集すること、それらが大きな強みになります。



同氏は機械学習には3つの「P」が重要であり、Perception(知覚:見て認識して判断する)、Prediction(予測)、Planning(計画)をあげた。
「Your Model is (as good as) Your Data」という一文を紹介し、収集したデータによって作られるモデルは人を超えることはできないので、実際には少しでも近づけるためにより多くのデータが必要であり、データはどれだけ蓄積しても「充分」だということにはならない、という意味を示しているのだろう。


TRIのCEO、Gill Pratt氏は「Trillion-Mile Reliability」を提唱し、それを実現するためにTRIは「ザ・トリリオン・マイル・チャレンジ」を実施する。理論上、自動走行には、1兆もの走行データが必要だが、それを短期間に集積するのは不可能だ。そこで、走行している一般の車から数百万のデータを得て、更にプロドライバーのテストカーから集積した数百万のデータを合わせてクラウドシュミレータを構築して、何億マイルものシュミレーション走行を行うことでデータの蓄積を行うことを目指している。

TRIの機械学習の核となる「Trillion Mile Challenge:Simulation

最後にエンジニアのGarrison氏が登壇し、TRIの自動運転ソフトウェアの開発で使用しているツール類を紹介した。


上のスライドのように上段の4つのツールに「AWS」を使用していて、Amazon RDS、AWS Lambda、AWS ElasticSearch Service、Amazon ElastiCasheだ。その他、GRPC、React、PythonやNode JSなども使っていると言う。

(Featured Ayuka Alyson Kozaki)


ABOUT THE AUTHOR / 

神崎 洋治
神崎 洋治

神崎洋治(こうざきようじ) TRISEC International,Inc.代表 「Pepperの衝撃! パーソナルロボットが変える社会とビジネス」(日経BP社)や「人工知能がよ~くわかる本」(秀和システム)の著者。 デジタルカメラ、ロボット、AI、インターネット、セキュリティなどに詳しいテクニカルライター兼コンサルタント。教員免許所有。PC周辺機器メーカーで商品企画、広告、販促、イベント等の責任者を担当。インターネット黎明期に独立してシリコンバレーに渡米。アスキー特派員として海外のベンチャー企業や新製品、各種イベントを取材。日経パソコンや日経ベストPC、月刊アスキー等で連載を執筆したほか、新聞等にも数多く寄稿。IT関連の著書多数(アマゾンの著者ページ)。