NTTがIOWN技術で郊外型データセンタのリアルタイムAI分析の実用性をNVIDIA・富士通・Red Hatと実証 APN通信で低遅延と省電力を大幅向上

日本電信電話株式会社(NTT)は、IOWN 構想の一環として、Red Hat、NVIDIA、富士通の協力のもと、IOWN(アイオン)技術を用いて郊外型データセンタを活用したリアルタイムAI分析を省電力に実現する技術を開発したことを2024年2月20日に発表した。NTTは発表に先がけ、報道関係者向けに技術とフォーラムについての説明会を実施した。





IOWN技術で遅延時間を最大で60%削減

このAI分析基盤では、IOWNオールフォトニクス・ネットワーク(APN: All-Photonics Network)、および IOWNデータセントリック基盤(Data Centric Infrastructure、以下、DCI)のデータ処理高速化手法を活用している。この実証実験を通じ、郊外型データセンタによる AI分析において、従来の方式と比べて、遅延時間(センサ設置拠点でデータを受信してから郊外型データセンタでAI分析を完了するまでの時間)を、最大で60%削減できることを確認したという。

横須賀を都心部、武蔵野を郊外データセンターと想定して、約100kmの通信をIOWNのAPN通信で接続して実験を行った。

また、郊外型データセンタにおいてカメラ毎のAI 分析に要する消費電力を、最大で40%削減できることを確認した。これらにより、AI のリアルタイム分析処理の郊外型データセンタ集約およびその省電力化が可能になるとしている。この成果は、2024年2月29日実施予定のMWC Barcelonaでの IOWN Global Forumセッションにおいても紹介される。なお、AI分析基盤の郊外型データセンターにおけるAI推論では、NVIDIA A100 Tensor コア GPU とNVIDIA ConnectX-6 NIC を搭載した Fujitsu PRIMERGY RX2540 M7 を利用している。また、データ処理高速化として NVIDIA Rivermax、nvJPEG、CV-CUDA、Unified Communication X フレームワークなどの NVIDIA のライブラリも活用している。


なぜ郊外型のデータセンターが重要なのか?

近年、センシング、ネットワーキング、およびAI技術の進展により、リアルタイム性が重視され、一方で生成される大規模データのAI分析によって、大容量データの計算が重要になっていて、リアルタイム性を重視し、都心に近いデータセンターが求められる傾向にある。その結果、コストが高く、都心部で増える電力が負担となってくる。

【現在の課題】
・センサ設置拠点におけるAI分析では、維持管理コストが高く、進化し続けるAIモデルやハードウエアに追従することが困難。
・クラウドの大規模データセンターにおけるAI分析では、大規模データの収集に伴う遅延やCPUのオーバヘッドにより、リアルタイム性が損なわれる傾向にあり、厳しいリアルタイム性能が求められるサービスの提供は困難。

これらの課題に対し、エッジコンピューティングによる、センサ設置拠点近傍(一般的に、センサ設置拠点から数十km圏内)でのAI分析も議論されているものの、土地や電力の不足から、特に大都市圏において、多くのGPUといったアクセラレータを必要とするAI分析処理を収容できるデータセンターを見つけることは難しくなってきている。

そこで、数百キkm離れた郊外のデータセンターと、超高速通信技術IOWNで結ぶことで、リアルタイム性を損なわずに、比較的土地が安価で、電力が安定している郊外のデータセンターの利用が視野に入ってくる。


APN による低遅延・ロスレス通信で距離の課題を解消

このAI分析基盤では、IOWN Global Forumで検討されている、APN による低遅延・ロスレス通信、ならびに、DCIにおけるデータ処理高速化手法を活用している。通信機器同士のプロトコルのネゴシエーション等などのオーバーヘッドがなく、圧縮・伸張の処理も減ずるため演算時間が大幅に短縮される。



これらにより、大規模データの通信時にオーバヘッドが最小限に抑えられるため、大都市圏内に設置されたセンサからデータを収集し、郊外型データセンターで高速にAI分析することが可能になる(図1)。


特に、郊外型データセンターは、大都市圏内に設置されたデータセンターと異なり、再生可能エネルギーを最大限活用できるという利点もあるため、環境に優しい利点も考えられる。
この実証実験における AI 分析基盤の特長は、以下の通り(図2)。

NTT によるAI推論のデータ処理高速化(*2):RDMA over APN を用い、センサ設置拠点におけるセンサデータを、郊外型データセンタに設置されたアクセラレータのメモリ上に直接転送する。これにより、従来ネットワークにおけるプロトコル処理のオーバヘッドを大幅に削減する。また、CPU による制御オーバヘッドを抑えつつ、アクセラレータ内でAI分析処理を完結させることで、その電力効率を改善する。

・Red Hat OpenShift(*3)による柔軟なワークロードの配備:Kubernetes ベースのハイブリッドクラウド向けアプリケーションプラットフォーム Red Hat OpenShift は、GPU といったアクセラレータの複雑性を隠蔽するための Kubernetes Operator(*4)の仕組みを備える。これにより、データ処理高速化が適用されたワークロードを、郊外型データセンタをはじめとする複数サイトに、柔軟かつ容易に配備できるようになる。


実証実験の結果

この実証実験では、横須賀市におけるセンサ設置拠点と、武蔵野市における郊外データセンターとをAPNで接続して、AI分析基盤を評価しています(図3)。横須賀市と武蔵野市間の光ファイバの距離は、およそ100km。センサーとして多くのカメラ接続を模擬した状態で、従来のAI分析処理を適用した結果と比較した結果、本AI分析基盤では、その遅延時間(センサ設置拠点でデータを受信してから郊外型データセンターでAI分析を完了するまでの時間)を、最大で60%削減できること確認した。


また、郊外型データセンターにおいてカメラ毎のAI分析に要する消費電力を、最大で40%削減した。加えて、本AI分析基盤は、GPUの数を増設することで、CPUボトルネックを生じさせることなく、より多くのカメラを収容できる。その結果、1,000台カメラの収容を想定した「見積り」において、最大で60%の消費電力の削減が見込まれる。本実証実験は、IOWN Global Forum から、Proof of Concept(PoC)Referenceに準拠したPoCとして認定されている。また、この実証実験の詳細は、IOWN Global Forum の公式サイトに掲載されている IOWN PoC レポートから確認でき、会員等と情報共有する。


今後の展開

今後は、本AI分析基盤に、光電融合技術を組み合わせ、更なる電力効率の向上を図り、カーボンニュートラルの実現に向けて貢献する。また、これらの成果は、IOWNコンピューティングの一部として、2025年大阪・関西万博における NTTパビリオンに適用すると共に、2026年の商用化をめざす、としている。

ABOUT THE AUTHOR / 

神崎 洋治

神崎洋治(こうざきようじ) TRISEC International,Inc.代表 「Pepperの衝撃! パーソナルロボットが変える社会とビジネス」(日経BP社)や「人工知能がよ~くわかる本」(秀和システム)の著者。 デジタルカメラ、ロボット、AI、インターネット、セキュリティなどに詳しいテクニカルライター兼コンサルタント。教員免許所有。PC周辺機器メーカーで商品企画、広告、販促、イベント等の責任者を担当。インターネット黎明期に独立してシリコンバレーに渡米。アスキー特派員として海外のベンチャー企業や新製品、各種イベントを取材。日経パソコンや日経ベストPC、月刊アスキー等で連載を執筆したほか、新聞等にも数多く寄稿。IT関連の著書多数(アマゾンの著者ページ)。

PR

連載・コラム