NTT、超高精細映像をリアルタイムでAI推論できる「LSI」を開発 解像度制約を4Kに拡張、ドローンなら上空150mから人や物を解析

NTT(日本電信電話株式会社)は、4Kクラスの超高精細映像をリアルタイムで解析してAI推論する処理を、エッジ/端末上で実行できる「AI推論LSI」を開発したと2025年4月11日に発表した。発表に先立って、報道関係者向けの説明会を開催した。
なお、この研究開発成果は、2025年4月9日~10日にアメリカ・サンフランシスコで開催されている「Upgrade2025」で展示される。

省電力機能も備え、ドローンやカメラ、ロボットなどに搭載して、人や自動車、目標物などを高精度で正確に捕捉し、解析することができる。例えば、このLSIを搭載したドローンは、地上150mから広域に渡って人やモノを検出したり、目視外で安全航行しながら設備点検などが可能になり、省力化やコスト削減に貢献する、としている。
商品化は、NTTイノベーティブデバイス株式会社より、2025年度内に予定している。



4K解像度の画像解析と省電力を実現

AI技術の発展により、ドローンでのインフラ点検、ドローンの目視外飛行や公共空間における人流分析、セキュリティカメラによる安全監視など、カメラ映像のAI解析で業務の効率化を急速に推し進めている。

その一方、解像度やリアルタイム性の面で課題もある。例えば、従来のドローン監視では、画像解像度の関係上、地上30m程度が解析の限界とされてきた。NTTが今回開発を発表したLSIは、AI推論における解像度の制約を4K映像にまで拡張し、画像の分割と合成処理を組み合わせることで、地上約150mからの映像をリアルタイムかつ低電力で処理することが可能になった。





4Kカメラで撮影しても処理は低解像度になっていた(従来の課題)

一般に「AI推論」が画像を解析する場合、計算量の低減と学習容易性の観点から、入力画像サイズに制限がある。例えば、物体検出のAI推論モデルである「YOLOv3」の公式モデルの最大サイズは「608×608」ピクセルしかない。より大型のモデルも登場してきているものの、例え4Kカメラで撮影した映像でも、実際には小さい画像サイズに縮小してAI推論を行うため、小さな物体が潰れて検出困難だった。今回対応する4Kサイズ(3840×2160)はそれらに比べるとかなり高い解像度で解析処理ができる。

高解像度の4K対応カメラの映像(3840×2160)であっても、AI解析には「608×608」に縮小され、被写体は鮮明に判別できなかった(YOLOの場合)


GPUより低消費電力

バッテリーで駆動するドローンやロボットなどのエッジ/端末のアプリケーションでは、厳しい電力制約がある。AIで一般にサーバ等で利用される「GPU」は数100Wの消費が見込まれるが、このLSIでは電力が1桁以上低いAIデバイス(数10W)が利用される。


高解像度で低消費電力

NTTは、高精細映像AI推論ハードウェアの研究開発に取り組み、4K映像のリアルタイムAI推論処理を実行可能にする「AI推論LSI」を開発。このLSIを用いて、例えばYOLOv3を実行した場合、一般的なエッジ/端末向けAIデバイスで低解像度「608×608」ピクセルに縮小して物体検出処理した際の消費電力と同等以下(20W以下)の、4K解像度でのリアルタイム物体検出処理(30fps)が可能になるという。

これにより、例えばドローンに本LSIを搭載することで、目視外での安全航行に必要な飛行経路下の人・モノの有無の確認を、最大150m高度からでもAIで処理することが可能となる。また、公共空間における人流分析や交通分析サービスにおいては、より広範囲での検出が可能となり、自動被写体追跡では、より高精度な追従が可能となる。




技術のポイント


1.AI推論高精細化技術

まず、画像縮小なしで推論するために、入力画像サイズを制約サイズにまで分割して、分割画像毎に推論を実施。これにより、小さな物体が検出できるようになる。
これと並行して、分割画像を跨ぐような、大きな物体も検出できるようにするために、画像全体を縮小しての推論も行う。こうして得られた画像全体からの結果と、分割画像からの結果とを合成することで、最終的な検出結果を得る。
これにより、4K映像に対しても、大小両方の物体を検出することが可能となる。また、物体検出は互いに独立しているので、ハードウェアによる並列実行もできる。




2.独自の映像AI推論エンジン

高精細化技術は、4K映像においては、分割画像数が多く、そのままでは計算量が膨大となり、ハードウェアで並列演算するにしても、リアルタイム処理が困難となってしまう。このため、独自AI推論エンジン(図2(b))では、フレーム間相関を利用した演算効率化などによって、検出精度を確保しつつ、演算量の削減を実現し、低電力での4Kリアルタイム実行を可能にした。





今後の展開

今後についてNTTは、「NTTイノベーティブデバイス株式会社にて、2025年度内に本LSIを製品化する予定です。また、NTT研究所では、対応推論モデルやユースケースの拡大など、本LSIに関するさらなる技術開発を進めていきます」とコメントしている。

ABOUT THE AUTHOR / 

神崎 洋治

神崎洋治(こうざきようじ) TRISEC International,Inc.代表 「Pepperの衝撃! パーソナルロボットが変える社会とビジネス」(日経BP社)や「人工知能がよ~くわかる本」(秀和システム)の著者。 デジタルカメラ、ロボット、AI、インターネット、セキュリティなどに詳しいテクニカルライター兼コンサルタント。教員免許所有。PC周辺機器メーカーで商品企画、広告、販促、イベント等の責任者を担当。インターネット黎明期に独立してシリコンバレーに渡米。アスキー特派員として海外のベンチャー企業や新製品、各種イベントを取材。日経パソコンや日経ベストPC、月刊アスキー等で連載を執筆したほか、新聞等にも数多く寄稿。IT関連の著書多数(アマゾンの著者ページ)。

PR

連載・コラム