NVIDIAがTAOツールキットの最新バージョンをリリース ONNXモデルのウェイトインポート、REST API、TensorBoardの統合などを実装

NVIDIAはTAO Toolkitの最新バージョンの一般提供を開始したことを発表した。NVIDIA TAO(Train、Adapt、Optimize)フレームワークのローコードバージョンとなるこのツールキットは、音声およびビジョン認識のためのAIモデルの作成を簡略化および加速する。

TAOにより開発者は転移学習を利用し、欠陥検出や言語翻訳、交通管理など、産業界での多様なユースケースに最適化され、カスタマイズと即時実稼働が可能なモデルを作成できるようになる。これには、膨大な量のデータも必要ない。

TAO Toolkitの最新リリースには事前にトレーニングされたビジョンおよび音声認識用モデルが含まれ、開発者の生産性を向上させる。また、ONNXモデルのウェイトのインポート、REST API、およびTensorBoardの統合といった新しい機能を実装している。


最新バージョンの特徴


REST APIでTAO Toolkitをas-a-Serviceとして展開

REST APIを使用して新しいAIサービスを構築したり、既存のサービスに統合したりすることが可能になる。Kubernetes上でTAO Toolkitサービスを管理およびオーケストレーションすることができる。TAO Toolkit as-a-serviceにより、IT管理者は業界標準のAPIを使用してスケーラブルなサービスを提供することができる。


独自のモデルの重みを活用

TAO以外のモデルをTAOで微調整、最適化することができる。ONNXから事前学習された重みをインポートし、独自のモデルにプルーニングや量子化といったTAOの機能を活用することができる。これは、画像の分類やセグメンテーションのタスクでサポートされている。


TensorBoardによる可視化

TensorBoardでのトレーニングと検証のロス、モデルウェイトおよび予想される画像といったスカラー値を可視化することで、モデルトレーニングのパフォーマンスを把握できるようになる。実験の際にハイパーパラメータを変更しながら結果を比較すれば、ニーズに最も合ったものを選ぶことができる。


事前トレーニング済みのモデル

モデルが事前にトレーニングされているため、少ないデータでも転移学習によって微調整が可能で、カスタマイズのプロセスをスピードアップできるようになる。この最新バージョンに実装される事前トレーニング済みの新モデルのいくつかを使うと、以下が可能になる。

・ロボティクスおよび自動車用LiDARセンサーから集めたデータの適用
・公共安全、小売、および労働者の安全を守るためのユースケースで使用可能な人間の姿勢に基づいた行動の分類
・人間、動物および物体のキーポイントを推測し、動作の描写や物体の形状を明確化
・わずか30分の録音データからスマートデバイス、ゲームキャラクター、クイックサービスレストラン(QSR)などに活用可能なカスタマイズされた音声の作成

TAO Toolkitの企業向けサポートはAIの開発および展開のためのエンドツーエンドのソフトウェアスイートであるNVIDIA AI Enterpriseで利用できる。TAO Toolkitの新しいリリースは、NVIDIA AI Enterpriseの次の四半期でのアップデートに含まれる予定。

ABOUT THE AUTHOR / 

山田 航也

横浜出身の1998年生まれ。現在はロボットスタートでアルバイトをしながらプログラムを学んでいる。好きなロボットは、AnkiやCOZMO、Sotaなどのコミュニケーションロボット。

PR

連載・コラム