NECと国立研究開発法人理化学研究所(理研)は共同で、AIを活用した画像認識において、新たな対象物を追加登録する際に必要となる学習データの作成作業を大幅に簡素化する技術を発表した。理研とNECの共同研究機関として設立した「理研AIP-NEC連携センター」で開発したもの。
この技術は「弱ラベル学習」を発展させたもの。AI画像認識で新たな対象物を追加する学習作業を大幅に簡素化することができ、現場でのAI適用の促進に貢献するとしている。
学習データの作成が利用者の大きな負担
建設現場や工場における作業や状況の見える化など、様々な用途においてAIによる画像認識技術の活用が広がっている。しかし、新たな建設現場や工場に画像認識技術を運用していくためには、工具・材料・重機など新たな検知対象を継続的に登録していくことが必要となる。このような場合、従来は新たな検知対象だけでなく、既存の検知対象についてもAIに対象物の位置とそれが何であるかの情報を教える必要があるため、学習データの作成が利用者の大きな負担となっていた。
今回、発表した技術は、AIの学習に曖昧な情報を活用できる「弱ラベル学習」という技術を発展させたもの。AIを活用した画像認識に対象物を追加登録するときに問題となる学習データ作成の手間を削減するもの。
従来の弱ラベル学習は「学習が不安定になり精度が低下する」という問題があったが、NECと理研は弱ラベル学習の安定化と正しいモデルの学習の両方を同時に満たすアルゴリズムを世界で初めて開発した(NEC調べ)。この技術を活用すると、80種類の検知対象物を含む画像認識において、学習データ作成時間を75%削減できることを確認した。
完全ラベル学習と弱ラベル学習
一般的に、AIを活用した画像認識において対象物を追加登録する場合、新たな検知対象のみをラベル付けしたデータでモデルの学習ができれば、作業に必要となる時間を大幅に削減できる。
AIを活用した画像認識の学習データにおいて、一部のみがラベル付けされ、それ以外の領域は何であるかが曖昧な「弱ラベル」が付与されたデータである、とみなして学習する手法として「弱ラベル学習」がある。例えば、トラックやバスなどの車両を認識するAIに新たに「バイク」を学習させる場合、トラックやバスや背景に対してラベル付けしないことは、それらが「バイクではない」という弱ラベルを付与したことに相当する。弱ラベル学習の手法により、このように「バイク」のみをラベル付けしたデータからでも学習可能となり、データ作成の作業工数を大幅に削減できる。
完全なラベルが付与されたデータを用いてモデルを学習する場合には、出力値が正解データに近づくようにモデルを最適化する。
これに対して、弱ラベル学習では、弱ラベルに基づいてモデルの予測の正しさを逐次推定しながらモデルを最適化するが、ラベルの曖昧性に起因して学習が不安定になり、高精度なモデルを学習できないという問題が知られていた。
この技術では、学習時の不安定性を解消するための補正を加えながら学習することで、この問題を解決。一般に、学習時に補正を加えると、学習が安定する代わりに、本来の目的である「対象物を正しく推定するモデルを学習」できる保証がなくなる。今回NECと理研は、弱ラベル学習の安定化と正しいモデルの学習の両方を同時に満たすアルゴリズムを世界で初めて開発した。
これにより、弱ラベルが付与されたデータからでも高精度なモデルを学習できる。
この技術は、機械学習・人工知能の分野で著名な国際会議ICML (International Conference on Machine Learning) 2021に採択され、発表している。