所要時間110秒がAIで2秒に!ソフトバンクがAIアノテーション代行サービス提供開始 高スキル/画像識別AI/チャットで高品質で廉価に提供

ソフトバンクは、教師データを作成するAIアノテーション代行サービス「TASUKI Annotation」(タスキアノテーション)の提供を、2022年6月から本格的に開始したことを発表した。


「TASUKI Annotation」は、ソフトバンクおよびソフトバンクのグループ会社の従業員を対象とした新規事業提案制度「ソフトバンクイノベンチャー」から生まれたサービス。AIを活用したサービスを開発する企業やAIを研究・開発する学術機関向けに、スキルの高いスタッフで構成、AIを活用、高精度、短納期、廉価なサービスを提供していくとしていく。


同社によれば「アノテーション作業するデータ量にもよるが、一般のアノテーション代行サービスと比較して、コストは数10万が数万円レベルに削減したり、2~4週間かかる作業を半分か1/3程度に短縮できると見込んでいる。少量のアノテーションデータでも違いが出ると思うが、多いほどコスト削減や納期短縮の効果は大きい」としている。
また、対象は画像だけでなく、テキスト、音声などあらゆるデータのアノテーションに対応することができる。「SNSの投稿データを収集して、感情を識別したり、内容を識別するためのアノテーション作業も承れる」と続けた。


AIシステム開発の課題となる高精度な「アノテーション」を代行

生産性の向上などを目的に、AIの導入を検討する企業が急増している。AIを自社開発に取り組んだり、AI開発を受注するシステム開発会社などが増える一方で、高精度のAIを開発するためには、膨大な教師データが必要とされ、教師データのラベル付け(アノテーション作業)が手間になっていたり、大きなコスト負担になりつつある。

AI開発の流れ 「データ加工」の部分が識別とラベリング(メタデータ付け)を行う「アノテーション」作業 総務省の資料によると全体の約63%がアノテーションに費やされているという調査結果もある

また、外部業者にアノテーション作業を依頼する場合にも、細かい要件定義や依頼書の作成などに手間がかかるため、その依頼準備に時間や労力がかかる他、依頼しても納品日まで品質をチェックできず、期待通りの精度のデータが納品されないケースがあるなどの問題も指摘されている。




スキルレベルの高いスタッフがアノテーション作業を代行

「TASUKI Annotation」は、開発現場におけるこれらの課題解決を目的として、ソフトバンクの社員のエンジニアが発案したサービスで、AIの開発に不可欠な教師データを、高い品質でスピーディーに作成することをめざす。

人手によるアノテーションの場合には、スキルレベルの高いスタッフが精度の高い画像分類やラベル付けを行い、AIが認識精度高く学習できるデータを提供する。

精度の低いアノテーション作業(左)と高精度の例(右)。作業スタッフのスキルによってAIの学習に違いがでてくる。「TASUKI Annotation」は右の高精度の作業を提供する



AIによる自動化で時間やコストを削減

膨大な教師データの作成作業では、第一段階ではAIを使って画像の識別を自動化。正確に識別したかどうかをスキルレベルの高いスタッフが検証する。これにより、より短時間で、データの品質チェックと顧客のフォローアップが可能になり、高い品質のアノテーションを実現する。

一次はAIが識別し、スタッフが正しく調整して精度を高める。その結果はAIにフィードバックし、AIの精度を向上させていく(アクティブラーニング)。AIの精度が上がれば格段に作業時間の短縮が期待できる

ソフトバンク内で、画面内のすべての自動車の選択作業を人手とAIで比較した場合、人手では110秒、AIでは2秒で識別を完了する



クライアントとの確認事項はチャットなどでスピーディに

アノテーション作業中に発生した疑問や識別対象の判断等は、専用のチャットでクライアントと迅速なコミュニケーションを実施し、作業を円滑に進める。

作業者とクライアントのコミュニケーションをはかれるチャット。作業中の質問や確認、判断などを迅速に相談、摺り合わせできる。

ウェブサイトでは質問に回答していくだけで発注が完了する機能や、チャットでクライアントと熟練スタッフが直接やりとりできるように配慮する。

経過確認やチェック、検品や納品チェックなども、クライアントと作業者ともにオンラインで迅速に行うことができる

■【TASUKI】サービス紹介




「TASUKI Annotation」の特長

1.AIによる自動化とスタッフのサポートにより、高品質かつスピーディーな教師データ作成の代行を実現
データの作成作業をAIで自動化することで、教師データをスピーディーかつ均一的な品質で作成。また、豊富な経験を持つスタッフがデータのチェックや顧客のフォローアップを行うため、高品質なデータの提供が可能。

2.ウェブサイトで質問に答えるだけで、簡単に発注が完了
ウェブサイトに表示される質問に回答するだけで、簡単に発注手続きが完結。顧客の回答内容に基づき、独自のデータ作成マニュアルが自動生成されるため、顧客が依頼書を作成する際の負担を軽減。

3.チャット機能により、要件確認や方針変更にもスピーディーかつ柔軟に対応
チャット機能を使い、顧客とTASUKIのスタッフが、リアルタイムで直接コミュニケーションすることが可能。チャット上で作業中のデータをひも付けられるため、実際のデータを見ながら要件や品質の確認、急な方針変更などにも対応。要件が複雑なデータ作成作業や、アジャイル型の開発にも柔軟に対応することが可能。

4.すぐに活用できる汎用的な教師データセットを販売
さまざまなAIサービスで活用できる、汎用的な教師データセットを販売。顧客独自の教師データに加えて、汎用性の高い既存のデータも活用することで、AIの開発期間を短縮でき、より効率的にAIの開発を支援。


同社は「「TASUKI Annotation」は、すでにソフトバンクやソフトバンクのグループ会社で、複数のAIの開発プロジェクトにおいて活用されており、開発期間の短縮やAIの精度向上に貢献している。今後は、AIを活用した新しい機能の実装や、さまざまなパートナー企業とのデータ連携などを検討して、さらなるサービスの拡充を図り、お客さまのAIの開発に貢献していく」と語っている。

ABOUT THE AUTHOR / 

神崎 洋治

神崎洋治(こうざきようじ) TRISEC International,Inc.代表 「Pepperの衝撃! パーソナルロボットが変える社会とビジネス」(日経BP社)や「人工知能がよ~くわかる本」(秀和システム)の著者。 デジタルカメラ、ロボット、AI、インターネット、セキュリティなどに詳しいテクニカルライター兼コンサルタント。教員免許所有。PC周辺機器メーカーで商品企画、広告、販促、イベント等の責任者を担当。インターネット黎明期に独立してシリコンバレーに渡米。アスキー特派員として海外のベンチャー企業や新製品、各種イベントを取材。日経パソコンや日経ベストPC、月刊アスキー等で連載を執筆したほか、新聞等にも数多く寄稿。IT関連の著書多数(アマゾンの著者ページ)。

PR

連載・コラム