ソフトバンクは、教師データを作成するAIアノテーション代行サービス「TASUKI Annotation」(タスキアノテーション)の提供を、2022年6月から本格的に開始したことを発表した。
「TASUKI Annotation」は、ソフトバンクおよびソフトバンクのグループ会社の従業員を対象とした新規事業提案制度「ソフトバンクイノベンチャー」から生まれたサービス。AIを活用したサービスを開発する企業やAIを研究・開発する学術機関向けに、スキルの高いスタッフで構成、AIを活用、高精度、短納期、廉価なサービスを提供していくとしていく。
同社によれば「アノテーション作業するデータ量にもよるが、一般のアノテーション代行サービスと比較して、コストは数10万が数万円レベルに削減したり、2~4週間かかる作業を半分か1/3程度に短縮できると見込んでいる。少量のアノテーションデータでも違いが出ると思うが、多いほどコスト削減や納期短縮の効果は大きい」としている。
また、対象は画像だけでなく、テキスト、音声などあらゆるデータのアノテーションに対応することができる。「SNSの投稿データを収集して、感情を識別したり、内容を識別するためのアノテーション作業も承れる」と続けた。
AIシステム開発の課題となる高精度な「アノテーション」を代行
生産性の向上などを目的に、AIの導入を検討する企業が急増している。AIを自社開発に取り組んだり、AI開発を受注するシステム開発会社などが増える一方で、高精度のAIを開発するためには、膨大な教師データが必要とされ、教師データのラベル付け(アノテーション作業)が手間になっていたり、大きなコスト負担になりつつある。
また、外部業者にアノテーション作業を依頼する場合にも、細かい要件定義や依頼書の作成などに手間がかかるため、その依頼準備に時間や労力がかかる他、依頼しても納品日まで品質をチェックできず、期待通りの精度のデータが納品されないケースがあるなどの問題も指摘されている。
スキルレベルの高いスタッフがアノテーション作業を代行
「TASUKI Annotation」は、開発現場におけるこれらの課題解決を目的として、ソフトバンクの社員のエンジニアが発案したサービスで、AIの開発に不可欠な教師データを、高い品質でスピーディーに作成することをめざす。
人手によるアノテーションの場合には、スキルレベルの高いスタッフが精度の高い画像分類やラベル付けを行い、AIが認識精度高く学習できるデータを提供する。
AIによる自動化で時間やコストを削減
膨大な教師データの作成作業では、第一段階ではAIを使って画像の識別を自動化。正確に識別したかどうかをスキルレベルの高いスタッフが検証する。これにより、より短時間で、データの品質チェックと顧客のフォローアップが可能になり、高い品質のアノテーションを実現する。
クライアントとの確認事項はチャットなどでスピーディに
アノテーション作業中に発生した疑問や識別対象の判断等は、専用のチャットでクライアントと迅速なコミュニケーションを実施し、作業を円滑に進める。
ウェブサイトでは質問に回答していくだけで発注が完了する機能や、チャットでクライアントと熟練スタッフが直接やりとりできるように配慮する。
■【TASUKI】サービス紹介
「TASUKI Annotation」の特長
1.AIによる自動化とスタッフのサポートにより、高品質かつスピーディーな教師データ作成の代行を実現
データの作成作業をAIで自動化することで、教師データをスピーディーかつ均一的な品質で作成。また、豊富な経験を持つスタッフがデータのチェックや顧客のフォローアップを行うため、高品質なデータの提供が可能。
2.ウェブサイトで質問に答えるだけで、簡単に発注が完了
ウェブサイトに表示される質問に回答するだけで、簡単に発注手続きが完結。顧客の回答内容に基づき、独自のデータ作成マニュアルが自動生成されるため、顧客が依頼書を作成する際の負担を軽減。
3.チャット機能により、要件確認や方針変更にもスピーディーかつ柔軟に対応
チャット機能を使い、顧客とTASUKIのスタッフが、リアルタイムで直接コミュニケーションすることが可能。チャット上で作業中のデータをひも付けられるため、実際のデータを見ながら要件や品質の確認、急な方針変更などにも対応。要件が複雑なデータ作成作業や、アジャイル型の開発にも柔軟に対応することが可能。
4.すぐに活用できる汎用的な教師データセットを販売
さまざまなAIサービスで活用できる、汎用的な教師データセットを販売。顧客独自の教師データに加えて、汎用性の高い既存のデータも活用することで、AIの開発期間を短縮でき、より効率的にAIの開発を支援。
同社は「「TASUKI Annotation」は、すでにソフトバンクやソフトバンクのグループ会社で、複数のAIの開発プロジェクトにおいて活用されており、開発期間の短縮やAIの精度向上に貢献している。今後は、AIを活用した新しい機能の実装や、さまざまなパートナー企業とのデータ連携などを検討して、さらなるサービスの拡充を図り、お客さまのAIの開発に貢献していく」と語っている。
「TASUKI Annotation」公式サイト
ABOUT THE AUTHOR /
神崎 洋治神崎洋治(こうざきようじ) TRISEC International,Inc.代表 「Pepperの衝撃! パーソナルロボットが変える社会とビジネス」(日経BP社)や「人工知能がよ~くわかる本」(秀和システム)の著者。 デジタルカメラ、ロボット、AI、インターネット、セキュリティなどに詳しいテクニカルライター兼コンサルタント。教員免許所有。PC周辺機器メーカーで商品企画、広告、販促、イベント等の責任者を担当。インターネット黎明期に独立してシリコンバレーに渡米。アスキー特派員として海外のベンチャー企業や新製品、各種イベントを取材。日経パソコンや日経ベストPC、月刊アスキー等で連載を執筆したほか、新聞等にも数多く寄稿。IT関連の著書多数(アマゾンの著者ページ)。