NTT人間情報研究所 目先のことを過大評価する「現在バイアス」と人間を行動分析、介入して最適な成果を得る「数理モデル」を開発

NTTは、「健康」や「教育」などに関わる「ユーザ行動支援サービス」研究開発の一環として、人の性格に合わせて報酬を設定することで、成果を最大限発揮する「数理モデル」を開発したことを発表した。このモデルを用いて導出した適切な介入を適用することにより、健康や教育などに関する個人の目標達成の成功を支援することができる。この研究は、AI分野の最高峰国際会議「AAAI 2024」に採択され、特に全投稿中の1%にあたる口頭発表に選出された。



リリースの発表に先がけて、報道関係者向けに説明会を開催し、NTT人間情報研究所 共生知能研究プロジェクト 研究主任 赤木康紀氏(冒頭の写真右上)、同 特別研究員 倉島健氏(右下)が登壇した。


目標達成を阻む「目先の魅力的な要素」と「現在バイアス」

NTTは、目先の利得や損失を過大評価してしまう認知バイアス「現在バイアス」の影響が、人間行動にどのように影響を与え、目標達成までのプロセスに影響するかの研究を重ねてきた。


「現在バイアス」とは

「現在バイアス」は人間の長期的な目標達成行動を阻害する欲求のことで、わかりやすい例をあげるとダイエットの目標に対して、目の前のスウィーツが目標の障壁となることは日常的な体験として多くの人が感じている。

1年後の体重減少をめざす目標を設定する。スイーツを食べるのも我慢しようと決める

目前にスイーツを提示されると、その魅力を過大評価し、当初の目標より評価が勝り、目前のスイーツを優先してしまう

その「現在バイアス」の影響を正しく理解し、適切な介入を行うことは行動経済学及び計算機科学分野において重要なトピックとなっているという。


NTTが今回発表した「現在バイアス」下の行動を分析し、最適な介入を導出するための新たな数理モデルでは、「現在バイアス」下の人間の行動を数学的に閉形式で書き下し、計算コストの高いシミュレーションを行うことなく、人間の将来の行動を予測することが可能となるという。さらに、これを用いることで、今まで困難だった介入の最適化問題を現実的な時間で解くことができるようになる。


この数理モデルはニューラルネットワーク(AI)や機械学習を使ったものではなく、方程式のような数理モデルによって裏付けを行い、各人の性格によって目標の設定(報酬の設定)を実施することで最も効果的な行動を促すものだ。


「現在バイアス」に強い人と弱い人、それぞれに合わせて報酬を設定する例

例えば、報酬を「4週間で4,000円獲得」とした場合を考える。報酬は4週間後に4,000円をまとめて獲得する方法、2週間に2,000円ずつ報酬を獲得する方法、1週間ごとに1,000円ずつ4回に分けて獲得する方法があるとする。


目先の魅力的な障壁に弱い「現在バイアス」に強い人には目標総額の4000円を1週間ごとに区切って、1,000×4回で設定した方が成果が出やすく、目先の魅力的な障壁に強い「現在バイアス」に弱い人は、目標総額の4000円を4週間後に一括で得られる条件を与えた方が成果が出やすい、といったもの。


現在バイアスの判定を行った上で、その人に合った報酬の設定が望ましいが、それを数理モデル化できたのが今回の発表のポイントとなる。

「現在バイアス」に弱い人の場合、報酬額を大きく設定(5,000円)したとしても失敗する可能性が高い。であれば、4回に分けて4,000円を設定した方が効率的であり、確実であり、低い報酬で目標が達成できる可能性も生まれる。


現在バイアスの影響下の人間行動のための新しい数理モデル

人間は目先の利得・損失を過大評価してしまう「現在バイアス」と呼ばれる認知バイアスを持っている。現在バイアスは人間の長期的な目標達成行動を阻害することが知られているため、その影響を正しく理解し適切な介入を行うことは行動経済学及び計算機科学分野において重要なトピックとなっている。


NTTは、人間の現在バイアス下の行動を分析するための新たな数理モデルを開発。このモデルでは、現在バイアス下の人間の行動を数学的に閉形式で書き下すことが可能であり、計算コストの大きいシミュレーションを行うことなく人間の将来の行動を予測することが可能というメリットがある。

現在バイアス下の人間の行動の分析や介入の最適化を容易に行うことができる、閉形式での数理モデル


介入の最適化問題を現実的な時間で解くことが可能に

さらに、同社はこのモデルを用いることで、今まで困難だった介入の最適化問題を現実的な時間で解くことができることを示した。最適な介入の例として、現在バイアスが弱い人には報酬をまとめて一度に設定することで最適な成果に繋がる。逆に現在バイアスが強い人には報酬を分割して高頻度に設定することが最適であることを数学的に示した。

現在バイアスが 弱い ときと、 強い ときの実際の挙動の違い

この結果は、現在バイアスが強い人の行動は目先の損得に左右されやすいため、中間的な報酬という目先のゴールを常に意識させることで効果的であることを意味していると解釈できる。


導出された最適な介入を現実世界における健康や教育などにまつわる個人の目標達成行動に対して適用することで、目標の達成率を大きく改善することができる可能性がある。


なお、この技術をどのように商品やサービスに反映したり、実用化に向けて進めていくかはまだ決まっていない。

ABOUT THE AUTHOR / 

神崎 洋治

神崎洋治(こうざきようじ) TRISEC International,Inc.代表 「Pepperの衝撃! パーソナルロボットが変える社会とビジネス」(日経BP社)や「人工知能がよ~くわかる本」(秀和システム)の著者。 デジタルカメラ、ロボット、AI、インターネット、セキュリティなどに詳しいテクニカルライター兼コンサルタント。教員免許所有。PC周辺機器メーカーで商品企画、広告、販促、イベント等の責任者を担当。インターネット黎明期に独立してシリコンバレーに渡米。アスキー特派員として海外のベンチャー企業や新製品、各種イベントを取材。日経パソコンや日経ベストPC、月刊アスキー等で連載を執筆したほか、新聞等にも数多く寄稿。IT関連の著書多数(アマゾンの著者ページ)。

PR

連載・コラム