Homophily が無い場合
協力エージェントがフリーライダーに利用されてしまう
A 協力 → reward
B 協力 → reward
C 非協力 → rewardしない
しかしCはrewardの恩恵だけ受ける
↓
Second-order free rider
Homophilyにより似た行動のエージェント同士が結びつく
協力グループ
AとBはreward を与え合う
非協力
C
↓
協力者同士が互いに支援する構造が生まれる
Sequential Social Dilemmas を用いて評価
代表的な2種類の社会的ジレンマ
Public Goods 型のジレンマ
環境には
が存在する
ゴミを掃除するとりんごが生えるようになる
しかし掃除自体には個人の直接報酬がないため誰かが掃除する必要がある
Tragedy of the Commons 型のジレンマ
エージェントはりんごを収穫して報酬を得る
しかし取りすぎるとりんごが再生しなくなる
↓
短期利益
→ すぐ収穫
長期利益
→ 資源を残す
Homophilyなし
Homophilyあり
この論文の主な貢献
協力が崩壊する原因として
Second-order Social Dilemmaを分析
Homophily を利用した新しいインセンティブ学習手法を提案
MARL環境において安定した協力の形成を実証