最近は、マルチエージェントを扱う分野に興味があります.
複数のエージェントが共通/独自の報酬最大化を目指し、互いに協力行動を学習することを目指したり、その協調的な振る舞いを観察したりする分野.他者の学習により環境が変化する「非定常性」を克服するため、集中学習・分散実行(CTDE)や価値分解といった手法が用いられる.一方で、社会的ジレンマのシミュレーションの土台として分散学習・分散実行な手法が取られることも.
タスク解決の手段として、エージェント間で独自の言語(プロトコル)を自発的に形成させる研究分野.事前に定義された意味を持たない信号に対し、環境との相互作用を通じて「どのような情報を送るべきか」という意味論を創発させる.
多数のエージェントが互いに衝突することなく、目的地へ到達する最適経路を計画する問題のこと.物流倉庫の搬送ロボット群制御などで重要視され、探索アルゴリズム(CBS,LaCam等)で解く手法と機械学習ベースで解を推論する手法が共存している.速度に関しては探索手法が圧倒的であるが、学習ベースな手法も近年急成長している.そして最近ハイブリッド型が出た.
ゲームをテストベッドとして汎用知能の実現を目指す研究や、プレイヤー体験を向上させるAIを扱う分野.私の関心は後者.深層強化学習による複雑な戦略の獲得や、適切なナビゲーションアルゴリズムの開発なども該当する.最近はLLMを組み込むことも研究されているらしい?
機械学習するときに使う言語.
最近、勉強せざるを得なくなった言語
主にここで勉強してる.