実施報告

「長崎大学経済学会・2019年度第6回ファカルティセミナー合同研究会」を開催しました。


2020年3月5日17時より、経済学部ファカルティセミナールームにおいて流通経済大学の府内直樹先生を講師にお迎えして“Reinforcement Learning with Foregone Payoff Information in Normal Form Games” というテーマの研究会が行われました。

府内先生からは、戦略形ゲームにおいて、選択しなかった行動の利得の情報を利用した強化学習の数理的なモデルをご紹介いただきました。この研究では、(a)プレイヤーが行動を選択する確率分布が強化学習のプロセスにより収束する条件を提示し、(b)収束先の確率分布は、一般に混合戦略ナッシュ均衡の確率分布と一致しないが、正則質的応答均衡の確率分布に一致するという結果を示しました。

参加者から活発な質問が相次ぎ、とても有意義な議論が展開されました。


▲ページ上部へ

講演会・研究会のページへ