2014/04/22

2014/04/22 渡邊

Rational regulation of learning dynamics by pupil-linked arousal systems
Nassar MR, Rumsey KM, Wilson RC, Parikh K, Heasly B, Gold JI.
Nat Neurosci. 2012 Jun 3;15(7):1040-6. doi: 10.1038/nn.3130.

瞳孔の変化で意思決定やValue、Optimal actionの探索などいろいろなものを見ることができることが近年多く報告されておりますが、この論文では不確実な環境(真のValueが不明確なだけでなく、そのValueが時間とともに変化する環境)における行動選択のパラメータと瞳孔拡散の関係の話です。
我々は不確実な環境で学習率を意識的に変化させるが(時には過去の経験を参考にし、時にはValueが大幅に変わったと思いその経験を無視する)、そのシフトを瞳孔サイズの変化としてとらえることができるという内容です。

PDF | SLIDE

No comments: