在生命的斗争中,进化奖励那些能够掌控环境的动物,特别是当环境快速变化时。如果说有成功的秘诀的话,那就不是:当你有幸获得胜利时,尽情享受胜利的滋味。相反,它是:赢得大奖,并且经常获胜。
今天,在《当代生物学》杂志上,冷泉港实验室 (CSHL) 的 Adam Kepecs 教授领导的团队为我们对大脑如何学习的理解增加了一个重要的新维度,特别关注使用感知模糊信息进行预测的情况。
如果有雾,我们几乎看不到前面的标志,或者扩音器上的广播出现乱码怎么办?在这样的情况下,大脑如何调整为决策提供信息的预测?
Kepecs 及其同事描述了释放多巴胺的神经元(被认为可以为大脑产生关键的教学信号)在评估过去的经验如何成功地指导新决策时如何权衡感觉信息的模糊性。他们的发现表明这些神经元比之前想象的更加复杂。
“多巴胺神经元不仅仅是大脑中的任何神经元,”凯佩克斯说。 “它们是位于中脑的神经元,向大脑的大片区域发送连接。多巴胺神经元将预测结果与实际结果进行比较,并将它们之间的差异作为错误反馈发送到大脑的其他部分。这正是你会想要学习信号做的事情,我们发现多巴胺神经元所做的事情与强大的学习算法的理论上要求完全一致。”