时机是大脑的隐藏动力
        大脑的一个小区域,称为腹侧盖区域(VTA),在我们处理奖励的方式中起着关键作用。 它产生多巴胺,这是一种神经调节剂,可帮助根据上下文提示预测未来的奖励。 来自日内瓦大学(Unige),哈佛大学和麦吉尔大学的一支团队表明,VTA进一步发展:它不仅编码预期的奖励,而且编码预期的确切时刻。 通过机器学习算法使这一发现成为可能的发现,突出了将人工智能与神经科学相结合。 该研究发表在《杂志》中。

腹侧对接区域(VTA)在动机和大脑的奖励电路中起关键作用。 这是多巴胺的主要来源,这小簇神经元将此神经调节剂发送到其他大脑区域,以触发响应阳性刺激的作用。

“最初,VTA被认为仅仅是大脑的奖励中心。但是在1990年代,科学家发现这不是编码本身的奖励本身,而是奖励的预测。 信号 - 而不是奖励自己。

更复杂的功能

这种“加强学习”(需要最少的监督)是人类学习的核心。 这也是许多人工智能算法背后的原则,这些算法通过训练来改善性能 - 例如Alphago,Alphago是第一个在GO游戏中击败世界冠军的算法。

        在最近的一项研究,Alexandre Pouget的团队中,与哈佛大学的Naoshige Uchida和McGill的Paul Masset合作大学表明,VTA的编码比以前想象的更复杂。 这位领导这项工作的Unige研究人员解释说:“ VTA并没有预测加权的未来奖励总和,而是预测了它们的时间演变。换句话说,每个增益都是单独代表的,这是预期的确切时刻。”

“虽然我们知道VTA神经元优先于未来的奖励,而不是将来的原则,但根据手中的鸟的原则在灌木丛中值得两个 - 我们发现,不同的神经元在不同的时间尺度上这样做,其中一些重点是在几秒钟内的奖励上,其他人则关注一分钟时间内预期的奖励,而其他人则更加遥远。 这种多样性是允许编码奖励时机的原因。 这种优质的表示使学习系统具有很大的灵活性,从而使其适应了立即或延迟的奖励,具体取决于个人的目标和优先事项。”

人工智能和神经科学:两条街道

        这些发现源于神经科学和人工智能之间的富有成果的对话。 Alexandre Pouget开发了一种纯粹的数学算法,该算法结合了奖励处理的时间。 同时,哈佛大学的研究人员收集了有关奖励的动物中VTA活性的广泛神经生理数据。

“然后他们将我们的算法应用于数据,发现结果与经验完全匹配调查结果。“大脑启发了AI和机器学习技术,但这些结果表明算法也可以作为揭示我们神经生理机制的强大工具。