DQN NBT

2017-03-09 17:45:12 0 举报
仅支持查看
DQN NBT(Deep Q-Network with Neural Basis Trajectories)是一种深度强化学习算法,它结合了深度Q网络(DQN)和神经基轨迹(NBT)的优势。DQN通过学习一个动作值函数来优化智能体在环境中的决策,而NBT则通过学习一个表示状态和动作之间关系的基轨迹来提高DQN的性能。在DQN NBT中,智能体首先使用DQN学习一个动作值函数,然后使用NBT对该函数进行优化,从而提高智能体在复杂环境中的表现。这种结合了两种强大技术的方法已经在许多任务中取得了显著的成功,表明DQN NBT是一种有效的深度强化学习方法。
作者其他创作
大纲/内容
评论
0 条评论
下一页