7月 | 2018 | InTheWorld

Post Views: 3,502

之前的一次机器学习会议中，LeCun表示强化学习或者弱监督学习会是机器学习最重要的发展方向。相比于强监督学习，强化学习更符合人类的学习过程。AlphaGo已经向人类展示出了强化学习的强大，之前看OpenAI机器人和职业玩家solo Dota2游戏，AI的游戏水平强大到令人吃惊。

Q-learning是一种比较常见的强化学习方法，其实现方式是通过一个表（Q-Table）存放状态S和行动A的reward。然而，Q-Table是有缺陷的，对于状态空间巨大的问题就显得无能为力了。为了解决这类问题，有人提出了使用深度神经网络来实现Q函数，这种方法就是deep QNetwork。使用DNN来表示Q函数与使用Q-Table还是有一些区别的，Q-Table实现了S, A =》reword的映射。而DQN中的深度神经网络实现的其实是S => [A]的映射，这里[A]就是�… 【查看更多】

强化学习之DQN笔记

近期文章

最新评论

归档

分类

Follow Me

功能

强化学习之DQN笔记

近期文章

最新评论

归档

标签

分类

Follow Me

功能