呆板之心报道
编辑:蛋酱
课程视频时间有点长,但盼望你能享受进修的欢乐。
将传统强化进修与深度神经网络联合的深度强化进修,一向以来被视为更靠近人类头脑方法的人工智能要领。深度进修具备强感知本领但缺乏必然的决议计划本领,强化进修具备决议计划本领但对感知题目一筹莫展,是以将两者联合起来可以到达上风互补的成效,为庞大体系的感知决议计划题目提供相识决思绪。
想要入门深度强化进修的同砚们,请高度细致,一份优异、过细、全面的新课本显现了。
今日,UC 伯克利传授 Pieter Abbeel 上传了本身的新课程《深度强化进修底子》的最终一节视频,并在推特上安利了一下。
这份课程重要先容了马尔科夫决议计划历程(MDP)底子、值迭代 & 计谋迭代、最大熵模子(Maxent)、Deep Q-Learning(DQN)、计谋梯度、TRPO、PPO、DDPG、SAC、基于模子的强化进修等内容。
该系列课程统共分为六讲,现在已经全部在 Youtube 上公布,并且每一讲的课件都提供免费下载。
视频地点:http://youtube.com/playlist?list=PLwRJQ4m4UJjNymuBM9RdmB3Z9N5-0IlY0
Pieter Abbeel 格外夸大了:「这大概会是一个新颖未知的范畴,并且课程视频时间很长,但盼望你能享受此中。」这再次提示急忙下载课件的同砚们,只管即便不要让这些知识一向躺在收藏夹吃灰。
Pieter Abbeel 传授是伯克利呆板人进修试验室的主任和伯克利人工智能 (BAIR) 试验室的团结主任,该试验室深度强化进修、深度仿照进修、深度无监视进修、迁徙进修、元进修和的前沿,以及人工智能研究的社会影响等。
此前,Abbeel 的 Intro to AI 课程在 edX 上吸引了 10 万多论理学生进修,他的深度强化进修和深度无监视进修课本是 AI 研究者的经典进修资料,包罗 CS294-158(Deep Unsupervised Learning)、CS188(Introduction to Artificial Intelligence)、CS287(Advanced Robotics)等。