1. 毕业设计(论文)的内容和要求
2016年,随着AlphaGo以四胜一负的成绩击败围棋世界冠军李世石,强化学习,特别是深度强化学习方法,在世界范围内引起了巨大的轰动。
强化学习通过端对端的学习方式,实现从原始输入到输出的直接控制,广泛应用于处理高维度原始输入数据,并进行控制决策的任务中。
本课题拟利用Python语言,基于pytorch开发出一个具备初步实用价值的智能博弈系统。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
2. 参考文献
[1] Sutton R S, Barto A G. Reinforcement learning: An introduction[M]. MIT press, 2018.[2] 唐振韬,邵坤,赵冬斌等.深度强化学习进展:从AlphaGo到AlphaGo Zero[J].控制理论与应用,2017,34(12):1529-1546. [3] 刘全,翟建伟,章宗长等.深度强化学习综述[J].计算机学报,2018,41(01):1-27.[4] 申翔翔. 深度强化学习在实时策略游戏中的应用研究[D].北京交通大学,2019.[5] Mnih V, Kavukcuoglu K, Silver D, et al. Playing atari with deep reinforcement learning[J]. arXiv preprint arXiv:1312.5602, 2013.
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付
以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。