基于强化学习的智能博弈系统的设计与实现任务书

 2021-10-20 07:10

1. 毕业设计(论文)的内容和要求

2016年,随着AlphaGo以四胜一负的成绩击败围棋世界冠军李世石,强化学习,特别是深度强化学习方法,在世界范围内引起了巨大的轰动。

强化学习通过端对端的学习方式,实现从原始输入到输出的直接控制,广泛应用于处理高维度原始输入数据,并进行控制决策的任务中。

本课题拟利用Python语言,基于pytorch开发出一个具备初步实用价值的智能博弈系统。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 参考文献

[1] Sutton R S, Barto A G. Reinforcement learning: An introduction[M]. MIT press, 2018.[2] 唐振韬,邵坤,赵冬斌等.深度强化学习进展:从AlphaGo到AlphaGo Zero[J].控制理论与应用,2017,34(12):1529-1546. [3] 刘全,翟建伟,章宗长等.深度强化学习综述[J].计算机学报,2018,41(01):1-27.[4] 申翔翔. 深度强化学习在实时策略游戏中的应用研究[D].北京交通大学,2019.[5] Mnih V, Kavukcuoglu K, Silver D, et al. Playing atari with deep reinforcement learning[J]. arXiv preprint arXiv:1312.5602, 2013.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。