基于强化学习的足球任意球策略研究任务书

 2022-01-13 21:19:04

全文总字数:1279字

1. 毕业设计(论文)主要内容:

在足球比赛中,选择合适的任意球策略可提升球队的获胜可能。

在本研究中,对足球任意球系统进行建模,并编写该模拟环境,使用基于强化学习的算法进行训练,获得最佳得分策略。

2. 毕业设计(论文)主要任务及要求

主要任务:

1. 对足球任意球环境进行建模,并编写可视化模拟环境

2. 编写基于强化学习的算法,并进行训练

3. 将基于强化学习的任意球算法与其他算法进行性能比较

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 毕业设计(论文)完成任务的计划与安排

2020年1月11日-2020年1月31日:阅读相关文献,主要是关于强化学习的文献。

2020年2月1日-2020年2月28日:学习强化学习相关算法

2020年3月1日-2020年3月31日:完成游戏环境建模及可视化模拟环境搭建

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 主要参考文献

[1] Sutton R S, Barto A G. Introduction to reinforcement learning[M]. Cambridge: MIT press, 1998.[2] Mnih V, Kavukcuoglu K, Silver D, et al. Human-level control through deep reinforcement learning[J]. Nature, 2015, 518(7540): 529.[3] Stone P, Sutton R S, Kuhlmann G. Reinforcement learning for robocup soccer keepaway[J]. Adaptive Behavior, 2005, 13(3): 165-188.[4] Kitano H, Asada M, Kuniyoshi Y, et al. RoboCup: A challenge problem for AI[J]. AI magazine, 1997, 18(1): 73-73.[5] Hausknecht M, Stone P. Deep reinforcement learning in parameterized action space[J]. arXiv preprint arXiv:1511.04143, 2015.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版