基于强化学习的足球任意球策略研究任务书-任务书网

全文总字数：1279字

1. 毕业设计（论文）主要内容：

在足球比赛中，选择合适的任意球策略可提升球队的获胜可能。

在本研究中，对足球任意球系统进行建模，并编写该模拟环境，使用基于强化学习的算法进行训练，获得最佳得分策略。

2. 毕业设计（论文）主要任务及要求

主要任务：

1. 对足球任意球环境进行建模，并编写可视化模拟环境

2. 编写基于强化学习的算法，并进行训练

3. 将基于强化学习的任意球算法与其他算法进行性能比较

剩余内容已隐藏，您需要先支付后才能查看该篇文章全部内容！

3. 毕业设计（论文）完成任务的计划与安排

2020年1月11日-2020年1月31日：阅读相关文献，主要是关于强化学习的文献。

2020年2月1日-2020年2月28日：学习强化学习相关算法

2020年3月1日-2020年3月31日：完成游戏环境建模及可视化模拟环境搭建

剩余内容已隐藏，您需要先支付后才能查看该篇文章全部内容！

4. 主要参考文献

[1] Sutton R S, Barto A G. Introduction to reinforcement learning[M]. Cambridge: MIT press, 1998.[2] Mnih V, Kavukcuoglu K, Silver D, et al. Human-level control through deep reinforcement learning[J]. Nature, 2015, 518(7540): 529.[3] Stone P, Sutton R S, Kuhlmann G. Reinforcement learning for robocup soccer keepaway[J]. Adaptive Behavior, 2005, 13(3): 165-188.[4] Kitano H, Asada M, Kuniyoshi Y, et al. RoboCup: A challenge problem for AI[J]. AI magazine, 1997, 18(1): 73-73.[5] Hausknecht M, Stone P. Deep reinforcement learning in parameterized action space[J]. arXiv preprint arXiv:1511.04143, 2015.

剩余内容已隐藏，您需要先支付 10元 才能查看该篇文章全部内容！立即支付

免费ai写开题、写任务书：免费Ai开题 | 免费Ai任务书 | 免费降AI率 | 免费降重复率 | 论文免费排版

注册

找回密码

基于强化学习的足球任意球策略研究任务书

1. 毕业设计（论文）主要内容：

2. 毕业设计（论文）主要任务及要求

3. 毕业设计（论文）完成任务的计划与安排

4. 主要参考文献

您可能感兴趣的文章

登录

注册

找回密码

1. 毕业设计（论文）主要内容：

2. 毕业设计（论文）主要任务及要求

3. 毕业设计（论文）完成任务的计划与安排

4. 主要参考文献

您可能感兴趣的文章