基于强化学习的吃豆人游戏AI的设计与实现任务书

 2021-08-20 01:08

1. 毕业设计(论文)主要目标:

随着人工智能的日渐流行,掌握人工智能相关新技术对于大学生来说是必要的。

通过毕业设计,巩固所学的相关知识,提高分析问题解决问题以及在编程中调试bug的能力。

掌握python编程语言,机器学习中强化学习相关算法,AI路径搜索算法。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 毕业设计(论文)主要内容:

设计吃豆人游戏的运行环境,豆子代表回报(获取正的奖励),鬼和墙壁代表惩罚(获得负的奖励),基于强化学习中Q-learning算法对吃豆人进行训练并不断更新参数,通过在当前状态下选择一个可获得回报最大的行动来更新下一个状态。最终实现让吃豆人自主学习执行一条路径在避免撞到墙壁和鬼的情况下吃掉尽可能多的豆子获取高分。

3. 主要参考文献

[1] Kaelbling, L.P., M.L.Littman, andA.W.Moore.(1996). “Reinforcement learning: A survey.” Journal of AritificialIntelligence Research.

[2] Watkins, C.J.C.H. and P.Dayan.(1992). “Q-learning.”Machine Learning.

[3] Sutton, R.S. and A.C.Barto.(1998).Reinforcement Learning : An Introduction. MIT Press, Cambridge, MA.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。