1. 毕业设计(论文)的内容和要求
本课题要求实现基于强化学习的人工智能五子棋算法。
本课题要求在详细调研用户需求的基础上,开发出系统功能接近于实用的软件平台,尽量做到界面友好,功能齐备,数据真实。
有余力的基础上可以尝试实现一些较为复杂的功能。
2. 参考文献
[1] 李承奥. 基于机器强化学习与蒙特卡洛树的基本原理及其应用[J]. 通讯世界, 2019, 26(2):212-213.[2] 季辉, 丁泽军. 双人博弈问题中的蒙特卡洛树搜索算法的改进[J]. 计算机科学, 2018, 45(1):140-143.[3] 费宁, 张浩然. TensorFlow架构与实现机制的研究[J]. 计算机技术与发展, 2019, 29(9):31-34.[4] 赵星宇, 丁世飞. 深度强化学习研究综述[J]. 计算机科学, 2018, 45(7):1-6.[5] 姜姝姝. 游戏力:人机对弈五十年小史[J]. 机器人产业, 2017, (3):61-65.[6] 赵诣. 大数据下的机器学习算法综述以AlphaGO为例[J]. 信息记录材料, 2019, 20(1):10-12.[7] 冀俊忠, 张旗. 基于影响函数的卷积神经网络围棋棋步预测方法[J]. 北京工业大学学报, 2019, 45(1):54-60.[8] 王欣, 王芳. 基于强化学习的动态定价策略研究综述[J]. 计算机应用与软件, 2019, 36(12):1-6,18.[9]安徽大学. 一种基于强化学习的爱恩斯坦棋博弈算法: CN201910375250.6[P]. 2019-08-13.[10] 董慧颖, 王杨. 多种搜索算法的五子棋博弈算法研究[J]. 沈阳理工大学学报, 2017, 36(2):39-43,83.[11] 宫瑞敏, 吕艳辉. TD-BP强化学习算法在五子棋博弈系统中的应用[J]. 沈阳理工大学学报, 2010, 29(4):30-32,37.[12] 周捷, 朱建文. 机器学习分类问题及算法研究[J]. 软件, 2019, 40(7):205-208.[13] Sylvain Gelly, Csaba Szepesvari, Levente Kocsis, et al. The Grand Challenge of Computer Go: Monte Carlo Tree Search and Extensions[J]. Communications of the ACM, 2012,55(3):106-113.[14] Silver, David, Schrittwieser, Julian, Simonyan, Karen, et al. Mastering the game of Go without human knowledge[J]. Nature, 2017, 550(Oct.19 TN.7676):354-359.[15] Antonoglou, Ioannis, Lanctot, Marc, Simonyan, Karen, et al. A general reinforcement learning algorithm that masters chess, shogi, and Go through self-play[J]. Science, 2018, 362(Dec.7 TN.6419):1140-1144.
