全文总字数:1408字
1. 毕业设计(论文)主要内容:
强化学习是机器学习的一个分支,其中学习是通过与环境交互而进行的。这是一种目标导向的学习,学习者并未被告知应采取何种行为,相反学习者是从其行为后果中进行学习的。强化学习是智能体(Agent)以“试错”的方式进行学习,通过与环境进行交互获得的奖赏指导行为,目标是使智能体获得最大的奖赏。随着各种算法的提出,该方法发展迅速,现已是人工智能(AI)方面最活跃的研究领域之一。
本论文提出的问题是基于OpenAi Gym平台的机器人动态环境下避障。首先要在开发环境下搭建自己的模型,然后选择有模型的策略迭代和值迭代算法、无模型的蒙特卡罗算法或者其他算法进行相关的设计。最后,在仿真平台上进行相应的模拟测试。
论文以强化学习算法为基础,在智能体不断的与动态环境进行交互的过程中,选择最优决策,从而达到机器人躲避障碍物的目的。
2. 毕业设计(论文)主要任务及要求
(1)查阅相关文献资料15篇以上(其中近5年外文文献不少于3篇)。
(2)完成开题报告及任务书。
(3)基于OpenAi Gym平台,实现基于强化学习算法的机器人动态环境下避障推荐算法,给出问题求解结果。
3. 毕业设计(论文)完成任务的计划与安排
第1周—第3周搜集资料,撰写开题报告;
第4周—第5周论文开题;
第6周—第12周撰写论文初稿;
4. 主要参考文献
[1] Chernikova, Alesia. Are self-drivingcars secure? Evasion attacks against deep neural networks for steering angleprediction[C]. 2019 IEEE Symposium on Security and Privacy Workshops. 2019.132-137
[2] Smolyakov, M.V. Self-Driving CarSteering Angle Prediction Based on Deep Neural Network An Example of CarNDUdacity Simulator[C]. IEEE 12th International Conference on Application ofInformation and Communication Technologies. 2018.
[3] Sutton, Richard S. ReinforcementLearning: An Introduction second edition[M]. MIT Press. 2018
