基于强化学习的机器人避障算法研究与实现任务书-任务书网

全文总字数：1408字

1. 毕业设计（论文）主要内容：

强化学习是机器学习的一个分支，其中学习是通过与环境交互而进行的。这是一种目标导向的学习，学习者并未被告知应采取何种行为，相反学习者是从其行为后果中进行学习的。强化学习是智能体（Agent）以“试错”的方式进行学习，通过与环境进行交互获得的奖赏指导行为，目标是使智能体获得最大的奖赏。随着各种算法的提出，该方法发展迅速，现已是人工智能（AI）方面最活跃的研究领域之一。

本论文提出的问题是基于OpenAi Gym平台的机器人动态环境下避障。首先要在开发环境下搭建自己的模型，然后选择有模型的策略迭代和值迭代算法、无模型的蒙特卡罗算法或者其他算法进行相关的设计。最后，在仿真平台上进行相应的模拟测试。

论文以强化学习算法为基础，在智能体不断的与动态环境进行交互的过程中，选择最优决策，从而达到机器人躲避障碍物的目的。

剩余内容已隐藏，您需要先支付后才能查看该篇文章全部内容！

2. 毕业设计（论文）主要任务及要求

（1）查阅相关文献资料15篇以上（其中近5年外文文献不少于3篇）。

（2）完成开题报告及任务书。

（3）基于OpenAi Gym平台，实现基于强化学习算法的机器人动态环境下避障推荐算法，给出问题求解结果。

剩余内容已隐藏，您需要先支付后才能查看该篇文章全部内容！

3. 毕业设计（论文）完成任务的计划与安排

第1周—第3周搜集资料，撰写开题报告；

第4周—第5周论文开题；

第6周—第12周撰写论文初稿；

剩余内容已隐藏，您需要先支付后才能查看该篇文章全部内容！

4. 主要参考文献

[1] Chernikova, Alesia. Are self-drivingcars secure? Evasion attacks against deep neural networks for steering angleprediction[C]. 2019 IEEE Symposium on Security and Privacy Workshops. 2019.132-137

[2] Smolyakov, M.V. Self-Driving CarSteering Angle Prediction Based on Deep Neural Network An Example of CarNDUdacity Simulator[C]. IEEE 12th International Conference on Application ofInformation and Communication Technologies. 2018.

[3] Sutton, Richard S. ReinforcementLearning: An Introduction second edition[M]. MIT Press. 2018

剩余内容已隐藏，您需要先支付 10元 才能查看该篇文章全部内容！立即支付

免费ai写开题、写任务书：免费Ai开题 | 免费Ai任务书 | 免费降AI率 | 免费降重复率 | 论文免费排版

注册

找回密码

基于强化学习的机器人避障算法研究与实现任务书

1. 毕业设计（论文）主要内容：

2. 毕业设计（论文）主要任务及要求

3. 毕业设计（论文）完成任务的计划与安排

4. 主要参考文献

您可能感兴趣的文章

登录

注册

找回密码

1. 毕业设计（论文）主要内容：

2. 毕业设计（论文）主要任务及要求

3. 毕业设计（论文）完成任务的计划与安排

4. 主要参考文献

您可能感兴趣的文章