1. 毕业设计(论文)主要内容:
Hadoop是一个由Apache基金会所开发的分布式系统基础架构。
随着海量文本信息的出现,其所蕴藏的潜在价值越来越受到关注。
海量数据的处理成为了行业发展亟待解决的问题。
2. 毕业设计(论文)主要任务及要求
(1)研究MapReduce编程模型;
(2)研究基于Hadoop的高效实现分布式计算方法;
(3)实现基于Hadoop的海量文本处理系统的基本功能,进行系统性能测试;
3. 毕业设计(论文)完成任务的计划与安排
(1)第1-3周:查阅相关文献资料,明确研究内容,学习毕业设计研究内容所需理论的基础。确定毕业设计方案,完成开题报告。
(2)第4-5周:掌握Java开发环境和使用方法,了解MapReduce的相关理论知识。
(3)第6-9周:学习Hadoop框架的使用和研究分布式算法,完成整个系统的前期设计工作。
4. 主要参考文献
[1]Shvachko K, Kuang H, Radia S, et al. The Hadoop Distributed File System[C]// IEEE, Symposium on MASS Storage Systems and Technologies. IEEE Computer Society, 2010:1-10.
[2]Thusoo A, Sarma J S, Jain N, et al. Hive -a petabyte scale data warehouse using hadoop[J]. Inproc Icde, 2010, 41(3):996-1005.
[3]Vavilapalli V K, Murthy A C, Douglas C, et al. Apache Hadoop YARN: yet another resource negotiator[C]// Symposium on Cloud Computing. ACM, 2013:1-16.
以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。