基于Hadoop的海量文本处理系统的设计与实现任务书

 2021-08-21 10:08

1. 毕业设计(论文)主要内容:

Hadoop是一个由Apache基金会所开发的分布式系统基础架构。

随着海量文本信息的出现,其所蕴藏的潜在价值越来越受到关注。

海量数据的处理成为了行业发展亟待解决的问题。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 毕业设计(论文)主要任务及要求

(1)研究MapReduce编程模型;

(2)研究基于Hadoop的高效实现分布式计算方法;

(3)实现基于Hadoop的海量文本处理系统的基本功能,进行系统性能测试;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 毕业设计(论文)完成任务的计划与安排

(1)第1-3周:查阅相关文献资料,明确研究内容,学习毕业设计研究内容所需理论的基础。确定毕业设计方案,完成开题报告。

(2)第4-5周:掌握Java开发环境和使用方法,了解MapReduce的相关理论知识。

(3)第6-9周:学习Hadoop框架的使用和研究分布式算法,完成整个系统的前期设计工作。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 主要参考文献

[1]Shvachko K, Kuang H, Radia S, et al. The Hadoop Distributed File System[C]// IEEE, Symposium on MASS Storage Systems and Technologies. IEEE Computer Society, 2010:1-10.

[2]Thusoo A, Sarma J S, Jain N, et al. Hive -a petabyte scale data warehouse using hadoop[J]. Inproc Icde, 2010, 41(3):996-1005.

[3]Vavilapalli V K, Murthy A C, Douglas C, et al. Apache Hadoop YARN: yet another resource negotiator[C]// Symposium on Cloud Computing. ACM, 2013:1-16.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。