Spark与MapReduce2.0在异构环境下的性能对比与分析研究任务书

 2021-11-10 22:11:22

1. 毕业设计(论文)主要目标:

分辨出Spark与MapReduce2.0两者在不同环境下的性能优劣,总结Spark与MapReduce2.0在异构环境下的性能对比与分析。

2. 毕业设计(论文)主要内容:

Spark是基于内存计算的大数据并行计算框架。Spark基于内存计算,提高了在大数据环境下数据处理的实时性,同时保证了高容错性和高可伸缩性。MapReduce作为经典的分布式大数据处理框架,所以Spark与MapReduce2.0在异构环境下的性能对比与分析有其必要性。本课题的主要研究包括:

1)Hadoop环境的搭建;

2)Spark环境的搭建;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 主要参考文献

[1] D. Hall. A scalable language, and a scalable framework. http://www.scala-blogs.org/2008/09/scalable-language-and- scalable.html.

[2] Rajendra Bose , James Frew, Lineage retrieval for scientific data processing: a survey, ACM Computing Surveys (CSUR), v.37 n.1, p.1-28, March 2005 [doi10.1145/1057977.1057978].

[3] C. T. Chu, S. K. Kim, Y. A. Lin, Y. Yu, G. R. Bradski, A. Y. Ng, and K. Olukotun. Map-reduce for machine learning on multicore. In NIPS 06, pages 281-288. MIT Press, 2006.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版