1. 毕业设计(论文)主要目标:
分辨出Spark与MapReduce2.0两者在不同环境下的性能优劣,总结Spark与MapReduce2.0在异构环境下的性能对比与分析。
2. 毕业设计(论文)主要内容:
Spark是基于内存计算的大数据并行计算框架。Spark基于内存计算,提高了在大数据环境下数据处理的实时性,同时保证了高容错性和高可伸缩性。MapReduce作为经典的分布式大数据处理框架,所以Spark与MapReduce2.0在异构环境下的性能对比与分析有其必要性。本课题的主要研究包括:
1)Hadoop环境的搭建;
2)Spark环境的搭建;
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
3. 主要参考文献
[1] D. Hall. A scalable language, and a scalable framework. http://www.scala-blogs.org/2008/09/scalable-language-and- scalable.html.
[2] Rajendra Bose , James Frew, Lineage retrieval for scientific data processing: a survey, ACM Computing Surveys (CSUR), v.37 n.1, p.1-28, March 2005 [doi10.1145/1057977.1057978].
[3] C. T. Chu, S. K. Kim, Y. A. Lin, Y. Yu, G. R. Bradski, A. Y. Ng, and K. Olukotun. Map-reduce for machine learning on multicore. In NIPS 06, pages 281-288. MIT Press, 2006.
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付
