基于Spark平台的数据挖掘并行化方法任务书

 2021-08-20 12:08

1. 毕业设计(论文)主要目标:

设计并实现基于spark平台的数据挖掘并行化方法,并对比分析Spark平台应用中准确性、吞吐量、处理速度等指标,验证基于Spark的数据挖掘算法的执行效率和并行化效果。

2. 毕业设计(论文)主要内容:

本文围绕大数据平台Spark和数据挖掘两个概念:

(1)对Spark平台做出详细的分析,同时对数据挖掘算法进行了分析和总结;

(2)基于Spark作为引擎核心和编程模型,设计并实现部分并行化数据挖掘算法;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 主要参考文献

[1]DeanJ,Ghemawat S.Map Reduce:Simplified DataProcessingon LargeClusters[J]. Communicationsof the ACM, 2008, 51 (1): 107-113.

[2]Gupta S, Dutt N, Gupta R, et al. SPARK: A HighLevel Synthesis Framework for Applying ParallelizingCompiler Transformations[C].NewDelhi: Proceedings16thInternational Conference on VLSI Design,2003: 461-466.

[3]Lhotak O,HendrenL. ScalingJavaPoints ToAnalysisUsing Spark[M].Compiler Construction.Berlin: Springer, 2003: 153-169.

剩余内容已隐藏,您需要先支付 5元 才能查看该篇文章全部内容!立即支付

以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。