1. 毕业设计(论文)主要内容:
1. 前期知识储备
首先,对Hadoop分布式并行计算框架进行充分了解;其次,需深入学习并掌握有关MapReduce分布式编程技术以及频繁模式发现算法的相关知识,需要掌握Java编程语言。
2. 课题背景
2. 毕业设计(论文)主要任务及要求
1. 查阅15篇相关文献(含近五年外文3篇),并每篇书写200—300字文献摘要(装订成册,带封面);
2. 认真填写周记,完成800字开题报告;
3. 完成5000中文字以上的相关英文专业文献翻译,并装订成册(中英文一起,带封面);
3. 毕业设计(论文)完成任务的计划与安排
1. 2016/1/11—2016/1/22:查阅参考文献,明确选题;
2. 2016/1/23—2016/3/7:进一步阅读文献,并分析和总结;确定技术路线,完成并提交开题报告;
3. 2016/3/8—2016/4/26:需求分析,算法或系统设计,分析、比较或实现等;
4. 主要参考文献
[1] Anand Rajaraman,Jeffrey David Ullman著.王斌译.大数据-互联网大规模数据挖据与分布式处理[M].北京:人民邮电出版社,2013
[2] Geol Neha,Jha CK.Preprocessing web logs:A critical phase in web usage minibg[C].2015 International Conference on Advances in Computer Engineering and Applications,ICACEA 2015.2015:672-676
[3] Cumathi C P,Padmaja Valli R,Santhanam T. An overview of preprocessing of Web log files for Web usage mining[J].Journal of Theoretical and Applied Information Technology.2011,34(2):178-185
