1. 毕业设计(论文)主要目标:
在APP下载平台“安卓市场”上找到十款不同类型的APP,收集其下载量、评分(评分、好评数、差评数)、价格等30天的时序数据,并将同类的10款新的APP的相应数据作为基准,仅使用新款手机APP前20天的数据(同样收集30天的相应数据),然后将其作为数据集,利用数据挖掘的相关技术,例如利用SVM、朴素贝叶斯、决策树等分类方法和ARIMA、隐马尔科夫等预测模型预测新款手机APP后十天的热度变化,与收集到的真实数据进行对比,通过训练模型,提高模型的精准度。
2. 毕业设计(论文)主要内容:
1.学习python语言,掌握scrapy框架;
2.分析手机APP的相关要素,确定收集哪些数据;
3.编写爬虫脚本,在PyCharmIDE中运行并收集APP下载平台“安卓市场”中的相关数据,保存数据集到mysql数据库中;
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
3. 主要参考文献
[1]李明江,唐颖,周力军. 数据挖掘技术及应用[J]. 中国新通信,(22):66-67 74,2012.
[2]王元卓,贾岩涛,刘大伟,靳小龙,程学旗.基于开放网络知识的信息检索与数据挖掘[J].计算机研究与发展,52(02):456-474,2015.
[3]李德仁,张良培,夏桂松.遥感大数据自动分析与数据挖掘[J].测绘学报,43(12):1211-1216,2014.
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付
