1. 毕业设计(论文)主要目标:
实现一个数据自动采集系统。
该系统能从新闻网站提取热点新闻主题,并自动跟踪和抓取该主题的后续报道与评论,用于舆情分析。
2. 毕业设计(论文)主要内容:
学习相关爬虫技术,选定一个新闻网站,设计一个系统,从新闻网站提取热点新闻主题,并自动跟踪和抓取该主题的后续报道与评论,以便用于舆情分析。内容包括:
1. 研究和探索新闻页面的结构与数据提交方式;
2. 设计爬虫程序提取页面数据;
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
3. 主要参考文献
[1]潘庆芝. 特定新闻门户网站的信息获取[D].吉林大学,2015.
[2]刘林浩. 网络热点新闻事件挖掘和跟踪分析方法的研究与实现[D].中南大学,2010.
[3]廖浩伟. 基于网页结构聚类的Web信息提取技术研究[D].西南交通大学,2013.
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付
以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。