热点新闻跟踪与抓取系统设计任务书

 2021-08-19 23:47:53

1. 毕业设计(论文)主要目标:

实现一个数据自动采集系统。

该系统能从新闻网站提取热点新闻主题,并自动跟踪和抓取该主题的后续报道与评论,用于舆情分析。

2. 毕业设计(论文)主要内容:

学习相关爬虫技术,选定一个新闻网站,设计一个系统,从新闻网站提取热点新闻主题,并自动跟踪和抓取该主题的后续报道与评论,以便用于舆情分析。内容包括:

1. 研究和探索新闻页面的结构与数据提交方式;

2. 设计爬虫程序提取页面数据;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 主要参考文献

[1]潘庆芝. 特定新闻门户网站的信息获取[D].吉林大学,2015.

[2]刘林浩. 网络热点新闻事件挖掘和跟踪分析方法的研究与实现[D].中南大学,2010.

[3]廖浩伟. 基于网页结构聚类的Web信息提取技术研究[D].西南交通大学,2013.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。