基于Web爬虫的个性化推荐系统设计与实现任务书

 2021-11-08 10:11

1. 毕业设计(论文)主要目标:

利用python语言设计和实现一个高效的网络爬虫系统。

1. 定时抓取指定网页的信息,通过准确定位,将有效信息提取入库。

2. 设计相应网站实时展示更新的数据信息,在此基础上展开对数据挖掘算法的了解与应用。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 毕业设计(论文)主要内容:

1. 明确待爬取网站及待爬取内容,制定相应的爬虫策略。

2. 利用python语言和相关爬虫技术实现对指定网页信息的有效定位和爬取。

3. 将爬取到的数据信息存储到数据库(mysql数据库),并实现去重,更新等相关操作。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 主要参考文献

[1]孙青云,王俊峰,赵宗渠,高梦超.一种基于模拟登录的微博数据采集方案[J].计算机技术与发展,2014,24(03):6-10.

[2]宋海洋,刘晓然,钱海俊.一种新的主题网络爬虫爬行策略[J].计算机应用与软件,2011,28(11):264-267 293.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。