基于爬虫技术的网站页面变动检测与分析任务书

 2022-01-12 09:01

全文总字数:1252字

1. 毕业设计(论文)主要内容:

1.引言(问题来源、现状、目标期望等);

2.关键技术(爬虫基础、网站框架);

3.算法设计;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 毕业设计(论文)主要任务及要求

1.查阅相关的国内外资料,对国内外的研究现状加以分析;

2.根据论文的研究方向,查阅相应的文献资料。学习爬虫相关知识与概念、网站框架信息的表示,学习自然语言处理的常用算法,如自动文本摘要、关键词提取等。

3.功能基本需求:定时爬取网站数据,通过对比先后爬取到的网站索引数据,捕获网页的变更信息及网页的特征信息。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 毕业设计(论文)完成任务的计划与安排

1、本学期结束前完成论文选题(任务书)2、第五周3月20日前:学生完成开题报告。

3、第五周至第十四周5月25日前:学生至少上传三次阶段性报告。

4、第十五周5月30日前完成:学生上传论文终稿和最终成。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 主要参考文献

1)Eric Matthes, Python编程 从入门到实践,北京:人民邮电出版社,2016.

2)Feng M , Xiang B , Glass M R , et al. Applying Deep Learning to Answer Selection: A Study and An Open Task[J]. 2015.

3)胡芳槐. 基于多种数据源的中文知识图谱构建方法研究[D].华东理工大学,2015.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。