搜索引擎中网络爬虫的开发研究任务书

 2021-09-06 07:09

1. 毕业设计(论文)主要内容:

网络爬虫是一个自动提取网页的程序,它为搜索引擎从万维网上下载网页,是搜索引擎的重要组成,为提高爬行效率,爬虫需要在单位时间内尽可能多的获取高质量页面,是它面临的难题之一。

研究开发高效的网络爬虫,提高爬行效率,具有重要的意义和实用价值。

1.研究学习网络爬虫技术的相关原理以及技术,设计并实现一个网络爬虫,并通过网络爬虫来获取网站上的数据,实现爬虫对网页的搜索功能, 2.设计的爬虫对网页或者数据的分析过滤,实现URL的搜索策略,并用数据库来存储所获取的数据。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 毕业设计(论文)主要任务及要求

1.查阅15篇相关文献(含近五年外文3篇),并每篇书写200—300字文献摘要(装订成册,带封面);

2.认真填写周记,依据开题报告规范撰写开题报告;

3.完成5000中文字以上的相关英文专业文献翻译,并装订成册(中英文一起,带封面);

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 毕业设计(论文)完成任务的计划与安排

(1)2017/1/14—2017/2/22:确定选题,查阅文献,外文翻译和撰写开题报告;

(2)2017/2/23—2017/4/30:系统架构、程序设计与开发、系统测试与完善;

(3)2017/5/1—2017/5/25:撰写及修改毕业论文;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 主要参考文献

[1]蒋辉等. 基于一种文档表示模型的站内搜索引擎设计与实现[J]. 南华大学学报(自然科学版) , 2013 第27卷, 第4期 P77-81

[2]郭肇毅. 基于Lucene的站内搜索引擎开发研究[J]. 河南科技, 2016第3期 P21-22

[3]何美松. 面向电子商务网站的站内搜索引擎研究与实现[D]. 西安理工大学(硕士),2014

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。