面向国内上市企业的数据采集与处理任务书

 2022-01-12 09:01

全文总字数:1275字

1. 毕业设计(论文)主要内容:

1.引言(问题来源、现状、目标期望等);

2.关键技术(网络爬虫、知识图谱、自然语言处理);

3.算法设计;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 毕业设计(论文)主要任务及要求

1. 前期知识储备:通过阅读相关文献,了解分布式爬虫技术、数据抽取,数据整理等相关知识。2.设计功能:本设计的任务包括:1)分析目前爬虫框架和算法的优劣,对指定网站进行相关数据的爬取,提取网页或者文件中的企业信息(如相关新闻、经营状况等),设计有效的数据抽取规则。2)实现所设计的算法,并对数据进行整理、清洗。

3. 毕业设计(论文)完成任务的计划与安排

2019.12.30之前:完成毕业设计选题;

2020.02.18之前:结合选题和任务书的目标要求,完成开题报告撰写;

2020.05.10之前:完成系统的设计和实施、提交论文初稿;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 主要参考文献

[1] 王晓琴,李书琴,景旭,王蒙.基于 Nutch 的农业垂直搜索引擎研究[J].计算机工程与设计,2014,35(06):2239-2243.[2] 苏永红,张玉蓉.手机产品垂直搜索引擎的研究与实现[J].计算机科学,2014,41(S2):455-460.[3] 孟时,王彦.larbin 网络爬虫的体系结构[J].电脑学习,2010(04):80-81.[4] 党佩,阎光伟.基于 Webmagic 爬取技术的电力事故信息获取[J/OL].计算机技术与发展,2019(06):1-7[2019-04-07].http://kns.cnki.net/kcms/detail/61.1450.TP.20190306.0907.038.html.[5] 刘寿臣.网页爬虫技术的关键技术研究探索[J].电脑知识与技术,2016,12(17):16-17 20.[6] 林祖新. 视频垂直搜索引擎中信息抽取与存储系统的设计与实现[D].北京邮电大学,2013.[7] 杜明卉. 面向美食的垂直搜索引擎的设计与实现[D].吉林大学,2018.[8] 基于游记的旅游信息垂直搜索引擎的设计与实现[D].重庆大学,2016.[9] IK Analyzer 2012 发布中文分词库[J].硅谷,2012(06):73.[0] 徐光美, 刘宏哲, 张敬尊. 基于特征加权的多关系朴素贝叶斯分类模型[J]. 计算机科学,2014, 41(10): 283-285.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。