1. 毕业设计(论文)主要目标:
本论文的目标是能够详尽的叙述毕业设计的具体设计方案,学习和掌握主题爬虫的基本原理和实现流程,分析比较各种主题爬行算法的优劣程度。
1)将本体语义网和wang-landau方法加入到主题爬虫设计中
2)用java实现基于本体和wang-landau方法的爬虫系统和算法
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
2. 毕业设计(论文)主要内容:
主题爬虫关键问题就是尽可能多的爬取与主题相关度高的页面。本论文的主要内容是:1)融入智能爬行算法wang-landau抽样方法作为爬行策略,以尽可能多的获取相关页面; 2)在爬虫设计当中引入本体语义网,从概念语义层面比较和判断相关页面,给予主题向量权重计算; 3)结合javaWeb中的一些知识以对系统进一步优化,还用到的技术有VSM算法等。
3. 主要参考文献
[1]刘景发, 黄娟, 蒋宇聪,等. 基于Wang-Landau抽样的带静不平衡约束的简化卫星舱布局方法[J]. 计算机科学, 2016, 43(12):287-292.
[2]马雷雷,李宏伟,连世伟,梁汝鹏,陈虎. 一种基于本体语义的灾害主题爬虫策略[J]. 计算机工程,2016,42(11):50-56
[3]Liu W J, Du Y J. A novel focused crawler based on cell-like membrane computing optimization algorithm[J]. Neurocomputing, 2014, 123:266-280.
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付
