面向建筑领域搜索引擎

以下是资料介绍,如需要完整的请充值下载.
1.无需注册登录,支付后按照提示操作即可获取该资料.
2.资料以网页介绍的为准,下载后不会有水印.资料仅供学习参考之用.
密 惠 保
1.无需注册登录,支付后按照提示操作即可获取该资料.
2.资料以网页介绍的为准,下载后不会有水印.资料仅供学习参考之用.
密 惠 保
资料介绍:
本文选题的意义
面向web搜索引擎是相对通用搜索引擎的信息量大、查询不准确、深度不够等提出来的新的搜索引擎服务模式,通过针对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务。其特点就是“专、精、深”,且具有行业色彩,相比较通用搜索引擎的海量信息无序化,面向web搜索引擎则显得更加专注、具体和深入。搜索引擎相关技术
本章系统的回顾了搜索引擎工作原理和面向web搜索引擎的工作原理。首先从页面采集模块的工作原理、页面采集和建立索引、数据检索模块的工作原理三个方面描述了搜索引擎技术原理;然后描述了面向web搜索引擎的技术特点和信息采集技术;然后介绍了Nutch——开源搜索引擎研究。
第一章? 绪论??? 21.1搜索引擎的分类与比较??? 21.2 搜索引擎的发展??? 31.3本文选题的意义??? 5第二章 搜索引擎原理??? 52.1搜索引擎原理介绍??? 52.1.1页面爬行原理??? 62.1.2页面分析和建立索引??? 82.1.3数据检索模块的工作原理??? 92.2面向web搜索引擎原理??? 112.2.1面向web引擎的特点??? 112.2.2 面向web引擎的信息采集技术??? 112.3 开源搜索引擎—Nutch??? 112.3.1Nutch的特点??? 12第三章 基于Nutch搜索引擎设计??? 143.1 系统体系结构及算法??? 143.1.1信息抓取算法??? 143.1.2 信息预处理部分??? 153.2面向web相关性判别问题??? 163.2.1根据元数据的判定(元数据演算)??? 173.3.2根据扩展元数据的判定??? 183.3.3 基于HTML扩展元数据类型的判定算法??? 193.3.4根据页面间链接分析的判断与页面排序算法??? 213.3 中文分词技术??? 22第四章??? Luncene的基本概述??? 254.1 lucene的索引??? 254.2 lucene基本查询??? 25