>搜索引擎检索系统概述

  • 时间:
  • 浏览:5
  • 来源:小阿晨资源 - 专注共享天罚娱乐资讯

故障 0x354df

10 0x123abc

号 0x13445d

(3)求交,上述求交,文档2和文档9否则是亲戚亲戚朋友 时需找的,整个求交过程实际上关系着整个系统的性能,这中间含晒 了使用缓存等等手段进行性能优化;

0x13445d 2 5 8 9 10 11……

地铁 0x145cf

线 0x234d

0x123abc 1 2 3 4 7 9…..

前面简要介绍过了搜索引擎的索引系统,实际上在建立倒排索引的最后还时需1个多 入库写库的过程,而为了提高带宽单位这人过程还时需将删改term以及偏移量保占据 文件头部,否则对数据进行压缩,这涉及到的过于技术化在此就越来很多提了。今天简要给亲戚亲戚朋友 介绍一下索引如果的检索系统。

……

(1)Query串切词分词即将用户的查询词进行分词,对如果的查询做准备,以“10号线地铁故障”为例,否则的分词如下(同义词现象报告 暂时略过):

检索系统主要含晒 了四个次要,如下图所示:

(2)查出含每个term的文档集合,即找出待选集合,如下:

(4)各种过滤,举例否则含晒 过滤掉死链、重复数据、色情、垃圾结果以及你懂的;

……

(5)最终排序,将最能满足用户需求的结果排序在最前,否则包括的有用信息如:网站的整体评价、网页质量、内容质量、资源质量、匹配程度、分散度、时效性等等,以都不删改给亲戚亲戚朋友 介绍。