名医整形网www.mingyi100.com

相关排序-链接权值的计算
By In 名医整形网, 好医佳 2013-11-27 09:23:23 704559 阅读
在上一节的《6.2、相关排序–网页权重的计算》中我们知道了天网搜索引擎的网页权重计算公式为天网搜索引擎网页权重=网页中词项基本权重+链接权重+用户评价权重。那么
相关排序-网页词项权重的计算
By In 名医整形网, 好医佳 2013-11-27 09:22:54 704467 阅读
在上一节的《6.1、相关排序–网页权重的计算》中我们知道了天网搜索引擎的网页权重计算公式为天网搜索引擎网页权重=网页中词项基本权重+链接权重+用户评价权重。那么第
相关排序-网页权重的计算
By In 名医整形网, 好医佳 2013-11-27 09:22:27 704342 阅读
相关排序主要是在《1.1.5、搜索引擎工作原理–体系结构》中的预处理过程中进行的。 网页权重计算部分示意图从下图我们可以看出,网页权重计算涉及的模块很多,搜索引擎
用户行为分析-点击日志分析
By In 名医整形网, 好医佳 2013-11-27 09:22:04 7042101 阅读
在《5.2、用户行为分析–查询日志分析》中我们分析了用户查询日志的分析以及查询日志的应用,本节将是针对用户的点击日志进行分析。 点击日志的内容以下是一个用户点击
用户行为分析-查询日志分析
By In 名医整形网, 好医佳 2013-11-27 09:21:30 704144 阅读
在《5.1、用户行为分析–用户查询与点击日志》中我们了解了用户行为分析的重要性,今天就来一起看看用户查询日志对于搜索引擎有哪些主要意义呢。 查询日志的内容以下只
用户行为分析-用户查询与点击日志
By In 名医整形网, 好医佳 2013-11-27 09:21:08 704076 阅读
在《1.1.5、搜索引擎工作原理–体系结构》中我们知道搜索引擎除了三段式工作流程的网页搜集、预处理、查询服务以外,还有一个独立的模块,那就是用户行为分析模块。 其
搜集引擎信息查询服务-搜索结果页缓存
By In 名医整形网, 好医佳 2013-11-27 09:20:45 703927 阅读
在《4.3、搜集引擎信息查询服务–生成搜索结果页》一节中我们了解了搜索结果页面是如何生成的,同时搜索引擎发现一段时间内许多搜索行为是重复的,因此搜索引擎引入了
搜集引擎信息查询服务-生成搜索结果页
By In 名医整形网, 好医佳 2013-11-27 09:20:20 703835 阅读
在之前的文章中我们讲解了查询服务中文档排序以及中文自动摘要的生成,有了以上两点,搜索引擎就可以为用户生成搜索结果页面了,下面我们就讲解搜索引擎是如何实现这个技术
搜集引擎信息查询服务-中文自动摘要
By In 名医整形网, 好医佳 2013-11-27 09:19:50 703736 阅读
在上一节的搜索引擎原理教程中,我们知道了搜索引擎是如何对用户的查询进行检索排序的,然而只是得到了文档列表还不能形成完整的结果页面,我们还需要对返回的排序列表的每
搜集引擎信息查询服务-网页信息检索
By In 名医整形网, 好医佳 2013-11-27 09:19:26 703626 阅读
第二和第三章的教程中我们学习了搜索引擎原理中网页搜集以及预处理的实现方法,在本章我们将一起研究搜索引擎的查询服务是如何实现的。 下图为搜索引擎的查询服务流程图,搜
搜集信息的预处理-网页消重
By In 名医整形网, 好医佳 2013-11-27 09:19:02 703533 阅读
在搜索引擎原理上一节的《3.2.1、搜集信息的预处理–净化与数据提取》我们研究了搜索引擎是怎么进行网页正文的提取的,本文我们来看搜索引擎又是如何对重复的网页进行
搜集信息的预处理-净化与数据提取
By In 名医整形网, 好医佳 2013-11-27 09:18:32 703490 阅读
在搜索引擎原理上一节的《3.2、搜集信息的预处理–网页净化和消重》我们知道搜索引擎第一步要做的是网页分析,网页分析中又包括正文提取以及分词,中文分词技术已经在
搜集信息的预处理-网页净化和消重
By In 名医整形网, 好医佳 2013-11-27 09:18:08 703319 阅读
在上一节的《3.1.3、搜集信息的预处理–分析页面和建立倒排文件》中我们说过,搜索引擎在预处理的第一步就是要先进行网页的分析,本节将对这部分的内容进行展开。网页
搜集信息的预处理-分析页面和建立倒排文件
By In 名医整形网, 好医佳 2013-11-27 09:17:43 703228 阅读
在上一节的《3.1.2、搜集信息的预处理–中文分词技术》中我们说过,要对网页进行关键词到网页的索引就必须先对网页进行中文分词,然后建立倒排文件,那么具体的流程是
搜集信息的预处理-中文分词技术
By In 名医整形网, 好医佳 2013-11-27 09:17:19 703123 阅读
在上一节的《3.1.1、搜集信息的预处理–索引网页库》中我们介绍了索引网页库的组成部分,当然那是为了搜索引擎通过URL快速定位网页所设计的,而在实际应用中,搜索引擎
搜集信息的预处理-索引网页库
By In 名医整形网, 好医佳 2013-11-27 09:16:47 703021 阅读
在搜索引擎原理中,给网页建立索引是一个很重要的工作,它预示着该网页已经得到搜索引擎的认可,有可能出现在搜索结果页面中,任何没有进入索引网页库的网页,都不可能出现
搜集信息的预处理-系统结构
By In 名医整形网, 好医佳 2013-11-27 09:16:11 702921 阅读
在第二章我们介绍了搜索引擎原理中的网页搜集模块,本文接着讲搜索引擎下一个模块:预处理模块。在这个模块中,搜索引擎完成的主要任务是索引网页库的建立、中文分词的实现
可扩展搜索子系统-系统的动态可配置性设计
By In 名医整形网, 好医佳 2013-11-27 09:15:47 702843 阅读
可扩展搜索子系统需要解决2大问题,第一是节点间URL的划分策略,第二是系统的动态可配置性设计。黄聪已经在上一节《2.6.1、可扩展搜索子系统–节点间URL的划分策略》分
可扩展搜索子系统-节点间URL的划分策略
By In 名医整形网, 好医佳 2013-11-27 09:15:11 702757 阅读
在《2.6、页面搜集原理、技术和系统–可扩展搜索子系统》中我们知道一个好的搜索子系统需要解决2大问题,第一是节点间URL的划分策略,第二是系统的动态可配置性设计。
页面搜集原理、技术和系统-可扩展搜索子系统
By In 名医整形网, 好医佳 2013-11-27 09:14:42 702647 阅读
在《2.2、页面搜集原理、技术和系统–搜集过程》中我们知道调度器需要分配蜘蛛去抓取网络上的网页,但是网络上的页面数量是百亿级别的,如果调度器只是简单的一个服务
页面搜集原理、技术和系统-如何首先搜集重要的网页
By In 名医整形网, 好医佳 2013-11-27 09:14:19 702572 阅读
在《2.4、页面搜集原理、技术和系统–如何避免网页重复搜集》中我们知道调度器通过未访问URL表和已访问URL表来实现避免网页重复搜集,但是因为网络上的URL很多,如果调
页面搜集原理、技术和系统-如何避免网页重复搜集
By In 名医整形网, 好医佳 2013-11-27 09:13:33 702439 阅读
在《2.2、页面搜集原理、技术和系统–搜集过程》中我们知道调度器会派发URL给各个蜘蛛进行网页的抓取,但是怎样才能避免同一个URL会被重复的抓取呢?调度器是如何确保
页面搜集原理、技术和系统-天网存储结构定义
By In 名医整形网, 好医佳 2013-11-27 09:13:05 702361 阅读
在上一节《2.2、页面搜集原理、技术和系统–搜集过程》中,讲解了调度器对抓取回来的网页保存到网页数据库中,那么网页数据库是如何对网页信息进行保存的呢?什么样的
页面搜集原理、技术和系统-搜集过程
By In 名医整形网, 好医佳 2013-11-27 09:12:33 702230 阅读
了解了一些页面搜集的基础知识后,我们来看看搜索引擎搜集一个页面的整个过程是怎么进行的。下图是搜索引擎搜集网页的过程流程图:搜索引擎搜集网页过程 调度器是整个搜
页面搜集原理、技术和系统-基础知识
By In 名医整形网, 好医佳 2013-11-27 09:12:01 702141 阅读
在上一章的《1.1.5、搜索引擎工作原理–体系结构》中我们了解了搜索引擎的体系结构,而搜索引擎最开始要做的就是互联网页面的搜集,在本章中,黄聪会和大家一起探讨页