英雄榜:果尔网稿件征集启示
SEO优化案例分析 : 2013-11-23 14:25:27 - SEO资讯
你认可果尔网上的文章观点吗?你想把你心中的想法告诉大家吗?你愿意和果尔一起打造真正的纯SEO交流平台吗?……欢迎发送您的建议或意见,以及您的原创文章(请. ...
SEO优化案例分析 : 2013-11-23 14:25:27 - SEO资讯
你认可果尔网上的文章观点吗?你想把你心中的想法告诉大家吗?你愿意和果尔一起打造真正的纯SEO交流平台吗?……欢迎发送您的建议或意见,以及您的原创文章(请. ...
Posted:2013-11-27 09:13:05 - comments | 作者: @果尔 @ SEO培训学院 修订1.4 ID:7023
在上一节《2.2、页面搜集原理、技术和系统–搜集过程》中,讲解了调度器对抓取回来的网页保存到网页数据库中,那么网页数据库是如何对网页信息进行保存的呢?什么样的存储方式才能更好的给其他功能模块调用呢?这就是本节要探讨的问题: 天网搜索引擎的网页数据库是以天网存储结构来进行保存的,我们就以该存储结构进行讲解,要注意的是:该存储结构仅仅适用于天网搜索引擎,并不代表其他搜索引擎使用该存储方式进行网页保存。
天网存储结构定义:
下图为天网网页数据库的一个案例:
数据的可恢复性分析
使用天网存储结构,可以通过以下步骤找到残存片段中所有完整的记录:
小结
综上所述,我们可以知道天网存储结构可以快速的保存抓取回来的网页信息,并且有很好的容错性和可恢复性,是一种比较优秀的存储结构,各个搜索引擎都会为自己搭建一个稳定的网页数据库,有兴趣的朋友可以去翻看其他文献,研究其他更好的网页存储结构。
果尔SEO,中国医疗美容机构SEO经验分享平台。本文头像LOGO署名文章版权所有,转载请注明出处。