【三明seo】百度算法解读动态索引SEO的帮助

佚名 2022-07-31

搜索引擎上一篇文章SEO说到倒排索引的静态索引,本文将讨论动态索引。因为索引一旦建立,就可以投入到用户的查询请求系统中。

事实上,互联网上每时每刻都有大量的页面生成。为了满足用户的不同需求,必须向用户添加最新文档,如小明,并在百度上查询“今日南京天气预报”,根据静态索引,返回的信息不是最新的,可能是今天之前的天气预报信息。用户体验不是很好,所以动态索引很好地解决了这个问题。

原始静态索引库建成后,新文档将不断加入,原始文档索引可以删除或更改内容。例如,在视频软件客户端上观看电视剧或电影时,视频软件下载并播放。观看新视频时,缓存库中会有视频缓存文件,搜索引擎也是如此。新文件需要及时纳入缓存库。删除视频的缓存也可以实时看到,大多数搜索引擎也类似于这样的动态场景。

那么搜索引擎是如何实现这种动态索引的呢?搜索引擎SEO先了解一下名词概念:

1.倒排索引:这实际上是一种存储单词对应文档的形式。

2.临时索引:它也是一种存储形式。与倒排索引不同,例如,在系统中添加新文档,实时分析文档,并添加到临时索引的存储形式中。

3.已删除的文档列表:这很容易理解,用于存储被删除文档的对应ID之后,形成了一个ID列表。PS,如果文档的内容发生变化,搜索引擎会认为没有旧文档,删除它,然后在系统中添加新文档,以支持内容变化。

当搜索引擎发现一个新文档时(互联网上所有的文档都叫文档,比如jpg,txt,js等等,这些都是文档),会放在临时缓存索引库中。当文档被删除或更改时,放在删除队列中,通过临时缓存索引库获取更新后的文档信息,实现动态索引。

例如:当用户在百度搜索查询词(相当于向搜索引擎发送请求)时,搜索引擎会在自己的倒排索引库和临时缓存索引库中找到与用户查询词相关的文档集合,筛选整合两个库中的文档集合,最终得到相关文档,并在搜索结果页面上返回这些文档集合。

实际上,网站所在的服务器资源是有限的。随着时间的推移,越来越多的文档被添加到该系统中,临时缓存索引库的内存也将被消耗。最初分配给临时缓存索引库的内存可能无法满足当前的要求。搜索引擎通过四种更新策略完美地解决了这个问题,即完全重建策略、再合并策略、原地更新策略和混合策略,这些都不再深入解释。

实战中的应用,通过以上结论,当我们的网站文章页面被收录时,排名并不理想。此时,是否删除页面并重写一篇关于这个词的新文章?

不,正确的方法应该是修改原始网页的内容,使页面丰富度更加完美(如插图、文章布局、关键词粗体、添加时间戳、共享插件、评论等),然后在百度网站管理员平台上提交链接并抱怨网页快照。删除这个页面不好么?也可以,但删除URL不是首选,因为删除这个页面后就变成了死链接。

至于死链接,这里有两种情况:一般SEO如果从业者的细节不到位,他们就不会在意。让网站上有一个死链接,这实际上不利于蜘蛛的友好性,也会导致网站的整体分数下降,这对网站的排名非常不利。那么一般的SEO从业者可以很好地利用相关工具(如尖叫青蛙、绿蜗牛等工具)抓住网站的死链接,并提交给百度网站管理员平台,但搜索引擎更新不是很及时,有时甚至包含会发布,例如:网站双包含,301跳转1-3个月生效,所以在原始网页上修改是最好的选择,这个搜索引擎SEO请在评论区留言。


版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权本站发表,未经许可,不得转载。

分享:

扫一扫在手机阅读、分享本文