1、搜索引擎会基于网页结构识别噪音,因此SEO人员在处理网页结构时建议引入JS代码,将页头、导航、广告、版权声明等内容通过JS调用来实现。因为这些区块在站内很可能都是反复出现的,一旦被收录,很容易造成反复内容堆积,影响整站的内容质量评分。
SEOer利用消噪技术表现在两个方面,一是在页面各次要部分人工减噪,帮助搜索引擎锁定重点内容;二是在正文区适当加噪,让搜索引擎不容易识别伪原创。
2、基本模版的方法。指的是从一组网页中提取出相同的模板,而后利用这些模版从网页中抽取有用的信息。
3、基于可视化信息的方法。是指利用页面中元素的规划信息,从而能够利用布局信息对页面进行划分,保存页面中间区域,而其它区域则认为是噪音。
人工减噪的技术要与搜索引擎识别噪音的原理对比着来看,主要是下面三方面工作。
1、基于网页结构的方法。即根据html标签对页面来分区,分出一些页头、导航、正文、广告等等的区块,只抓取正文等重要的部分。
3、搜索引擎会基于可视化信息识别噪音,因此SEO人员在建立网页时应尽量遵循通用的原则,将正文内容安排在页面中间区域,而不要弄一些非常个性化的页面,增加搜索引擎识别噪音的难度。
2、搜索引擎会基于网页模版识别噪音,因此SEO人员在建立网页时应尽量采用同一套模版,尤其是在改版的时候不要轻易动模版,以帮助搜索引擎识别噪音区块。
消噪是搜索引擎预处理的一个基本步骤,指的是搜索引擎识别出页面上与主题不相关的内容,将其删除的过程。
人工减噪的技术现在SEO人员应用的已经很广泛了.
对搜索引擎来说,并非网页上的所有部门它都需要抓取,有一些部分对排名计算是没有意义的,比如导航条、版权文字说明、广告等等区块。考虑到搜索引擎需要处理的网页数量非常庞大,这部分无意义内容的绝对量也是非常大的,为了节省计算资源,提升排名计算的速度,搜索引擎在预处理时会将这些内容识别后剔除出去。这个过程就称为消噪。
二、如何人工减噪
一、消噪技术的原理 |