连云港论坛

查看: 53|回复: 0

分析网站运营需要注意网页相似度问题

[复制链接]

1635

主题

1635

帖子

5277

积分

论坛元老

Rank: 8Rank: 8

积分
5277
发表于 2021-3-7 06:00:26 | 显示全部楼层 |阅读模式

很多站长在网站运营时,有时会遇到问题,那就是页面的相似性。什么是网页相似度?简单地说,所谓的网页相似度就是两个页面的相似度。这两个页面可能是同一站点上的页面,可能不是同一站点上的页面,也可能是其他站点上的页面。当搜索引擎收录网页时,它通常会比较两个网页以查看它们是否相似。在这个特殊的“站长”群体里面,大部分是个人站长,在他们坚持梦想的同时不断创新,有部分已经开始了商业转型或者受雇于商业组织。



  所谓相似,是指两个网页的页面内容基本相同。在这种情况下,可以将两个网页视为相似的。比较两个网页搜索引擎时,使用一种特定的算法进行比较,搜索引擎通常使用两种方法进行比较:一种基于网页摘要比较,如果多个网页摘要的md5值相同,则证明这些页面具有高度相似性。其次,根据页面关键词,按照关键词频率顺序,可以取N个高频词,如果它们的md5值相同,则可以认为这些页面具有高度相似性。Google搜索引擎将网页的相似度设置为60%。即,如果两个网页的相似度超过60%,则不再收录正在比较的网页。如果相似度接近60%,则可以收录比较页,但是搜索引擎的权重相对较低。这就是搜索引擎对待网络相似性的方式。可以看出页面相似度对我们网站的影响主要取决于是否可以收录被比较页面,而对其他方面没有影响。

  网站运营出现类似问题的主要原因有两个:

  (1)在同一个网站上,将旧网页复制到新网页中,导致内部网页的标题,关键词,描述信息,内容更改相对较少,结果判断搜索引擎的相似性。

  (2)在不同站点之间,将原本已收录在网站内容中,并稍作更改或伪原创,导致内容更改较少,或者只是一段调整,内容未更改,类似于复制;被搜索引擎判断为相似。判断Web搜索引擎的相似性非常聪明,不是我们想象的从头到尾的简单比较,而是智能分析和比较,我们不冒险,认为复制别人的Web内容,给出一个简单的变化就可以蒙混过关。

  出现问题时,我们需要纠正它,以免下次再次犯同样的错误。关于网站运营中网页的相似性,我们知道形成的原因,我们就可以找到解决措施。解决相似网页的更有效方法是做您真正的原创,如果您的网页内容是原创的,只要内容质量很高,肯定不会因为网页相似度而出现问题并且不收录在内,普通的可以被收录在内。如果您没有太多的空闲时间撰写原创文章,或者由于问题的程度而无法撰写高质量的原创文章,您也可以伪造文章,但是我们建议您避免出现类似的问题页面,您需要在原始文章中进行重大更改,变化的程度至少也要超过50%,因此您可能包括搜索引擎。

  另外,我们建议您在网页中担任站长,以节省时间,如果您需要复制原始网页,那么我们也建议您的网页中的标题,关键字,描述信息和内容也应发生重大变化,否则很难收录您的网页。进行更改时,可以用其他方式替换原始代码,例如用iFrame框架替换内容的前一部分,等等。

  对于不懂怎么建设网站的新手们,为了避免后期麻烦,小编建议大家在网站运营时,还是应注意网页相似度问题。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|连云港论坛 ( 苏ICP备19026772号-4 )

GMT+8, 2021-12-6 01:41 , Processed in 0.115238 second(s), 21 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表