对于SEO运营而言,每时每刻都会发生着各种问题,有的时候如果你不认真与细心可能问题发生很久我们都没有办法进行合理的处理。
特别是关于首页重复收录的问题,如果你的首页并没有布局关键词排名,亦或是不重要,我们很难发现这些细节性的问题。
那么,网站首页大量重复收录,我们该如何解决?
根据以往SEO诊断的经验,将通过如下内容阐述:
1、首页翻页
对于网站首页而言,我们在做SEO的过程中,经常有一些CMS系统会自带翻页等相关功能,一般而言会造成大量的重复性首页的展现。
通常的展现形式如:domain/page_*.html
如果你的网站首页底部附带分页展现的话,基于首页权重的优势,理论上搜索引擎收录这些翻页的首页就很可能出现,并且概率极高。
而这个时候,我们在选择如何处理这个问题的时候,我认为需要一份为二,比如:
①如果你首页只做品牌词排名,我建议不需要考量重复性收录的问题。
②如果你首页做了一些行业关键词排名,这个时候我们需要处理一下重复性翻页问题。
通常我们针对翻页造成首页大量重复收录的解决办法主要包括:
①合理的使用Canioncal标签,标注首页的一性。
②利用nofollow去禁止分页的爬行,这样有利于用户体验,但不利于百度蜘蛛爬行。
③如果你是操作谷歌seo,我们认为你可以采用dofollow,noindex策略。(目前,百度貌似并不支持。)
从目前来看,相对合理化的处理方式就是用Canonical标注,但是有的时候效果也不理想,如果想完全杜绝,可以不展现,并且屏蔽抓取。
2、动态参数
你是否偶尔会遇到这样一个问题,突然有一天在查询自己品牌词的时候,发现首页收录了大量动态参数的页面,这让人很苦恼,通常主要表现如下三个方面:
①随机动态参数
你可能经常会看到这样的动态参数,比如:domain/?_aaa=0.987等等这样形态的链接,很多时候可能是一些网站流量统计来路的计算。
②恶意做外链
所谓的恶意外链,我们在早期黑帽SEO策略中,可能提到过类似的案例,比如:
domian/?https://domain_123*.html
这样的链接形式,其中主要的目的就是为自己的第三方网址进行外链建设与推广。
③服务器配置问题
如果你的网站具有一定的访问量,经常可能会遭遇CC攻击等相关问题,这个时候有的SEO小伙伴可能会配置一些安全防护措施,比如:安全狗。
如果你配置不当,可能就会产生这样的情况:网站首页域名后缀出现domain/?WebShieldDRSessionVerify这样的问题。
而针对上述三种情况,我们统一给出的解决方案目前只能是在robots.txt中,屏蔽动态参数。
而对于已经收录的大量首页网址,可以不用处理。
3、首页首 选域
造成网站首页重复性收录的问题,选域是一个老生常谈的话题,简单理解,你的首页展现有不同的版本,比如:index.html的收录和独立域名的展现。
而面对多个网站选域造成重复性收录的问题,我们认为你可能需要进行有效的301重定向。