华图教育-第一公务员考试网

4006-01-9999选课报班 网上报名
【导读】从百度统计(或GA 工具)查看分析网站流量的布局,分析网站不同着陆页URL,查看各个着陆页被百度收录的页面URL是否存在重复,以及是否有带参数URL存在收录错误情况?

  在一些情况下,大家都会发现一个页面会存在重复收录的问题,会不利于网站优化以及提升网站权重排名,影响页面关键词排名,进而影响网站整体流量。下面根据自身网站的情况,分享自己网站重复收录问题。

  从百度统计(或GA 工具)查看分析网站流量的布局,分析网站不同着陆页URL,查看各个着陆页被百度收录的页面URL是否存在重复,以及是否有带参数URL存在收录错误情况?通过一段时间的数据观察,发现以下页面URL存在明显的收录问题。

  1、一级目录页与二级目录页(网站核心列表页)都存在收录重复问题,而规范的标准URL却未被百度收录,规范的标准URL收录率大概在30%左右。筛选项都被蜘蛛重复抓取,有效抓取只有15%,使得大量筛选页(并不希望被百度收录)反而被百度收录大量收录。

   网站的具体产品页面(类似淘宝的商品详情页面),绝大部分带参数的URL被百度收录,与规范的URL同时被百度收录,而规范的URL收录率大概在20%左右,这样使得同一个具体产品页面的权重被分散。

  二、解决方案

  1、添加nofollow 标签

  为避免一级目录页与二级目录页列表页筛选项重复收录,之前相应的内链位置添加nofollow 标签,主要是在筛选区域。除此之外包括网站页脚、导航等不希望权重传递的部分。


网站全站

对导航、页脚等不重要部分的模块,并对不希望权重传递的页面加以nofollow处理

<a href=”相应的链接地址” target=”_blank” rel=”nofollow”>导航或页脚文本</a>

一级或二级栏目 列表页

列表页筛选区(比如:价格、筛选)链接添加nofollow

列表页右侧广告链接添加nofollow

  优化结果

  提高了蜘蛛的有效抓取,间接有助于列表页收录

  观察1个半月时间(10月中旬-11月底)后,蜘蛛有效抓取量较最初增加6倍多,为列表页规范化的URL收录提升做好铺垫,为解决重复收录做好铺垫。

  添加canonical标签

  针对被百度收录重复的一级目录页与二级目录页列表页,重复的具体产品页面(类似淘宝的宝贝详情页面)页面添加相应的canonical,经过分析观察,将全站URL收录有问题的列表页共分为A、B、C、D、E共5钟 。采取的优化策略如下:


A 栏目列表页

对于所有栏目列表页之后带参数的页面,添加一个 canonical标签链接来进行指向 带 一级或二级栏目页面

B 栏目列表页

C 栏目列表页

列表页带有筛选项的URL全部增加添加一个 rel="canonical

D 栏目列表页

只需在页面<head> 部分<link rel="canonical" href="相应的一级或二级栏目页面

E 栏目列表页

F 具体产品页面(类似淘宝商品详情页)

重复的URL(带参数的),产品页面的URL 添加一个 rel="canonical" 链接都指向 正常的产品页面

图1
以下是列表页添加“canonical”标签前后(2013年1月始到至今)相应数据的变化,以下是流量和收录效果分析。

  变化

类别

优化前

优化后

总结

A列表页    site收录数

  日均31550

  日均139344

上升 341.66%

  带参数页面 site收录数

  日均52268

  日均8225

  下降 84.26%

  备注:
  网站规范的URL收录不断上升,流量也同时上升,A栏目列表页相应的核心词排名上升5.8。
当带参数(不希望被百度收录)页面收录逐渐减少时,权重就能比较集中,能使网站更多规范的URL被收录,网站重复收录的情况逐渐缓解。

  变化

类别

优化前

优化后

总结

A列表页      UV

  日均57957

  日均93568

上升 61.44%

  带参数页面   UV

  日均5560

  日均7044

  上升 26.69%

  A列表页流量的上升,能提高网站其他页面权重,从而带动其他页面的流量。
尽管带参数页面(不希望被百度收录页面)收录量有所下降,但是这些带参数页面的流量仍有上升的趋势。

  1、添加nofollow 标签后分析收录量提升效果并不显著,但是对于蜘蛛抓取有效的页面有一定作用。

  2、 添加canonical标签的项目上线后,2周后查看列表页(规范的页面)百度收录率提升40%,虽然至今为止并没有百分百全被百度收录,但在一定程度上缓解了列表页页面未被收录问题。但是对于详细产品页面的canonical标签效果并不为明显,初步判断是因为产品页面是更新频率较快,不能比较准确地指向相应的URL。

   不要认为网站类似页面重复收录越多越好,虽然这样能够增加全站的收录量,但是权重被分散开来,不利于核心词排名,所以更应避免网页重复收录问题。

   需要在建立相关SEO页面时,就需要使URL统一,避免出现带参数的URL。因为对于搜索引擎来说,一个页面对应一个固定的URL更加友好些,也能避免重复收录的问题的出现,同时告诉搜索引擎网站希望把权重导向哪个页面。

  更多内容请关注站长论坛 网络营销 网络推广 SEO优化 网络策划 用户体验 站长交流区

    经典图书

    • 国考新大纲系列
    • 名师模块教材
    • 面试教材系列
    • 公务员省考教材
    • 华图教你赢系列
    • 热门分站
    • 热门地市
    • 热门考试
    • 热门信息
    • 热门推荐
    • 申论
    • 行测
    • 面试
    • 历年真题
    • 模拟试题
    • 时事热点

    问知

    为您解答一切公考疑问
    问卷调查