【贴心栏目】院长帮帮忙第一期:页面无用时间信息惹麻烦!

  • A+
所属分类:技术分享

写在前面

了解黑色理想的童鞋都知道,黑色理想有个小夜,人好心美,这不,小夜又为大家谋福利,在站长社区学院同学汇中新开辟了“院长帮帮忙”的栏目,由小夜亲力亲为,为大家追百年难解的case!也希望通过展示这些case,让更多站点获益,少走弯路!

但是参与有前提,大家坐稳听好咯:
1、可以准确地描述问题详情,提供全面的截图;
2,已通过反馈中心进行反馈,但是回复的内容不能解决该问题;
3,已经过充分自查,需要提供排查项目和结果截图;
4,可以允许百度站长学院公开案例(关键数据会遵从站长的意见进行马赛克处理)。

那今天,我们就先来分享一个典型案例:


页面无用时间信息导致网页不被抓取

在第一期【院长帮帮忙】栏目露面的站点是编织汇(www.bianzhihui.com),该站点通过反馈中心反馈页面内容迟迟不被抓取,经百度工程师追查,原来是因为页面上的无用时间信息——没有想到是不是?同学们快来看看这个案例吧。

站点求助:问题
  编织汇网站内容发布后几个礼拜都未曾收录。案例如下:
  http://www.bianzhihui.com/t/6717(教程详细页面举例)
  http://www.bianzhihui.com/u/12306 (用户页面举例)
  http://www.bianzhihui.com/h/154 (编织花样页面举例)
  我们已将这些url放入sitemap,并使用了百度统计的集成的JS推荐,但是未曾有改善。

站点求助:自查
  根据反馈中心的回复,使用抓取异常工具诊断:未发现异常

院长出手,内部追查
  工程师结论: spider抓取很及时,但因为该网站没有设置内容产出时间,网站底部却有个老旧时间日期,导致spider误以为网页内容老旧(具体策略较复杂,在此不做赘述)。建议增加页面内容产生时间,去掉没有必要的时间信息


  *以上为旧页面截图,“201499日”对时间识别造成干扰。

站点总结:
  1、网页上切忌勿乱加时间,如我们网站的(始于201499日)这种时间是一个大忌;
  2、网页内容尽可能加上产出时间,也就是发布时间;
  3、百度site的结果时间和权重并无太多关系;
  4、跟百度沟通的时候,一定要条例清晰,证据确凿。自身的问题一定要先排查准确。

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: