近日百度官方发布了一个公开课,虽然没有第一时间看到直播。但是我也看了视频的回放。将该场直播中的“网站死链处理指南”做了一个总结。更加方便的为各位站长提供阅读。
因为是百度官方提出的建议,可信度极高。并且因为行业标杆的原因,其他搜索引擎也会同样适用这种方式,毕竟搜索引擎也是一致为了用户体验。
.影响用户体验,比如用户通过搜索引擎进入,却发现没有页面,用户好感度下降
.搜索引擎好感度下降
.影响搜索页结果,如网站出现大量死链,蜘蛛爬虫就会爬取到很多死链的页面,这样降低了爬虫的效率,导致优质资源无法即时收录。
.抓取过多的死链,搜索引擎会认为该站点是问题站点。会被降低评价(降权)
.自主推送
站长资源平台后台,有相关的工具来推送死链。告诉搜索引擎这些地方的链接是死链,是页面。
毕竟只有站长最知道哪些地方是死链。而自主推送也是目前效率最高的方法。
Q:如果处理结果慢怎么办?
A:耐心等待,因为百度收录的站点太多,每天几十亿的死链推送百度后台会处理,这会使结果放缓。
.搜索引擎自动识别
搜索引擎会更具爬虫的抓取来做到自动识别死链,虽然可以完成识别死链的工作,但因为是机器识别,有很多地方是不可控的。
搜索引擎自动识别会遇到以下问题。
时间长,因为整个互联网的站点太多,识别到你的站点不知道排到什么时候。
误识别,因为是机器,出现误识别是常有的事情,可能会把把优质的文章识别为死链。
标准死链返回结果为页面,通常请求后HTTP 状态码 Status Code 返回的是, Not Found。
.标题
搜索引擎首先会通过标题内容来分析页面是否为页面,title标题显示为错误页面,搜索引擎爬取会非常直观的判定该页面是否为死链。
.正文不建议火星文字
通过标题识别页面为之后,正文部分应该有明确的文字语义。
不能使用火星文,有些站长为了使网站展现的更加个性,会使用一些奇奇怪怪的文字。人能看懂,但百度搜索引擎的爬虫是看不懂的。他甚至不知道你在干什么。
.不建议使用纯图片
如果你在页面直接放一张图片,来提示页面丢失。这种百度官方是不建议的,搜索引擎不可能赋予爬虫识别图片内容的能力。为了更好的给蜘蛛抓爬,劲量使用一些文字来给搜索引擎说明,该页面是一个,该链接是一个死链。
.协议码显示
.页面标题语义直观,契合页面内容
.页面正文内容,可以图文并茂。但不建议纯图片、火星文
.整体布局合理(网站的样式布局,不能使用一个杂乱不堪的页面)