网站更新的内容不被百度搜索,看二个方面,(上线-个月)新网站,还是(一年以上)老网站
一、新网站内容不收录
检查的事项:
.网站代码能否被搜索引擎抓取,可以通过百度资源平台,或者站长平工具通过模拟抓取,看首页的信息是能被搜索引擎抓取的到.
网站前端页面一定要使DIV+CSS样式来写,有利于搜索抓取,不要用JS搜索不喜欢抓,基本不抓取,因为会比期耗时间。
.检查网站的robots.txt文件,看没有屏蔽,不允许搜索引擎蜘蛛抓取一些网站栏目及页面信息。
如:淘宝就屏蔽了百度搜索对其页面的抓取,因为早期百度搜索也有做电商的想法,并上线了百度有啊平台,很可惜最终没有做起来,淘宝为了防止百度搜索蜘蛛抓取淘宝的页面信息。就屏蔽了百度蜘蛛的抓取
baiduspider 百度搜索蜘蛛 Disallow: 不允许抓取: / 斜杠代表的网站的根目录,网站的所有页面信息
通过访问淘宝地址,可以看得出来
http://www.taobao.com/robots.txt
. 检查网站的页面的质量,
大量的空白,无内容的页面,全是图片页面并不利于搜索抓取读取页面的表达的意思,
.内容全是采集
大量地采集在搜索引擎中早就存在的内容,新网站直接被搜索引判断为采集网站,降权网站的重要性等级,会严重景网站的收录及排名周期
.网站路径问题
每个页面对应唯一路径,如果一个页面有多个路径,影响收录,
或者为了让网站路径简利于记录识别,网站原本动态路径,通过伪静态处理之后,生成了静态路径,而又没有利用robots.txt屏蔽动态路径。
.页面的质量度问题
①内容丰富度高,图文并举,段落明了,层次构结良好
②多个页面之间没有存在大量的重复内容,大量的多个页面重复内容,会导致网站页面的相似度过高,这种情况下搜索引擎会放弃收录,老网站会删除已收录的网站页面
不可乱页面的标签,
每个页面只有一个 H标签, H标签,H标签
其中页面的页面的标签一定要加H标签【H是标题标签】页面标题加H标签有利于搜索的识别判断,这个就是当页面的主题。
二、老网站内容不收录,
①要分析从什么时候不收录的,特别是网站近三个月有没有出现故障,改动的情况,这些都可能会导致内容短期不收录,
②老网站不收录,通过大量的示例,%还是内容质量不行。没有很好地利于搜索需求来定义,标题及内容的质量度,这样更新的话题即没有包含、匹配用户会搜索的关键词话题及句子时,收录的优先等级就是最低的,不能满足搜索引擎优先抓取收录机制。