在网上见到一些网友发的一个帖子,要求百度制定搜索收录规则,而实际上百度早就已经制定了名为百度与站长的建站指南,公布了如何让网站被百度收录,什么样的网站会被百度拒绝收录或抛弃等相关条款。百度相关规则的全文见于《百度与站长》,仔细阅读完毕,并参考网友们普遍认可的一些搜索引擎排名规则,总结出以下一些站点被百度收录或惩罚的可能原因和最主要的因素,希望对SEOer们有用。
对百度收录有益的几条内部因素
1、URL中出现关键词
url链接中包含页面的关键字可以使搜索引擎增加对链接页面以及本页面的关注度,有利于在百度的收录;
2、网页Title中出现关键词
毫无疑问,所有的SEO们都认可Title中出现关键词对于网页排名的好处;
3、常规内容中出现关键词
适当的关键词密度有利于页面在搜索引擎索引中获得好的名次。
4、在页面的第一段中出现关键词
搜索引擎似乎特别关注页面的开头以及页面的底部,似乎在文章开头或者结尾出现关键词有强调关键词的作用,尤其是在文章的第一段,似乎搜索引擎还在沿用截取的方法获得文章的描述,如果页面没有设定描述的话;
5、在页面的最后一段中出现关键词
页面的最后一段明显有助于搜索引擎的索引spider索引,毕竟大部分的站点友情链接是在那个地方,况且copyright范围也能够加深搜索引擎的影响;
6、Heading 标签比如h1,h2中出现关键词
不用多余的解释,h1、h2标签似乎专为搜索引擎设计;
7、站内的链接中出现关键词
和站外的链接中出现关键词没有任何区别。
8、导向相关内容的导出链接
不要怀疑,页面中的任何链接都会得到搜索引擎的关注;
9、导出链接中出现关键词
带链接的关键词由于链接的存在而被加强
10、图片文件名中出现关键词
文件名是浏览网址的一部分,这似乎和域名中包含关键词有异曲同工之妙;
11、Alt标签中出现关键词
一般情况下图片链接对于搜索引擎的友好程度比不上文字链接,所以html语言才设计了Alt标签;
12、comment中出现关键词
虽然作用在不断的减低,但始终是搜索引擎排名的依据之一;
13、合理的频率更新内容
似乎没有什么合理的说法,搜索引擎喜欢更新更快的网站,但是请不要更新的速度剧烈的波动;
14、内容对搜索引擎的展示位置
这一点要说的是,请把内容的主体部分放在页面的靠前位置
15、网站结构循环PR,而非散发PR
不要仅仅关注pr,这么做同样有助于提高百度的网页权重
16、关键词进行适当的修饰(加粗、斜体、strong、下划线等)
这些方法无疑会吸引搜索引擎的目光。
百度-搜索引擎排名规则
对百度收录有益的几条外部因素
1、大量的导入链接
大量的导入链接是对任何搜索引擎都友好的一种做法;
2、从高PR值得网页获得导入链接
这一点不用细说,获得pr值得传递,同样会获得百度权重的传递;
3、从相关内容网站获得导入链接
一定要是相关内容的网站获得导入链接,否则被k了是无法挽救的;
4、导入链接指向的网页有具体内容
自然是对搜索引擎及用户都友好的网页才会最终在搜索引擎获得好的排名;
5、锚文字中有关键词
不用多说了,这绝对是最常规,认同度最广泛的结论
6、锚文字周围有相关词
有助于机器识别链接的相关性,特别是现在搜索引擎反对链接出售的关键性时期;
7、锚文字存在于文章或句子中
重复、强调关键文字;
8、导入链接的时间长度,一般导入链接的存在时间有3-6个月
当你获得的导入链接很快都被删除,是得不到pr以及百度网页权重的传递的,尽量使它们保留的时间长一些更有好处;
9、单向链接的价值高于交换链接
链接只进不出好过链接只出不进,无论如何,一个单向的导入链接更能够传递pr和权重
10、导入链接的页面的导出链接小于100个,流出链接越少越好
导入链接的页面的导出链接越少,您能够获得的pr传递的比例越高,被搜索引擎抓取的比例自然也越高;
11、链接来自不同IP
不同ip的链接,更能够说明你文章页面内容的权威度;
12、合理的导入链接增长频率
不要一口吃撑个大胖子,你消化不良,搜索引擎同样对你的链接消化不良。
影响百度收录,甚至会导致百度k站的原因
1、关键词堆积
在标题中堆积与正文无关的关键词,强调了标题和网站内容的相互呼应,如果标题中涉及到某一关键词,而实际网站内容中与该关键词无关的话,那么可能会百度删除.这一条款反映了百度的严格.但值得思考的是,百度是用什么方法去判断网站的内容与标题关键词的相关性呢?
2、在同一个页面上,不要有过多链接。在那些站点地图类型的页面上,请把重要的内容给出链接,而不是所有细枝末节。链接太多,也可能会导致无法被百度收录.
3、所有的锚文字都相同,如果每个个网页的锚文字都相同,搜索引擎是不是会感觉烦呢?尽管他不是人。
4、使用CSS或背景色隐藏内容,这是十恶不赦的大恶,如果你不希望自己的站被k掉,赶紧去掉这种不明智的做法。
5、如果您的站点做了很多针对百度的优化,但却给用户带来大量负面体验,那么,您的站点最终可能还是会受到百度的冷落。如果您的站点中的网页,做了很多针对搜索引擎而非用户的处理,使得:用户从搜索结果中看到的内容与页面实际内容完全不同,或者站点质量与站点在搜索结果中的排名极不相称,从而导致用户产生受欺骗感觉,那么,您的网站就有可能被百度丢弃。
6、使用JavaScript跳转
这一条不需多评论,主要针对一些作弊行为采用的跳转.大多数搜索引擎都会有类似的条款。
7、相同ip之下的网页直接进行大量交换链接
合理的链接无所谓,关键是不要简单的交换链接,万一百度以为你是在忽悠他的爬虫,嘿嘿,后果不用说你也知道。
8、桥页和Cloaking,诱导搜索引擎的爬虫,这是十恶不赦的大恶
9、成人内容,违禁药品,赌博相关内容
百度这家伙反感,尽量少掺活,就算收录了也一定会被人工删除,只是时间的问题;
10、内容重复
对于已经被重复了千百遍的内容,百度可能会不予收录。如果您的站点上的网页,大量都是复制自互联网上的高度重复性的内容,那么,您的站点也有可能被百度丢弃。
11、连向作弊的网站
与一些垃圾站点做友情链接,很可能会使您的网站受到负面影响。因此,当有人很热情的要求您为他的站点提供友情链接时,请审视以下两点:
a,对方的站点在他那个领域是否是高质量的?站长间所谓的流量以及排名,很多都是用欺骗手段获取的,无法保持长久。
b,对方要求的链接名称是否和对方网站地位相称?用一个涵盖范围广泛的关键词来做一个内容非常局限的网站的链接名称,很可能会使您的网站受到负面影响。
12、站内的绝大部分网页有相同的网页title
每个网页有特定的title是对搜索引擎起码的尊重,如果一个班的学生都叫王小丫,老师如何点名呢?又如何排名呢?
13、加入到Link交换类网站,交换链接已经广泛的被搜索引擎反感;
14、使用被惩罚过的域名,百度没有声称会对惩罚过的域名重新收录;
15、网站建立在被惩罚的IP上,百度没有声称会对惩罚过的ip重新抓取;
16、非法内容,如果您的网站内容有不符合中国法律的地方,则无法被百度收录
17、如果您的站点页面结构复杂,则可能无法被百度收录,这一点我始终是不大明白,究竟百度的复杂是什么程度上的复杂呢?不懂!
尽量避免的问题
1、地址中存在动态变量
地址中存在动态变量直接影响搜索引擎的抓取和收录,如果会,为什么不把这些动态变量变成静态的链接呢?
2、单一图片和Flash的网站
这个不好收录,地球人都知道;
3、用Javascript制作的网站导航条或目录
怪只怪spider不认识Javascript代码,而且也看不到你的效果;
4、用图片做网站导航而不加ALT标签
5、〈head〉〈/head〉之间有太多的代码
这个部分的代码太多,正文部分关键字的密度会被动减低;
6、存在太多与网站主题无关的内容
会被搜索引擎人工整理收录的时候删掉,如果你有,赶紧删掉吧!
7、导入链接中购买链接占多数
不用说了,百度和Google都在反对链接买卖的风口上;
8、和作弊的网站在同一服务器上