《百度搜索质量白皮书》研究 (多图)

百度快照排名

百度近期发布了《百度网页搜索质量白皮书》,小编特邀金海威国际的仲彪为大家解读。其他更多观点将在这几天的推送中分享给大家。

一、预估

3月份,我发现百度的服务器不够用,很多服务器日常工作量减少、某些工作停滞,结合一些百度举措,认为百度将有新规则出台。时间大约在5-7月间,重点内容是“页面相关度”、“用户体验”。

1、预估时间

百度5月13日预告白皮书内容,计划5月中旬上线,看来是在预估范围之内。

2、预估内容

预测原创精心编辑的文案和用户体验和这次百度白皮书一样,只是没预料到白皮书的第三点。3月份我才发现问题,预测百度的速度为5-7月,我估计我的一些网站赶不上这趟百度的顺风车了,来不及修改。

3、预估影响

符合百度优质页面的 网站、内页、文章页将会获得排名,特别是内容精确、信息量丰富、用户数据好的内页将会替代首页来占据排名;很多网站的排名会逐渐消失,直到所有关键词排名消失(这个应该较缓慢,集中在部分行业)。 2015年前变动可能不大,年后估计可能有很大变动。

二、在此之前

1、2013年6月至11月,百度市场占有率持续下降,下降约为6.4个百分点,百度各股东对于此事,应该都感到不高兴,长远利益一致就好做事了。

2、360没有搜索引擎核心技术,但是具有自身优势和很强的势力,对百度具有一定的威胁。

3、百度自身的核心技术“超链接分析技术”存在问题,不能满足正确搜索结果的展示。

4、在大多数情况下,钱发挥着主导行为的功效,百度应该花得起钱买来几个掌握google算法核心技术或者边缘的人吧?

Google大概2万名主要员工,这2万人都有google的股份,掌握核心技术员工的股份和持股形式就更不同了。在世界第一流的公司担当重要角色,且能分红,看来是不会去百度的。如果百度有更高的薪资待遇, google就会给更高的,在一定程度上解决了某项技术的外泄。

看来百度只能靠自己,Google做的挺好,可以跟着google走,做个山寨模拟机,只要偶尔能实现就行: 核心技术“超链分析”把网络搞的一团糟,为此百度推出了一系列算法来清理网络,百度公布了一些举措。比如针对低质量站点的措施与石榴算法;超链作弊的算法升级;Web2.0反垃圾详细攻略;谈外链判断;绿萝算法。

按照百度的态度,理论上以下行为将受到打击:

1.1 链接中介网站,参与链接中介的网站;

1.2 出售、出租链接的网站(我认为这个百度难以做好);

1.3 购买链接的网站(我认为这个百度难以做好);

1.4 影响浏览,含弹出广告、垃圾广告、和页面不相关广告的网站;

1.5 承载和发布推广软文的网站;

1.6 打击交叉链轮;

1.7 隐藏链接;

1.8 使用程序机在web2.0等网站大量的群发指向您网站的链接;

1.9 不具推荐意义的交换链接;

1.10 采集链接;

1.11 黑链;

1.12 虚假锚文本;

1.13 论坛签名带链接;

1.14 留言、回复带链接;

1.15 文章插入链接和明显推广链接;

1.16 伪原创组合文章。

PS:加入推广合作平台,你会发现每月你有无数的链接,这些链接蛮有意思的,不过都是属于被惩罚的行列。实践出真知,以前人家办这个的人赚到了,不过有多又少。

2012年的6.22和6.28事件,表明百度想打击低质量页面,可是投入不够,没啥力度。

2014年,百度升级了“百度索引量工具”,看看我一个网站的索引量数据(本身是作弊的网站,权重5下降到2,后调整了作弊,权重恢复到4,但整体是下降的):

明显百度这次说到做到,在索引量从77万下降持平后,突然暴增至100多万。随后,我观察百度对其它工作的处理缓慢、滞后、停滞,估计百度的服务器都用来处理全网抓取行为了。

此时(5月9号),百度正在编写白皮书,13号发布了白皮书预告。预计百度索引行为结束,而且可能出了很多索引分析,下半年百度将处理排序展示这些结果,2015年将有一个新的百度搜索结果和百度搜索界面。

三、如何做?

我正好有个新站要做,是关于b2b电商平台的。SEOWHY的人并不这么做,但是一些新手会发生的事情:

1. 缺乏nofollow链接,follow链接比例过高——-目前仅适用google。

2. 发布大量这些链接:博客带链接、软文带链接、帖子带链接、论坛签名带链接、留言带链接、回复带链接、评论带链接。

3. 委托淘宝、seo平台服务,多为廉价作弊。

4. 加入站长互惠宣传、交换资源平台,产生直接或连带惩罚。

5. 链接锚文本精确匹配—-目前仅适用google。

6. 链接到内页比例过高—–目前仅适用google。

7. 交叉连接、引用尝到甜头,开始搞几十层的交叉链轮,费时费力还有反作用。

8. 数量上排名前10个锚文本关键词都是商业化的词或其他不自然的词。锚文本使用商业性强的词比例过高——-目前仅适用google。

9. 企业自己的站点互链,降低了效果,导致排名下降—-目前仅适用google,看来百度有这个趋势,但方向应该是相关度和用户的点击及随后的行为。

10. 锚文本使用较少的品牌词和复合词——-目前仅适用google。

11. 生硬插入链接。

12. 采集链接,我的网站有 产品采集、黄色网站采集。

13. 隐藏链接。

14. 非自然链接增长,链接增加快于同类网站平均速度——-目前仅适用google,百度以后应该会跟上,但受苦的还是平民站。

15. 适用工具,为原创、群发、模拟点击。

16. 链接主题和被指向网页不相关,即不具备推荐意义。

看看Google的思路,多少在影响着百度的思路

1. PageRank

2. 超链分析技术

3. 用户体验

4. 社交化

Google还在研究。

可以看出,百度在跟风google,而且很多东西Google在2007-2010就开始不用或者解决了,你在google的正常网站怎么做的,就可以照搬过来,只是需要结合“国情”具体问题具体分析。需要解决的问题是:

1. 增长安全的链接,获得链接数(这个真说烂了);

2. 高质量链接,这个每个人都会说,但是却在发垃圾(这个真说烂了,作为常识给新手罗列下);

3. 链接具有互通相关性(这个真说烂了,作为常识给新手罗列下);

4. 链接有人点,并且之后的用户体验数据优良;

5. 用户体验,产品经理、ui设计、程序、功能、流程等(这个真说烂了,作为常识给新手罗列下)。

6. 针对百度的文案和用户的文案如何安排,如何获得最佳效果,通过模块代码,还是视觉,或者其他方法,根据自身情况来安排。

7. 考虑如何才能符合百度白皮书的:

需要研究下分词和语义分析。估计暂时很多行业,百度会以原有排名站的描述、写进百科、知道、词条的的描述,以及行业通用语、行业关键元素来作为判断。

继续阅读