可悲的百度算法机制

标签: 搜索引擎 | 发表时间:2012-10-30 10:29 | 作者:投稿 (guest)
出处:http://www.williamlong.info/

  最近似乎已经很少看到有关于SEO的相关文章了,这是不是印证了《 SEO已死》这篇文章。可能,也许在中国,真正的SEO离死真的并不遥远了。

   背景

  最近有个朋友频频跟笔者抱怨,网站无法被百度正常收录,几个关键词的排名也是好几个月没有动过了。这位朋友是个专心做内容的家伙,因为时常被我灌输“内容为王”的理念,而他网站的相关行业客户对象一般都是年龄较大的互联网用户,在分享传播和外链上,几乎不能指望靠优秀的内容达成,所以在外链规模上十分有限。

  另外,由于曾经因为有意识的购买外链而被搜索引擎惩罚,他也并不太敢于使用链接工厂的那些服务,只是花钱做了十来个所谓百度权重高大7的友链。毕竟行业不是很主流,他觉得也差不多了,其他精力都放在内容上了。

  在这样“曲高和寡”  的作风下,有经验的朋友已经猜到了结局:那就百度收录极差,谷歌收录极好。但谷歌带来的流量实在太过坑爹,基本可以无视,甚至360搜索都比谷歌多。

  这位老兄憋了两个月,终于忍不住问我:是不是还是要多搞点外链啥的?我看他那副惨样,终于长叹一声:搞吧。

   回忆

  以上这些事儿,如果发生在两三年前,我的建议肯定是——“酌情并有序地增加外链,避免作弊嫌疑”,如果发生在四五年前,我的建议肯定是——“给我义无反顾地搞外链,外链为皇!”。可是这已经是2012年的事儿了。

  在这几年,对于那些平凡的网站来说,想得到百度的稳定排名真的不太容易。

  我接触的数十位上海本地站长的一致公认:百度近一两年在排名方面存在严重的欺软怕硬现象。也就是说,普通网站不管是在内在外进行的各种优化都不见得会正常影响排名,甚至仿佛是随机抽取的,你基本得不到任何规律可言。你试试这招也没用,试试那招也没用,或者最多顶个几天用。总结下来,难道真得像百度所说,只要琢磨好《百度站长指南》,并把内功做好就行了?

  在我遇到的企业级客户中,这种现象更加普遍。多个企业在没有进行任何黑帽优化的情况下,网站排名经常大幅波动,甚至持续性倒退。而在谷歌这里,却在收录方面得到了明显提升。而对于不少大型网站或者“重要站点”,即使啥都不干,排名与收录都很稳健,即使那网站做的一塌糊涂。

  看起来这似乎是好事儿。搜索引擎的游戏规则那么神鬼莫测,是不是说明百度的技术已经真正超过了谷歌,“更懂中文”,能够更多靠内容和其他综合因素来判定结果,毕竟不管怎么说,百度的搜索体验不说最好,但也并不差。

   现实

  但事实并非如此,百度看似高明的算法变化与不留情面的生杀予夺,只是一件很可笑的事情,因为一切都没有改变。

  让我们来2012年10月27日凌晨的一个例子,这是我观察了不少天的一个网站:

可悲的百度算法机制

  上图底部的那家网站是出现在百度搜索“平板电脑”这个关键词的首页自然排名中,排除竞价投放因素,它的自然排名居然仅次于中关村在线的开放接口、百度图片、百度百科,位于第四位。在27日下午再次核实,它依然排在前五,首页10个自然排名除了它全部出自中关村在线、Pconline、百度自有产品、泡泡网。如果这种事发生在类似“卢森堡移民”这一类的冷门领域倒还可以理解,但是在微软Surface、Ipad Mini、Nexus 7二代竞相登场的金秋十月尚能做到这些,这到底是哪一家平板厂商?

  讽刺的是,百度居然在搜索结果中该网站标题的下方增加了这么一句话:“百度提示您:该页面可能因黑客侵入而存在安全风险”

  点击该信息,显示结果其实就是有大量的电脑管家用户举报它为“欺诈”型网站。对该网站WHOIS用户信息和IP进行了追踪,发现该平板电脑销售网站的持有方是一家深圳的山寨厂。令人惊讶的是,他还不是一家卖数码产品的,而是卖生物制品的公司。根据同IP下反查出的16个网站显示,这家公司主营的产品基本都是女性减肥、美容类产品,例如左旋肉碱、木瓜汤之流。

  写到这里,懂行的圈内人都会会心的一笑。

   再探

  那我们来看看这个网站做的如何。

  这个网站做的中规中矩,算不上精致,但也并不难看。但仅就百度官方提供的“SEO建议”中涉及的那几项站内优化要求,我认为测试总分应不会超过70分,甚至堪堪及格。无论是JS位置、ALT信息还是DIV+CSS的要求,都并不是那么无懈可击。实际上,这顶多算是一个Landing Page型的销售页面,根本就没有代码层面SEO的基本思想在里面。

  这让文首提到的那位老兄情何以堪,让那些手写sitemap的站长们情何以堪。

  那么这家网站是如何做到这些的?而百度又是为何能让这么一个被频频举报为欺诈且没有付过一分钱给自己(这点清廉我们还是相信的)的山寨平板销售网站骑在联想、华为、京东、当当头上?这如果不是策略,难道是技术和算法上的原因?

   可悲

  我对该网站服务器上的10多个兄弟网站进行了调查,其中居然只有一个PR=0,其他网站PR都有2-3,要知道,这些可都是单页型的销售类网站,甚至不能叫网站,只是一个页面。

  谷歌的PR说明不了太大问题,我们看看它的百度反链。

  我的老天诶,11万多的百度反链。当然,由于雅虎退出搜索阵线,我没有找到特别好用的外链和锚文本检索工具,这11万中一定也包括很多无效的链接或者文本链接,同时,域名中的英文关键词与品牌标题一致也会增加反链统计数。然而毫无疑问,我们已经找到了答案。收录24,反链11万。

  我记得上一个给我类似感觉的网站,叫做“麦包包”,高达65万的反链,连淘宝都甘拜下风。

  仔细查看这些反链,我们发现了一位极为高明的SEO外链老手的痕迹,而且几乎都是新闻站的软文。由于软文本身存在被转载的可能,大量增加了domain在文本层面上的曝光几率。这也侧面证明,非锚文本链接对企业主站的意义,也一定程度上证实这样一句话:“只有几个人表扬你,有人会不服;但是成千上万人表扬你,不服也得服。”

  百度无疑是服了,这就是百度的算法吗?在这样热门的关键词排名中,在网站被举报欺诈的情况下依然给出这么显赫的排名?这让那些因为相信百度而购买了接近2000元却用着MTK6573芯片的垃圾无售后山寨平板的普通用户作如何想法?

  真是可悲,和五年前一样,其实什么都没有变。大道至简,唯“多”不破。

  来源:投稿,作者:Shepherd, 原文链接

评论《可悲的百度算法机制》的内容...

相关文章:


微博: 新浪微博 - 腾讯微博 - 月光博客媒体交流QQ群:262102629
月光博客投稿信箱:williamlong.info(at)gmail.com
Created by William Long www.williamlong.info


相关 [百度 算法] 推荐:

算法--两道百度笔试题

- Bloger - 博客园-首页原创精华区
  今天看到一位园友写了一篇关于百度的面试题的博客,成了评论头条,再下看了一下,非常感兴趣,那位博主的算法能力跟我一样需要提高,估计他的功力还在我之下,所以再下不才,在这里把自己的源码贴出来.          百度面试题(一):假设一整型数组存在若干正数和负数,现在通过某种算法使得该数组的所有负数在正数的左边,且保证负数和正数间元素相对位置不变.

可悲的百度算法机制

- - 月光博客
  最近似乎已经很少看到有关于SEO的相关文章了,这是不是印证了《 SEO已死》这篇文章. 可能,也许在中国,真正的SEO离死真的并不遥远了.   最近有个朋友频频跟笔者抱怨,网站无法被百度正常收录,几个关键词的排名也是好几个月没有动过了. 这位朋友是个专心做内容的家伙,因为时常被我灌输“内容为王”的理念,而他网站的相关行业客户对象一般都是年龄较大的互联网用户,在分享传播和外链上,几乎不能指望靠优秀的内容达成,所以在外链规模上十分有限.

转载:百度百科经典算法集合

- 甜菜 - 博客园-aspirin
排序算法:http://baike.baidu.com/view/297739.htm . 冒泡排序法:http://baike.baidu.com/view/1313793.htm . 起泡法:http://baike.baidu.com/view/174304.htm . 鸡尾酒排序:http://baike.baidu.com/view/1981861.htm .

王通:百度算法变化分析与SEO对策

- - Web2.0 News
6月份,百度算法大改变,表现如下:. 1、绝大部分网站在百度的收录量都下降了,包括众多收录千万的大型网站的;. 2、估计有2%~3%的网站直接被百度封杀了,在百度中没有排名或者彻底被拔毛;. 3、百度快照数据经常出问题,例如无快照,甚至新域名新网站显示2003年的快照. 假原因:打击伪原创,提升用户体验.

百度“石榴算法”的发展趋势

- - 月光博客
  据百度站长平台 报道,百度即将针对低质量页面将进行一系列调整,称之为石榴算法. 第一期将对此类页面生效:含有大量妨碍用户正常浏览的恶劣广告的页面,尤其以弹出大量低质弹窗广告、混淆页面主体内容的垃圾广告页面为代表.   石榴算法上线后,广告少、无弹窗的优质页面排序有所提升,相应的含有恶劣弹窗、大量混淆页面主体内容等垃圾广告的页面排序会大幅下降.

百度调整移动搜索排序算法,鼓励网站移动化

- - ITeye资讯频道
近日, 百度宣布开始对移动搜索排序算法进行调整,鼓励网站运营者与站长进行手机页的优化. 同时,还将为站长和开发者提供手机建站、提交和优化等全套免费服务. 此前,谷歌也宣布其 GoMo服务与DudaMobile合作,免费提供网站移动化服务. 据了解,2011年中国移动互联网用户规模达4.3亿,环比增长50%,但传统网页的终端适配一直未能得到有效解决,影响了这一移动用户群体的应用体验.

百度急了

- - 创业家杂志社
来源: 21世纪经济报道 作者:汤浔芳. 2013年1月,百度CEO李彦宏在百度2012年表现中“公司系数”一栏的打分是0. 在不少员工看来,这是Robin(李彦宏的英文名)对百度在“移动互联网”上的表现不满意. 这个史无前例的差评让不少员工开始在网上吐槽年终奖会不会大幅缩水,因为公司系数占年终奖的30%.

该死的百度

- 菡萏 - Pure Pleasure - Reborn
之前,百度把收费的医药、医院广告链接掺杂在搜索结果里,被央视点名批评(其实谁都知道它们都心怀不轨),但百度是不怕的,受伤的是民众、草根,发不出声音——于是此事不了了之(后来的结果是李彦宏在央视打广告、上春晚). 再后来,百度封杀淘宝联盟的40万站长,很多小站被迫停止运营;站长们跑到百度办公楼前抗议,但百度是不怕的,因为这些站长还是发不出声音(网站都开不下去了,只能亲自示威)——于是此事再次不了了之⋯⋯可这次,百度惹到作者头上了,别管这些作者质量是否良莠不齐(韩寒、郭敬明、贾平凹、王三表等等一并出现在声讨百度的队伍中),但他们是天然的“自媒体”,百度开始以为没事儿,两三天下来才发现捅了马蜂窝⋯⋯.

百度献礼门

- Shawn - wsmlby的Plog
来源: 温广阳KinKer的日志. 如果你以为我单指在百度里面输入“建党”就会看见的红旗赞歌的话,你就大错特错了. 本来这种媚上的传统也算是几千年文化的一部分了,无需大惊小怪,发这样的状态,估计只会被认为是抓住一切机会讥讽社会主义伟大建设的行为,所以我看见梅姐也同瞎就很开心地继续复习了,但是师傅说他献了整整10束花才发现没有献花上限,令我心里陡然一动.

缓存算法

- lostsnow - 小彰
没有人能说清哪种缓存算法由于其他的缓存算法. (以下的几种缓存算法,有的我也理解不好,如果感兴趣,你可以Google一下  ). 大家好,我是 LFU,我会计算为每个缓存对象计算他们被使用的频率. 我是LRU缓存算法,我把最近最少使用的缓存对象给踢走. 我总是需要去了解在什么时候,用了哪个缓存对象.