猫王VS耶稣:网页排名系统告诉我们谁更重要

标签: 猫王 vs 耶稣 | 发表时间:2014-01-20 11:12 | 作者:Luiz
出处:http://select.yeeyan.org

译者: Luiz 原文地址: newscientist.com

笛卡尔:排在历史重要人物的第82位

       伊萨克·牛顿、耶稣、亚历山大大帝,我们应该把谁排在第一?猫王排在笛卡尔旁边合适么?

       提出这样的问题一度会被人嘲笑。现在就不同了。我们可以理性地把他们拿出来做比较,就像比较Twitter是不是比Apple更值得投资一样。这正是《谁更重要:历史名人到底排第几?》(Who’s Bigger? Where historical figures really rank)的真正目标。作者是来自由纽约州立大学的计算机科学家斯蒂芬·斯基那与谷歌软件工程师查尔斯·沃德。

       他们进入世界历史的工具是华尔街交易员和棒球队经理最爱的量化分析工具。从一开始他们的兴趣就有别于传统历史,而在于历史编纂学——一门以历史为研究对象的学科。他们试图计算哪个历史人物得到了我们最多最持久的关注。由于这些历史人物已成为文化基因(memes),所以猫王与笛卡尔的较量就变为这样一个问题:“你什么都不是就是只猎犬”(ain’t nothin’ but a hound dog)与“我思故我在” (cogito ergo sum) 哪一句更有感染力。

       答案很明显,因为在历史百大重要人物的名单中,猫王排在69位,而笛卡尔排在82位。这份名单来自斯基那与沃德自创的一套排名算法,他们的灵感来源是谷歌的网页排名(PageRank)系统——关注个人主页上有多少连向其他维基页面的链接。这项测算名为重要性(gravitas),接下来还要结合条目长度、修订历史和每月点击量等,得出两位作者称为知名度(celebrity)的数值。这项数值还要经过“名声衰减度”调整,用来估测某人在淡出人们记忆之后名声将如何下降。

       在2010年10月11日这个模型启动的那天,维基百科上共有843790人拥有个人主页。如今他们中的每一位,从耶稣(1)到合气道大师三枝龍生(843790),都被简化成一个数字。

       但是似乎耶稣的得分高于三枝龍生,跟笛卡尔的名次排在了猫王之后并不是一回事。为了验证他们的算法,两位作者选取一些在相同小分类中的人物(美国总统,棒球明星),把他们的排名与专家/大众排名或者比赛数据相比较。在检验了一共九个小分类中的数十份列表后,他们发现在他们的排名与那些公布过的名单之间有着0.554的平均相关,显著高于在这个分类中公布过的所有名单之间的平均相关值0.49。

       比如说,下面是著名科学家的排名:12 达尔文;19 爱因斯坦;21 牛顿;31 林奈;44 弗洛伊德;49 伽利略; 74 哥白尼; 81 培根; 103 托勒密;112 巴斯德;156 开普勒; 1755 法拉第; 216 胡克; 250 孟德尔; 276 拉瓦锡。

       尽管如此,这些互相比较的人物之间并没有真正的联系,那么这样的排名意义何在呢?斯基那和沃德自称他们的分析提供了一个全新的解读历史的角度,虽然听起来这很有前景,但是他们给出的结论要么过于浅显,要么是胡乱猜测。比如说,他们根据历史知名度来计算出耶稣的签名应该价值5780960英镑,由于缺乏古代手稿资料,让事情变得有点棘手。

       这实在很有趣,名声之间的对阵是个很不错的娱乐方式。而且聪明的是斯基那和沃德还做了一个手机应用。稍微严肃一点,历史学家将会好好利用量化分析了——他们俩的模型也许能够帮助历史学家与维基百科较量一下。

       可是两位作者想把这份排名作为教科书的教育指南,这会带来负面影响。对于11岁以下儿童的教育,斯基那和沃德的想法是尽量选择那些排名靠前的人物而不是那些靠后的人物,并且要把那些排名在5000开外的人“打入冷宫”。

       斯基那和沃德的技术是全新的,但是他们对历史的“强人”视角却是完全落伍了。名望是关乎语境的。

相关 [猫王 vs 耶稣] 推荐:

猫王VS耶稣:网页排名系统告诉我们谁更重要

- - 译言最新精选
译者: Luiz 原文地址: newscientist.com. 笛卡尔:排在历史重要人物的第82位.        伊萨克·牛顿、耶稣、亚历山大大帝,我们应该把谁排在第一.        提出这样的问题一度会被人嘲笑. 我们可以理性地把他们拿出来做比较,就像比较Twitter是不是比Apple更值得投资一样.

GIF vs APNG vs WebP

- - JayXon
GIF 是一个非常古老的格式,1987 年诞生,最后一个版本是 1989 年. (这就是为什么 GIF 文件头的 magic number 是 GIF89a). APNG 相对新一些,是 Mozilla 在 2004 年推出的,十几年的科技进步是不容小觑的,所以 APNG相对于 GIF 的优势十分明显,后面会分析.

转 redis vs memcached

- - 数据库 - ITeye博客
传统MySQL+ Memcached架构遇到的问题.   实际MySQL是适合进行海量数据存储的,通过Memcached将热点数据加载到cache,加速访问,很多公司都曾经使用过这样的架构,但随着业务数据量的不断增加,和访问量的持续增长,我们遇到了很多问题:.   1.MySQL需要不断进行拆库拆表,Memcached也需不断跟着扩容,扩容和维护工作占据大量开发时间.

NOSQL数据库大比拼:Cassandra vs MongoDB vs CouchDB vs Redis vs Riak vs HBase

- - 博客园_Ruby's Louvre
话说,尽管 SQL 数据库一直是我们IT行业中最有用的工具,然而,它们这样在行业中超过15年以上的“转正”终于就要寿终正寝了. 现在,虽然关系型数据库仍然无所不在,但它越来越不能满足我们的需要了. 但是,各种 "NoSQL" 数据库之间的差异比当年众多关系型数据库之间的差异要大许多. 这就加大了人们在建设自己的应用是选择合适的数据库的难度.

耶稣不可告人的秘密

- lzhi - Lzhi's Views
纪晓岚与和珅的经典对白(和绅说得是实话啊). Apple新老大:硅谷最有权力的Gay. 本文网址:http://www.lzhi.org/views/657028. 欢迎加入500人超级QQ群:108869281,交流最新好文章.

普通 vs 文艺 vs 二逼

- 貝殼 - The Only Exception

服务发现:Zookeeper vs etcd vs Consul

- - 企业架构 - ITeye博客
服务发现:Zookeeper vs etcd vs Consul. 【编者的话】本文对比了Zookeeper、etcd和Consul三种服务发现工具,探讨了最佳的服务发现解决方案,仅供参考. 如果使用预定义的端口,服务越多,发生冲突的可能性越大,毕竟,不可能有两个服务监听同一个端口. 管理一个拥挤的比方说被几百个服务所使用的所有端口的列表,本身就是一个挑战,添加到该列表后,这些服务需要的数据库和数量会日益增多.

学界 vs. 商界

- Yuli - 科学松鼠会
汉化: Oicebot & Ent. 0x5f375a86来自一个传奇算法,出自John Carmack开发的《雷神之锤3》的3D引擎. 这个引擎的源代码里包括一个反平方倒数的算法,其速度要比标准的牛顿迭代法快上几十倍,而其中的关键是一行神秘的代码和一个莫名其妙的数字:[ i   = 0x5f3759df - ( i >> 1 ); // what the fuck.

颈椎vs坐姿

- nanoac - 小步的漫画日记