相关性问题

标签: 网络随笔录 周末杂谈 | 发表时间:2013-06-22 13:58 | 作者:魏武挥
出处:http://weiwuhui.com

人的本性是趋利避害的,任何合作(或者交易,或者搭伙,或者配对,反正就不是一个人干的事)都会存在三个可能:有利、有害、无利无害。对于合作一方来说,至少应该保持一个无害的结果,这是常识。如果觉得有害的可能性很大,于是,我们就会拒绝合作。

问题在于,谁也不是神仙,没有人可以事先100%断定合作必然会有利或至少无害,于是人们需要很多背景信息来供决策。但背景信息和合作结果不是一个“有此必有彼”的关系,而是一个“有此可能有彼”的关系。嗯,非因果但有相关。

在以下情境中,人们是这么处理选择的:

一,招生。知乎上有人邀请我回答“非名校本科毕业生报考名校研究生会不会被歧视”。我的回答是:会。道理就是一个概率问题:名校本科生成为优秀的研究生可能性比较大——这是因为高考可能是相对最能体现实力的方式之一。一所学校招收学生有限(比如总共只有100个名额),自然这里要挑挑拣拣,选择“学校认为”最好的生源——所谓学校认为最好,就是它认为可能性最大。

二,招聘。公司招人——我这里指应届毕业生——喜欢看学校出身,讲究一点的,还要看你本科出身,即便你是研究生毕业。这里的逻辑是这样的:名校生成为有用员工的可能性比较大。四大这样的机构,轻专业重学校的道理就是这么回事。你进名校,总是说明你有优秀之处,专业不专业不要紧,我们可以培养。问题在于:你是一个可以培养的好苗子吗?名校生和好苗子之间的相关系数较高。

三,择偶。其实我是比较倾向“门当户对”的,因为婚姻真心不是两个人的事,是两个家庭的事。很少有人择偶就只有这么两条件:异性,活的(对不起,可能冒犯了一下同性恋,不过我们国家同性恋婚姻尚未合法,多多海涵)。有的人看似说:哦,我没什么要求,看得顺眼就行——其实这个要求最高不过,娘的,啥叫看得顺眼啊?人们一般情况下总是会列出一些条件,这个条件是干嘛用的?对未来幸福有一定概率上的保证。女性喜欢成功男性,不见得是说看上了他过去赚了多少多少,而是认为:既然在这个社会中能杀出来成为一个成功人士,那么,他的基因想必有较大的概率是好的——这种择偶方式符合物种延续的进化规律。

四,工作中如果面临一些选择,大多数人会选择以前的做法,这叫“循规”。以前这么做结果很好,那么现在这么结果为好的可能性就比较大。如果万一没做好,还有一个借口:以前都是这么干的,言下之意就是和我关系不大。循规是趋利避害的重要法则之一。

在这些情境中,其实我们已经能看到:人们在追求高相关系数以力争结果为好,说白了,这种行为就是歧视。名校歧视非名校本科生,公司歧视非名校生,一个人会歧视ta认为不够成功的异性,做事时对以前没采用过的方法有歧视,等等。歧视的根源在于,人们想要更安全更有保障的未来。既然谁都不能断定因果,那么,只好看过去的一些成绩(成就)来做歧视了。

故而,一个社会,到处充斥着歧视,其实是很正常的。反过来,非名校本科生为啥要一定要读名校研究生呢?非名校生为啥一定要进大公司呢?这里面也是歧视,也是为寻求一个比较稳妥的未来。

—— 转折的分割线 ——

歧视虽然正常,但它是一个社会不断沉沦的重要动力之一,社会会因为歧视而慢慢结构化,社会阶层的相互流动会越来越慢,最终关上了流动的大门。这个社会,就离完蛋不远了。

社会结构化到了一定的程度之后,整个社会死气沉沉。无怪乎清末龚自珍要叹道:我劝天公重抖擞,不拘一格降人才。他这里所谓不拘一格,就是说要破除常规,破除重概率重相关。这个事其实很难。不拘一格的风险非常大,一旦失败,当事人那是“无限责任”。循规蹈矩的失败,当事人是“有限责任”。

但社会里总会有些不安分的人,偏不走寻常路。大多数这样的人死得很默默无闻(死得惨的可能还有闻一些),极少数的人会取得巨大的成功。无论是古代史书,还是现代媒体,这种不寻常的情况实在太少见了,于是便要记录上一笔:比尔盖茨大学没毕业,乔布斯大学没毕业,扎克伯格大学没毕业,谷歌的两位创始人博士没毕业。——再次提醒各位读者,大学没毕业的人,多了去了,呵呵

对于一个社会来讲,应该给予不走寻常路宁愿相关系数小一些的行为者某种机会,或成功的可能。如果不走寻常路的必然后果就是玩完,这个社会就会玩完。但这是站在整个社会层面上的,不走寻常路与结果为好之间的相关系数如果极大,这个社会也会玩完。

好了,现在你是想一辈子卖糖水呢?还是活着就要改变世界?其实都没错。前者对个人更稳妥,后者,对社会是好事——虽然有太多人要失败,但其实文明的进步,本就是建立在太多失败之上的。

转载说明:
1、本博客文字,除特别注明外,均为本人原创,可以自由转载;
2、转载时请注明本人大名,魏武挥,不是魏武辉,不要搞错。
3、转载时请保留此段:本文由扯氮集博主魏武挥原创撰写,欢迎于微信中搜索ItTalks以订阅公众账号,或于搜狐新闻客户端科技频道订阅“魏武挥”


Copyleft © 2013 知识共享署名-非商业性使用-禁止演绎 注意:转载勿改标题!
ItTalks -- 魏武挥的Blog (digitalfingerprint:fc4f8fc31f70097eea4b780b13146415)

欢迎 关注 我的微博
欢迎 订阅我的微信公众账号:ittalks
欢迎 于搜狐新闻客户端中订阅“魏武挥”
无觅猜您也喜欢:

信息传播:表意性?工具性?

规范性研究和解释性研究

一个有趣的问题

就业的问题
无觅

相关 [相关性 问题] 推荐:

相关性问题

- - 扯氮集--上海魏武挥的博客 - 扯氮集--上海魏武挥的博客
人的本性是趋利避害的,任何合作(或者交易,或者搭伙,或者配对,反正就不是一个人干的事)都会存在三个可能:有利、有害、无利无害. 对于合作一方来说,至少应该保持一个无害的结果,这是常识. 如果觉得有害的可能性很大,于是,我们就会拒绝合作. 问题在于,谁也不是神仙,没有人可以事先100%断定合作必然会有利或至少无害,于是人们需要很多背景信息来供决策.

如何使用机器学习解决实际问题-以关键词相关性模型为例

- - Dustinsea
本文以百度关键词搜索推荐工具字面相关性模型为基础,介绍一个机器学习任务的具体设计实现. 包括目标的设定,训练数据准备,特征选择及筛选, 以及模型的训练及优化. 该模型可扩展到语意相关性模型,搜索引擎相关性及LTR学习任务的设计实现. 目标设定:提升关键词搜索相关性. 作为一个搜索+推荐产品,百度关键词搜索推荐系统的产品形态是向凤巢用户推荐适合他业务的关键词.

相关性 ≠ 因果性

- 杀手 - 宇宙的心弦
专家说,常食海参使人变得更聪明. 科学研究表明,20~50岁男人射精越频繁,以后患前列腺癌风险就越低. 是不是为了变聪明我们就要天天吃海参. 是不是为了降低患前列腺癌的风险我们就要天天打飞机. 相信死理性派的读者,不会轻易就得出结论. 但轻易下结论是很多人经常犯的毛病,为了分析类似这种结论的可信程度,我们先来看看这种结论都是如何得出的.

Elasticsearch:什么是相关性

- - 翟志军
我们已经注意到,搜索结果会以相关性的倒序方式返回. 但是什么是相关性,它又是如何被计算出来的呢. 每一份被搜索出来的文档都带有一个由正的浮点数来表示的相关性评分,被称为_score. 这个分数越高,代表这份文档越相关. 查询子句会为每份文档生成一个评分_score. 如何生成这个评分依赖于查询子句的类型.

Lucene TF-IDF 相关性算分公式

- - 鲁塔弗的博客
Lucene在进行关键词查询的时候,默认用TF-IDF算法来计算关键词和文档的相关性,用这个数据排序. TF:词频,IDF:逆向文档频率,TF-IDF是一种统计方法,或者被称为 向量空间模型,名字听起来很复杂,但是它其实只包含了两个简单规则. 某个词或短语在一篇文章中出现的次数越多,越相关. 整个文档集合中包含某个词的文档数量越少,这个词越重要.

社交相关性排序:Google+ 的终极武器?

- rosa - 爱范儿 · Beats of Bits
用过 Buzz 的人都知道,除了暴露隐私的致命弱点,Buzz 还有一个让人讨厌无比的设计:有评论即置顶. 这使得某条信息不断侵占你的时间线. 在刚开放注册的几天,使用 Google+ 也会出现同样的情况,如果你在某条信息发表了一条评论,那么只要别人也发表评论,这条信息就会上升到你的时间线顶部. 难道是 Buzz 的噩梦再现.

稿费问题

- Ruixing F - 创造社新任社长宋石男
据说现在全中国靠给平媒自由撰稿为生的,超不过1000人,而且不少处于相当窘迫的境况,就算想买根绳子来上吊,都买不起质量好的,结果绳子老断. 作为自由撰稿人的一员,我对此深有体会. 1999年国家版权局出台的基本稿酬标准,每千字30元-100元,至今仍为全国发行的报刊的“行业指导价”. 业内估计,全国报刊的稿费中位数大约也就在100元.

lvs 问题

- - 操作系统 - ITeye博客
1: LVS连接的持久时间. 1)同一个ip发来请求到同一台RS的持久超时时间. ipvsadm -A -t 192.168.169.100:80 -s rr -p 120     #该客户的请求120秒内被分配给同一台web.  2)一个链接创建后空闲时的超时时间(分别是:tcp的空闲超时时间、lvs收到客户端tcp fin的超时时间、udp的超时时间).

研究发现素食和低自杀风险存在相关性

- - Solidot
日本国立国际医疗研究中心等研究团队的一项调查发现,越是爱吃蔬菜、大豆、海草、蘑菇等健康食品的人自杀风险越低. 调查对约9万名40~69岁男女的饮食倾向进行了调查,平均追踪时间达8.6年. 研究人员向调查对象询问了摄取134种食品饮料的频度,根据饮食偏好将其分成三大类:(1)蔬菜、大豆等“健康型”;(2)肉类、面包、果汁等“欧美型”;(3)米饭、味增汤等“日本型”.

香港研究称PM2.5浓度和死亡率存在相关性

- - Solidot
香港大学医学院研的科学家完成了一项被官方新闻稿称为亚洲首个长期暴露于空气中的PM2.5粒子对人体健康的研究,发现死亡率和PM2.5浓度存在相关性,居住地的PM2.5浓度越高,死亡率也越高. 研究对像为1998至2001年之间参加健康调查的66820名65岁以上长者,到2011年其中16400名死亡,研究人员运用NASA卫星监控的气溶胶光学厚度数据,推算全港每1平方公里土地面积范围内空气中的PM2.5浓度,再将参与者的住址经地图编码,推算居所位置暴露于PM2.5的程度.