族群歧视与用户画像

标签: tuicool | 发表时间:2017-04-27 08:00 | 作者:
出处:http://itindex.net/admin/pagedetail

  • 族群标签

题图是这两天的新闻人物美籍越南人 Dr. Dao。美国朋友觉得奇怪,为什么要说他是越南人?我们只认得他是 Asian。另一位 Asian,估计是位澳大利亚籍香港人,发了一条推特说——Dr. Dao 当时反抗的暴力其实是合法的强制执法。第三位 Asian,相信是位中国籍大陆知友,读了这条推特很愤慨,挥键写就高赞爆款推送《比打人更可怕的是国人的落井下石》。

每当读到这些族群标签信息,我们的大脑就会搞一串可能正确更可能错误的神经网络模式匹配;我们的电脑读到这些标签,也会搞一串可能错误更可能正确的统计回归预测。这两种运算的结果就是 歧视(=Discrimination),中英文语义都是贬义。如果不说语义只看字面,中、英文字面都很理中客。比如「犹太人心智超群」这样的反向歧视,一样符合 Discrimination/歧视=「区别对待」的字面意思。

  • 用户画像

让部分国人感到反转的是 Dr. Dao 律师 Demetrio 的声明:不相信这件事的背后有族群歧视动机。如果人脑根据族群标签比如Asian,对客户作出区别对待,这就叫族群歧视动机。如果人脑根据其它公开信息比如头像、姓氏,得到族群标签预测——比如「国人」,然后再作出区别对待,这也叫族群歧视动机。Demetrio 的意思是:不相信美联航经手这件事的职员作了基于族群标签自变量或中介变量的这两种区别对待。

麻烦的是,人工智能不经过人脑,仍然可能作出类似的区别对待。如果美联航的系统用了「用户画像 (Personas)」,就可以对不含族群标签的一摞变量应用机器学习,识别用户的类型加以区别对待。这种歧视甚至可以说是族群歧视的升级版——如果你虽然是 Asian 但不象 Asian 那样,它并不把你与其他 Asian 归成一类;如果你不是 Asian 但象多数 Asian 那样,它仍会把你与多数 Asian 归成一类;如果有两类 Asian 彼此非常不同,它还会小心地分开成两个归类;最妙的是,它并不把归出的类型打上任何族群标签。

与参数节俭的统计回归预测不同,机器学习的区别对待不是在算法层面写入歧视的族群标签,机器学习的区别对待是从数据自身面貌错落识别出歧视。反讽的是,人脑不经深思熟虑的直觉更象机器学习、更不象统计学习——人脑歧视更多时候也不是被教唆的算法,人脑歧视更多时候只是给数据面貌标了政治不正确的族群标签。现在好了,人工智能不仅可以帮人脑背锅完成分类区别对待,甚至可以比人脑更富于理性,甚之又甚者可以比人脑更富于(免于政治不正确的)德性。

  • 心理剖面

用户画像技术近期最重大的进展,是对心理剖面 (Psychological Profiling) 的整合。英国脱欧与川普胜选背后隐藏着同一支代表了先进生产力的团队—— Cambridge Analytica。在这支团队的工作之前,业界的用户画像通常只用到人口学变量、用户行为变量、设备变量。例如 Bilibili 的用户画像,主要通过年龄段、性别、客户端、关注与上传的视频类别,将用户划分为不同的世代。Cambridge Analytica 革命性地引入测评技术已经很成熟的大五模型(Five-Factor Model),具体而言,是五个缩写为 OCEAN 的人格变量——

此前的用户画像只强调大数据,心理剖面反其道而行。从用户行为的一摞自变量到 OCEAN 得分的预测,这一步用的是监督学习范式。建立这个预测模型的样本量虽然不太小(五位数),每个个案的施测成本可也不少。这就不再是大数据而是深数据,得到的预测模型最后再整合到大数据(八位数以上)的多种应用场景。于是,共和党的助选团队从人口学的「区别对待」升级为心理学的「操控干预」,最终在关键选区获取关键优势,打破绝大多数主流调查机构预期,全球政局为之扭转。

如果熟悉同卵孪生相关系数的研究,就比较容易理解心理剖面怎样在技术上革命性地升级了用户画像。基因变量数量极其庞大,如果直接用来预测个体的干预操控效果,只适用大数据机器学习范式。目前基因测序行业还停留在这个层面,为客户作出的各种预测相当不靠谱,典型的预测比如「你得青光眼的概率比普通人高五倍」。但如果研究者掌握了其中一份表现型(同卵孪生兄妹)的关键变量,再从这组关键变量去预测客户的情况,预测的准确程度将大大超出公众媒体的认知。心理剖面先用几万被试烧进好多钱,得到行为变量→关键变量的映射,其精确程度接近于偷看了你克隆兄妹的OCEAN得分。

  • 行为科学的政治正确

用户画像区别对待,怎么听都觉得政治不太正确。心理剖面操控干预更等而下之,可谓看人下菜、对症下迷药。芝加哥机场安保如果用心理剖面,可以对 OCEAN 的 N 高分乘客准备电棍以避免流血——N 高分更倾向抵抗执法暴力;美联航如果采用心理剖面,可以精准筛选 OCEAN 的 A 高分乘客请君出瓮——A 高分更容易配合、更倾向事后不起诉。

用户体验研究下的整个行为设计领域,更是在明火执仗地这么干。行为科学从根子上就是个非常政治不正确的学科。行为科学史许多研究者与极权政体有特殊关系。巴甫洛夫虽然是沙俄旧政权的知识分子,晚年却在苏联获得无上尊崇;民国最有影响力的行为主义学者、复旦心理系之父郭任远,直接参与了黄金十年南京政府的法西斯意识形态工作;斯金纳在美国正相反,被广泛视作政治极其不正确的异类。从行为设计产业回顾,可以发现行为主义学者的政治不正确正是对移动互联世代同一命题的预见前瞻。川普助选团队运用心理剖面破坏民主制度,其背景同样可以在行为科学史往回追溯。

斯金纳有句赤裸裸的名言:「人类的真问题不是如何 破操控获得自由,而是如何改良升级所 的操控」。改良升级操控也许不是人类的真问题,但显然是行为设计的真问题。吊诡的是,行为设计特别强调用户体验的「操控感」,交互界面力求流畅,触控反馈绝少迟滞。那么,行为设计带给用户是操控还是受操控?卡尼曼的峰终律(Peak-End Rule)研究给出一个意外的深刻回答——

用经济学的术语,被试个体在每个时点当下的效用函数与长时段之后的效用函数完全不同,二者仅有近 0.5 的正相关。这个相关系数有多低,可以对比一下由不同家庭收养的同卵双胞胎,他们成年后的心理变量往往有超过 0.7 的正相关。把经济学黑话翻译成心理学黑话——短时记忆的你与长时记忆的你是两个不同的人格,差别要大过不同后天成长环境的遗传克隆同胞。行为设计帮助短时记忆直觉行为的你最大程度地增强操控,让长时记忆日常语言的您更「好」地受操控。

小结一下:用户的行为类型族群分野被无人干预的用户画像更好地识别,人工智能「升级改良」了族群歧视;用户的短时当下人格被无人干预的心理剖面更好地预测,行为设计升级改良了当下人格的操控感体验、同时「升级改良」了长时人格受操控的程度。

相关 Live 广告

  • Live 《习得自助》后半场与文本相关,详见《习得自助》Live 后记
  • 即将开讲的 Live《遗传进化》前半场内容是同卵孪生相关系数研究,为先天基因与后天家庭一解纠结
  • 最早的 Live 《幸福三味》想讲的东西太多,Peak-End Rule 相关内容其实基本没讲,与文本相关内容只讲到「体验内容派生意识自我」
  • 文中还提及 《哔哩哔哩用户画像分析》Live,免费软广没收 B站的钱

相关 [族群 歧视 用户] 推荐:

族群歧视与用户画像

- - IT瘾-tuicool
题图是这两天的新闻人物美籍越南人 Dr. 美国朋友觉得奇怪,为什么要说他是越南人. 另一位 Asian,估计是位澳大利亚籍香港人,发了一条推特说——Dr. Dao 当时反抗的暴力其实是合法的强制执法. 第三位 Asian,相信是位中国籍大陆知友,读了这条推特很愤慨,挥键写就高赞爆款推送《比打人更可怕的是国人的落井下石》.

苹果声称三星违反合理和非歧视条款

- 三十不归 - Solidot
在产品在德国被禁售之后,三星也在世界多个国家发起了反诉. 26日,荷兰法院举行了三星指控苹果侵犯其3G专利的听证会,三星声称苹果没有支付3G专利使用费,而苹果律师则声称三星违反了公平、合理和非歧视条款(FRAND). 苹果声称它通过购买英特尔的3G芯片组而间接的向三星支付了使用费. 三星证实它与英特尔之间有交叉专利授权协议,但指出苹果3G芯片组的供应商英飞凌没有与它达成专利授权协议,而英飞凌直到2011年1月才被英特尔收购,在此之前苹果侵犯了其专利.

[职业生涯] 可笑的年龄歧视

- - 水木社区 今日十大热门话题
发信人: JH2 (Old), 信区: WorkLife. 发信站: 水木社区 (Tue Dec 24 14:19:54 2019), 站内. 有朋友是当猎头的,因此了解到一些信息,一些在网站上发布过招聘信息、但是没有标明年龄限制的,其实是不完整的,猎头手上的招聘信息中,是写明了30岁以下或者35岁以下的.

经济观察报:电信“红名单”是一种严重歧视

- shan - cnBeta.COM
广州中院近日开庭审理了杨先生因不堪忍受短信电话骚扰和个人信息泄露而状告中国电信股份有限公司广东分公司一案. 被告方律师解释,接到传票后,电信公司已经将原告列入一份“红名单”,通知全体代理商不得再向原告电话推销,原告也确实暂时不再接听到类似的电话推销.

用户及用户特征

- Nick - 所有文章 - UCD大社区
要创建1个可以与用户有效交流的网站,必须考虑到与你交流的用户. 理解用户的需求对我们决定网站内容、信息量、用户以及内容结构至关重要. 用户不是被动的接受网站提供的信息,所有人都会不断的地根据自身经验和猜测来理解. 自己在屏幕上看到的内容,即使我们认同是相同语言,但是每个人的理解含义不会完全相同. 我们都会根据自己的知识和经验来理解所看到的内容,(如果你不住再伦敦,就不知道Oyster卡,Oyster卡是乘坐公交交通时用的旅游储值卡).

用户体验

- tal-rasha - 博客园-首页原创精华区
    用户体验是一个很大的话题,先从一个故事说起.     周末参加了两天的PMP培训,听课期间注意到老师的一个细节,在讲选择题的时候,选项A、C读音正常,而“B”老师读为Boy,“D”老师读为Dog.     刚听到的时候大家莞尔一笑,以为这是个善意的玩笑.     很快,我想明白了,B和D的发音类似,容易混淆;Boy和Dog是简单的单词,发音能够明确区分,也没有类似Bog和Doy的读音混淆.

用户研究

- - 技术改变世界 创新驱动中国 - 《程序员》官网
介绍自己的设计流程时,设计师通常都说它是“以人为中心”或是“以用户为中心”的. 笼统地讲,这表示设计师经常要考虑所设计产品的潜在用户,尽力为这些人创造出最好的产品. 这个问题看似简单,实际上却不好回答. 好的设计通常都是从用户研究着手的. 我们如何才能发现人们想要实现的目标. 虽然这样做有时会得到一些有用的信息,但一定要小心地评估人们给出的答案.

Chrome用户比IE用户更聪明?

- - 创意科技 - 果壳网
Calcudoku 根据2010年至2011年间该网站的数独解谜数据,对使用不同浏览器的用户进行了分析. 结果显示,在推解该网站的数独题时,Chrome用户的表现要好于其他浏览器用户. 从Calcudoku发布的分析图中我们可以看出(下图),无论是解4×4、5×5还是6×6的数独,Chrome用户的解题速度都是最快的,火狐和IE用户分列2、3位.

排泄型用户

- Keen - 坏脾气的小肥
很长时间以来,我一直在观察某类行为,最近取了个名字叫“排泄型互动”. 最重的一级当然是辱骂与下流的留言;次一级是理直气壮的弱智言论,比如抵制家乐福(昨天还看到有人说要抵制南京的法国梧桐树,因为看法国不顺眼,只爱护中国植物);最轻的一级则是长年累月发表毫无信息价值的口水评论,如“毒,德味. ”“冬天里把爱洒向人间,洒向朋友的空间.

hotswap 用户手册

- 小丑鱼 - 淘宝JAVA中间件团队博客
关于hotswap(该补丁的网址http://ssw.jku.at/dcevm/). Hotswap  是一个允许在运行状态下无限制的修改加载类文件的Java虚拟机补丁. 当前java虚拟机的动态加载机制只允许修改类的方法体,而打了hotswap补丁以后,可以增加,删除类属性,方法,甚至可以改变一个类的父类.