观点|张富峥:也许没有人比人工智能更懂你?
引用话剧《柔软》一句经典台词,“每个人都很孤独。在我们的一生中,遇到爱,遇到性,都不稀罕,稀罕的是遇到了解”,这里说的“了解”,并不仅仅是专属于文艺青年的诉求,而且在商业应用上也具有举足轻重的作用,比如品牌商的目标用户群体定位、个性化的购物体验、人力资源的管理等,都离不开对人的深入了解。
既然“了解”如此重要,那么,在那些细微的个人性格层面上,谁最了解你,是你的朋友、家人、心理学家,还是越来越聪明的人工智能?
电影《Her》讲述了在不远的未来,人与人工智能相爱的科幻爱情故事:主人公西奥多是一位信件撰稿人,心思细腻而深邃,能写出最感人心肺的信件。他刚结束了与妻子凯瑟琳的婚姻,还没走出心碎的阴影。一次偶然的机会让他接触到最新的人工智能系统OS1,它的化身萨蔓莎有着迷人的声线、心思细腻温柔体贴而又风趣幽默。西奥多与萨蔓莎很快发现他们是如此的投缘,而且存在双向的需求与欲望,人机友谊最终发展成为一段不被世俗理解的奇异爱情——这部电影把人与机器之间的情感交流描绘得惟妙惟肖,在令人惊叹的同时也抛出了一个问题:人工智能是否有可能更懂人心?
比如说,你是豪迈女汉子还是温婉小女子?对这世界充满好奇心、常常创造力井喷吗?是心思细腻、面面俱到,又或是常常心急如焚、怒发冲冠?是放荡不羁爱自由还是勤勉顾家重责任?……对你的了解应该从何做起、如何量度?
在心理学家眼中,精心设计的调查问卷也许是读懂人心最直接有效的方法。然而受限于成本、时间等诸多因素,调查问卷这一方式难以做到大规模的准确了解。进入互联网和大数据时代,用户的行为数据可被广泛收集,而用户的行为又是其内心活动的一个直接反应,那么,根据这些行为数据,用人工智能的方法能不能反向了解这些行为背后的人心?
剑桥大学和哥伦比亚大学的学者据此共同进行了一项研究,比较了人工智能与人类对于个体性格特点进行分析判断的能力。这项研究共收集了近十万名志愿者的信息。研究者要求志愿者填写有关大五人格模型(Big Five Personality)的个性调查问卷,进而得出志愿者在“开放性(openness)”、“尽责性(conscientiousness)”、“外向性(extraversion)”、“随和性(agreeableness)”和“情绪稳定性(neuroticism)”这五个维度上的个性特征。作为对照,研究者先邀请志愿者在脸书(Facebook)上的好友和家人填写调查问卷,了解这些人对志愿者个性的看法。同时,根据志愿者在脸书上的点赞(Like)行为,研究者用机器学习算法建模,形成人工智能对志愿者个性的判断。通过将志愿者的自我评定与人工智能及他人的判断进行比较,研究者首先检测自我评定与他人判断的一致性。由于他人的判断受人际关系的影响较大,因此研究者又进一步将“他人”细分为朋友、配偶、家人、同居者及同事。
如图所示,这个结果展现了人格判断的准确性与点赞数目之间的关系:其中红线代表人工智能对大五人格判断的平均准确性,他人判断的准确性也在这条红线上标出。由于该样本中的个体平均点赞数为227,由此得到人工智能方法在这个点赞数目下的平均准确性为0.56,接近配偶判断的准确性(0.58),远高于家人(0.5)和其他好友(0.49)。同时,随着点赞数目增加,人工智能方法的准确性也有所增强;当点赞数超过500,该判断准确性可达0.66。
这个结果非常有意思:人工智能只需利用人们在社交媒体上的“点赞”行为,就可以相当准确地对一个人的性格特点进行预测。只需要10个赞,人工智能对你的了解就超过你的同事;到70个赞就超过朋友或者室友,到150个赞就超过你的家人,若有300个赞,这时候人工智能对你的了解,就连你的配偶,也就是最熟悉你的人,也自叹弗如。
实际上,不仅点赞行为可以表明(或者说“泄露”)你的态度和偏好,今年我们的研究在此基础上更进一步,表明你在社交媒体上留下的各种足迹,比如发表的文字、照片、表情符以及社交关系等,都能用来预测个体的性格特征。
在这过程中我们还发现了一些有趣的现象:比如外向的人喜欢使用包含笑脸的头像,而内向的人往往在头像中遮挡了面部表情或者使用侧脸;充满想象力的人往往使用和朋友在一起的照片作为头像,而严谨一丝不苟的人的头像很多是自拍照……总体而言,我们的研究表明,单单利用头像这一信息,就能使个体性格预测的准确性到达0.6。如果使用机器学习中的集成学习技术,我们最终设计的人工智能方法能够综合利用社交媒体上的各种足迹,使个体性格预测的准确性到达0.75以上。
以上研究证明,借助人工智能的方法,机器确实有可能越来越了解人类。人工智能带来的不仅是一个梦,更是根据你的喜好、你的性格而精准构建的梦——别忘了,当你注视着电脑、手机,人工智能也在屏幕后面默默注视着你,你在互联网上留下的每一个足迹,都是与人工智能一次美丽的邂逅。
作者简介
张富峥博士,微软亚洲研究院副研究员,从事人工智能和数据挖掘方面的研究。他的研究兴趣包括用户模型、推荐系统、深度学习、情感检测、社交网络、时空数据挖掘、普适计算、大规模系统等领域,并在这些领域的顶级会议和期刊上发表了20余篇论文,如KDD, WWW, Ubicomp, TIST等,曾获ICDM 2013最佳论文大奖。张富峥博士曾任WSDM、APWeb等国际会议和TKDE、TOIS、TIST等国际期刊的评审委员。