社交网站的使用记录能够预测各种个人信息
- - 心理科学流出版在互联网时代,隐私泄露已经成为一个非常普遍的问题. 近期的一项 研究表明,即使你没有把个人信息直接放到网上,只要提供了你的社交网络使用记录,统计模型就能把你的各种信息相对准确地推算出来. 来自剑桥大学的Kosinski等人通过Facebook上的应用收集了58000人的数据,包括他们的“Like”记录、人口学信息,以及各种心理测验的分数.
在互联网时代,隐私泄露已经成为一个非常普遍的问题。近期的一项 研究表明,即使你没有把个人信息直接放到网上,只要提供了你的社交网络使用记录,统计模型就能把你的各种信息相对准确地推算出来。
来自剑桥大学的Kosinski等人通过Facebook上的应用收集了58000人的数据,包括他们的“Like”记录、人口学信息,以及各种心理测验的分数。接下来,研究者建立了统计学模型,使用“Like”记录来预测后两者。
结果显示,“Like”信息能够以95%的准确率预测种族(黑人还是白人),预测性别的准确率有93%,预测性取向的准确率为88%。此外,预测单身状况的准确率是67%,预测饮酒、吸烟和药物使用的准确率也可达65%-73%。就连预测21岁时父母是否已经分居,准确率也有60%。
对于性格、智力等心理属性,模型也表现出了很强的预测力。对于开放性这样的性格特质,预测准确性甚至与人格量表的信度处在同一水平。
研究者还 给出了对于各项信息预测力最强的“Like”条目,其中有许多有趣的趋势。比如,智力高的用户更喜欢《教父》、莫扎特和 囧司徒的Daily Show;内向的人更喜欢游戏和动漫;是否喜欢科学既可以预测较高的智力,也可以预测较低的生活满意度。
研究者认为,这种技术既有好的方面,也有不好的方面。准确地预测个人属性和偏好,可以帮助改进在线广告等服务;但是,这也让个人保护自己的隐私信息变得更加困难。
这项研究即将发表在Proceedings of the National Academy of Sciences上。