阿北:豆瓣电影评分八问

标签: 豆瓣 电影 | 发表时间:2015-12-18 14:45 | 作者:
分享到:
出处:http://news.cnblogs.com/

这是一篇豆瓣创始人&CEO 阿北(杨勃)刚刚发表的 长文,始终被认为理想主义的阿北,在文中阐明了豆瓣电影评分的原则和做法,用以保护公众对豆瓣评分的信任。随着“豆瓣的电影评分在影视行业的影响越来越大”,阿北说豆瓣收到的威逼利诱也多起来……以下为全文。

阿北:豆瓣电影评分八问

(豆瓣 CEO 阿北,图片来自 Qdaily)

这是篇长文,没空的话,看下大意:豆瓣电影评分在过去十年里一直中立地还原观影大众的平均看法,影视市场的爆发正给这一工作带来更大的外部压力,我们会继续满怀诚意地保护公众对豆瓣评分的信任。

我是豆瓣的创始人,也一直是豆瓣的 CEO。我还写过计算豆瓣评分的最早的几版代码(不难,加起来除下人数)。

除了最早的几年之外,我不直接负责豆瓣电影。但电影评分的大原则和策略,包括和商业独立的原则最早的时候是我定的,后来一直也没变过,期间少数个案也会被捅到我这里拍板。所以以下说的你可以认为是我的个人看法,也可以看作是豆瓣的“公司意志”。

因为用户的力量,豆瓣的电影评分在影视行业的影响越来越大。这两年电影的商业体量激增,评分的影响也跟着变得重要。无论雨点大小,“水军”的雷声越来越大。我们收到的威逼利诱也多起来,诸如“不开个价给水军放行,就找媒体黑你们”之类的。这些让我们觉得,不管愿不愿意,豆瓣的评分会更频繁地被推到风口浪尖。

我们一直认为提供一个真正可信的服务就好了,不需要整天说自己。但现在看起来保护公众对豆瓣评分的信任变成另一个工作,我们需要清楚明确地表达豆瓣的原则和做法,避免可能会出现的误解,让豆瓣评分对影视行业的成长继续有积极和健康的贡献。

一:豆瓣评分是谁定的?

很多评奖的场合有“专家评审团”和“大众评审团”。豆瓣没有专家评审,但有一个一亿多人的大众评审团。

豆瓣的注册用户看完一部电影,心情好的话会来打个一到五星的分(有时候心情不好也会来)。比方说一部电影有 42 万用户打分。我们的程序把这 42 万个一到五星换算成零到十分,加起来除以 42 万,就得到了豆瓣评分。这个评分会自动出现在豆瓣各处,中间没有审核,平时也没有编辑盯着看。每过若干分钟,程序会自动重跑一遍,把最新打分的人的意见包括进来。

那 42 万用户里可能包括资深电影评论家,可能包括你、你的亲戚、你的小学同学、早晨卖你油条的那个人,也可能包括阿北我个人。但每个人都是一票。这个是“大众评审团”应该的含义:不是说团里的人全都大众,而是说和大众一样一人一票。

豆瓣的工作人员偶然收到“我明明给这个片子打了五星,为什么评分一点没变”的投诉的时候,除了心里嘀咕一下“哎,你拿这些红人/独生子女/八零后/九零后/零零后/数学不好的人怎么办”以外,会(或者应该)这样耐心解释:评分实际是变了,只是在小数点后四位,被四舍五入掉了,但如果有几千个人和你一样都打五星的时候,分数就会变。

“一人一票”唯一的例外,是豆瓣的程序判断是“非正常打分”的帐号。这些打分会被排除在外。具体下面会说到。

豆瓣电影评分的主旨和原则,是“尽力还原普通观影大众对一部电影的平均看法”。这个主旨过去十年没变过,将来也不想变。

它并不是专家、影视从业人员或者资深人士对电影的看法,虽然这些看法会被豆瓣算在“普通观影大众”之内。所以有次听到“豆瓣电影评分不专业”的说法的时候,我的反应这是在说“大众不专业”,应该怪语文才是。个人认为汇总专家意见会是另一个很有价值的服务,但这个确实不是豆瓣评分的宗旨。

二:豆瓣评分反映文艺青年的喜好吗?

早已经不是了。

早些年可能是的,因为来打分的人里文艺的比例要比街上的比例高些。但是现在每个月有一亿上下的人会用到豆瓣的评分,我不觉得咱们文艺青年的势力变这么大了。基本能确定现在豆瓣评分反映了大众观点。只是这个“大众”更集中在一二线城市里,和豆瓣用户扎堆的地方一致。

换种说法,在所有去电影院看电影的“大众”和所有看电视的“大众”之间,当前(2015 年)在豆瓣打分的人更接近去电影院的那个。

有些独立电影只有文艺青年会找来看,所以得到的是文艺青年给的平均分。你又不文艺,就因为分数高也找来看,然后… 这不能怪豆瓣,更不能怪她们。但很多东西都是这样的,评分只是判断用到的一部分,经常更重要的是“听说”和“选择”。这个下面也会说到。

三:为什么我喜欢的/我讨厌的/我拍的/我导的/我投资的电影/电视剧会在豆瓣上的评分低得/高得不正常?

所有电影都有众口难调的问题。最好的不是所有人喜欢的,所有人喜欢的不是最好的。

人对一件事情有感情投入,或者有明确爱憎的时候,会投射到别人身上,认为别人应该会有同感。这个当爹妈的都知道。“别人”汇总起来就变成“多数人应该“或者是“正常人应该”。看到有同感的时候我们感觉好,没看到的时候我们不是一下子能接受。你我都这样,没什么奇怪的。

在评分这件事上,看到评分和自己想法一致,觉得豆瓣靠谱,看到不一致,觉得豆瓣不靠谱。这种反应也正常。但“豆瓣”后面只是很多个“别人”而已,不多不少。你和别人平均看法不一致,可以冷静下来再下结论。未必别人不正常,也未必背后有阴谋。这也不一定是坏事,大众经常是错的,至少你是有主见的。

我也是一个创造东西的人,做过一些个靠谱不靠谱的互联网产品。我非常明白自己的作品出来的时候,希望和相信别人会喜欢的心情。事实是,自己和别人的喜好都很难把握,碰壁难免,但下次我们还会“爱上自己的作品”。这是创造的代价,我们自找的,也是我们着迷于此的一个原因。

四:水军是怎么回事,豆瓣评分可刷吗?

水军是有的,但豆瓣评分很难刷得动。

电影这个行业大了,怪事就多。我们把“老子还就不信了,我就要把这个平均分抬高/拉低”动力之下的打分行为统称为“非正常评分”,或者说打分的目的是为了直接干预平均分数。我个人印象里,“非正常评分”大致有四类:注册/收购帐号刷高分的,注册/收购帐号刷低分的(这个我也百思不得其解过),明星粉丝团“进攻豆瓣”的,铁杆用户“捍卫豆瓣评分公正”反水行动的。应该还有别的,比方说行为艺术什么的。

以上听起来吓人,对豆瓣评分的影响其实没那么大,小影响还是短暂和个别的。因为正常打分的人实在太多了,也因为反刷分早已经是豆瓣电影日常工作的一部分,不少同事借助更多的程序一直默默在做。

豆瓣这两年的原则是“所有能判断属于非正常评分的一概不算”,不分高低贵贱颜色。(捍卫评分公正的用户,真的抱歉加感激。但这应该是我们的工作,不是大家的,一时没做好是我们失职。)。

“不算”非常简单可操作,但“判断属于非正常评分”不是那么直接。豆瓣一代接一代的算法工程师、程序员、编辑和产品经理在这件事上贡献过才智,最后都落实在二十四小时跑的大小程序上面。这确实是持续的、魔高一尺道高一丈的事情。但现在门槛已经很高,声称能刷分的基本是在骗人。

刷分基本无效之后,干扰豆瓣评分的努力在向“社会工程”进化:针对具体一部片子制造“豆瓣评分有问题”的舆论,想办法打击豆瓣评分整体的公信力,或者直接对豆瓣的工作人员施加心理压力。行业变化很快,不知道将来会变成怎样,但豆瓣自己的想法和立场可以是不变的。

五:有没有一劳永逸完全解决水军问题的办法?

一劳永逸的办法可能没有。但当下来说,水军的千军万马跳进来,让评分的湖面一点涟漪都不起的办法是有的,但对正常打分用户的感受可能略有影响。我们在积极地准备,需要的时候可以推出。

六:我可以做点什么让我的片子在豆瓣评分高一点?

“找豆瓣的人”是最没用的。不少人试过,大大佬托大佬也直接找到过我。江湖这么大,有用的话早会有人知道,你可以去四处打听一下。据我所知,整个豆瓣系统里没有“修改电影平均分”的后台功能。

刷分上面说过了,越来越没用。所以我确实不知道除了拍好电影,能做什么。

但是最近有转行做电影的老朋友问我同样的问题。直接回答“拍更好看的电影就是了”估计会被他扁。所以我第一次站在片方的立场想了这个问题,答案还是没有。但我给了些观察希望对他有用,以下是大致的意思。

一部电影的豆瓣评分是来评分的人群的平均意见决定的。按道理、平均来说、其他都一样的时候,不怎么宣传就会来看一部电影的人倾向于打高分,但人少;本来不会喜欢、因为大规模宣传建立了高预期来看的,倾向于打低分,但人多。这也是独立电影为什么有时候评分很高(只有粉丝来打分),而票房奇迹有时候评分很低(把不会喜欢的人也宣传来了)的原因。

所以叫好和叫座,高分和票房的确有一些本质的冲突,只有真正广受欢迎的电影能化解这个冲突。除了拍更好的电影永远是王道,把握好宣传的度也比较重要,过度宣传可能会拉低评分。

最后我问这位朋友:口碑还是票房,哪个对你更重要?他的回答比较吐血,这里就不复述了。但我觉得,他的电影好的话,到最后这不会是一个纠结的问题。

七:豆瓣电影评分和豆瓣电影商务是什么关系?

简单地说,没有关系,我们也不想有关系。具体可以分现在的商务和将来的商务看。

豆瓣目前来源于电影行业的主要营收渠道是电影的宣传广告。形式是广告 banner,卖点是“让更多人知道你的电影/电视剧”。经常需要电话里澄清“但是卖点不包括更高评分“,我觉得我的同事挺累的。这件事的收入也只是豆瓣整体收入的零头,如果容易起误会我们可以另作打算。

电影行业里更大的商业机会豆瓣会当仁不让地去争取,只要不会影响到公众对豆瓣评分的信任。内部做到真正的独立比较容易,可以用结构、制度和防火墙做到。稍难的是避免市场和公众的认知被轻易误导,或者说避嫌。只要新的模式依赖于豆瓣整体数据之上的宏观判断,而不是直接依赖评分,我们相信很多事可以做,也想很快开始做。

从管理和团队一致性的角度看,我在公司各种内部场合、在几百人的年会上讲过和这篇问答大同小异的东西(要精简一些,因为得站着讲),所以我的同事大都知道和评分中立原则偏离是极端严重的错误。在和评分有关的事情上,到今天我个人没有发现过一例本质的执行错误。更重要的是如果过去或将来有错误的话,豆瓣作为一个公司有诚意和意志保证发现后能马上得到纠正。

八:你为什么这个时候出来写这个东西?

我们以前认为提供评分服务需要保持中立和独立是天经地义的事情,没什么好公开标榜的。碰到有意无意曲解豆瓣评分原则的,我们也很少出来辩护,我们觉得只要每个月有上亿的人信任豆瓣就够了。但影视行业最近的变化,让我们直接感觉到低调在这个时候可能是不明智的。

但我确实看到行业中具体的个人,曾经都是有理想抱负的年轻人,所以除了沟通走样和误会的原因,我也猜测行业正在催生一些结构的问题。我直觉判断,今天可能是一个岔路口,现在有必要把豆瓣的立场一次表达清楚,以免猜测和误解引发的博弈把行业的一角推向我们最终都不喜欢的方向。

豆瓣一直是用户的朋友,我们希望一直也是影视行业的朋友。我很想看到行业能一直健康地发展下去,相信一个满怀诚意的、中立的评分服务对整个行业在结构上是长期有益的,也相信一个透明地传达观众看法的地方对行业里个人的职业成长也有微薄但是长期的帮助。

— 阿北

本文链接

相关 [豆瓣 电影] 推荐:

阿北:豆瓣电影评分八问

- - 博客园_新闻
这是一篇豆瓣创始人&CEO 阿北(杨勃)刚刚发表的 长文,始终被认为理想主义的阿北,在文中阐明了豆瓣电影评分的原则和做法,用以保护公众对豆瓣评分的信任. 随着“豆瓣的电影评分在影视行业的影响越来越大”,阿北说豆瓣收到的威逼利诱也多起来……以下为全文. (豆瓣 CEO 阿北,图片来自 Qdaily).

Java豆瓣电影爬虫——抓取电影详情和电影短评数据

- - ImportNew
采集豆瓣电影数据包括电影详情页数据和电影的短评数据. 需要保存这些详情字段如导演、编剧、演员等还有图中右下方的标签. 需要保存的字段有短评所属的电影名称,每条评论的详细信息如评论人名称、评论内容等. 有了如上的需求,需要设计表,其实很简单,只需要一张电影详情表movie和一张电影短评表comments,另外还需要一张存储网页提取的超链接的记录表record.

豆瓣9.0分以上的好电影,值得收藏

- sky - 情迷好莱坞 – Mtime时光网
地球脉动 Planet Earth. 导演 : Alastair Fothergill. 主演 : David Attenborough/Sigourney Weaver. 评分:9.7  ★★★★★. 肖申克的救赎 The Shawshank Redemption. 导演 : Frank Darabont.

豆瓣电影2011年度清单总汇

- - 人在旅“图”
2011豆瓣电影年度总榜单,豆瓣红人影志整理,很全很强大. 2011是否遗漏了哪些好电影,参考比对一下吧. 所选范畴为2011年上映或发行的国内外所有影片,根据豆瓣用户评分+看过(在看)人数排序. ★  2011豆瓣电影【欧美20佳】. 勇士 Warrior 8.8 17872. 浮生一日 Life in a Day 8.8 11879.

算法工程师如何改进豆瓣电影 TOP250

- - 豆瓣blog
影迷们经常关注的电影排行榜里,一部由100人评出9.0分的电影,和一部由10000人评出8.0分的电影,谁应该排在前面呢. 这是我们算法工程师时常会面对的问题. 一些深度影迷可能会想到 imdb.com (互联网电影数据库) 所采用的贝叶斯公式[见附注],这个公式的思路就是通过每部影片的[评分人数]作为调节排序的杠杆:如果这部影片的评分人数低于一个预设值,则影片的最终得分会向全部影片的平均分拉低.

使用Spark MLlib给豆瓣用户推荐电影

- - 鸟窝
推荐算法就是利用用户的一些行为,通过一些数学算法,推测出用户可能喜欢的东西. 随着电子商务规模的不断扩大,商品数量和种类不断增长,用户对于检索和推荐提出了更高的要求. 由于不同用户在兴趣爱好、关注领域、个人经历等方面的不同,以满足不同用户的不同推荐需求为目的、不同人可以获得不同推荐为重要特征的个性化推荐系统应运而生.

为豆瓣电影实现User-based协同过滤的推荐系统

- - 鸟窝
协同过滤(Collaborative Filtering),简单来说是利用某兴趣相投、拥有共同经验之群体的喜好来推荐使用者感兴趣的信息,个人透过合作的机制给予信息相当程度的反馈(如评分)并记录下来以达到过滤的目的进而帮助别人筛选信息,反馈不一定局限于特别感兴趣的,特别不感兴趣信息的纪录也相当重要,比如浏览信息,收藏,分享,点击等.

为豆瓣电影实现Item-based协同过滤的推荐系统

- - 鸟窝
前面的两篇文章分别使用Spark mllib ALS实现了Model-based协同过滤推荐系统和使用Mahout实现了User-based的协同过滤推荐系统. 我们再来回顾一下item-base CF算法的特点:. 物品数明显小于用户数的场合,否则物品相似度矩阵计算代价很大. 适合长尾物品丰富,用户个性化需求强的领域.

豆瓣电影2016榜单:有人选择看到这世间的丑恶,有人选择看到美好

- - PingWest品玩
面对近日的“恶评”风波,豆瓣的回应是一份榜单,一份满载好电影的榜单. 28 日晚上,豆瓣电影发布一年一度的榜单. 这份榜单是基于 2016 年豆瓣用户在豆瓣平台对影视作品的评分、标记和访问数据,再结合评价人数和上映时间,综合考虑而成. 今年豆瓣有哪些喜闻乐见的好电影. 2016 评分最高的华语电影:《 驴得水》 8.3.

豆瓣显示

- frank - 读库情报站