MIT人工智能实验室最新研究成果:AI系统不仅可以识别假新闻,还能辨别个人偏见

标签: 业界 | 发表时间:2018-10-05 18:56 | 作者:
出处:https://www.leiphone.com

互联网时代,假新闻铺天盖地,而且极具迷惑性,Facebook一度深陷虚假新闻的泥淖,不但被控影响了美国总统大选结果,甚至引发了 德国政府的巨额罚金

甚至连以公信力著称的BBC也难以幸免,比如BBC北安普顿分站的推特账号就曾发过这样一条消息:Breaking News: President Trump is injured in arm by gunfire #Inauguration.(劲爆消息:特朗普总统在就职典礼后遭遇枪击,手臂受伤。)

至于国内的假新闻,也是花样百出,甚至微信对话也能伪造,PS技术出神入化,比如一度引爆互联网圈的这个截图:

雷锋网注:此截图被证实为经过PS伪造

AI系统:建立多维度向量进行数据检测

10月4日,麻省理工学院计算机科学与人工智能实验室(CSAIL)在其 官网发布了一则新闻,宣称该实验室与卡塔尔计算研究所(Qatar Computing Research Institute)的研究人员合作,已经研究出一种可以鉴别信息来源准确性和个人政治偏见的AI系统,该研究成果将于本月底在比利时布鲁塞尔召开的2018自然语言处理经验方法会议(EMNLP)上正式公布。

研究人员用这个AI系统创建了一个包含1000多个新闻源的开源数据集,这些新闻源被标注了“真实性”和“偏见”分数。据称,这是类似数据集中收录新闻源数量最多的数据集。

研究人员写道:“打击‘假新闻’的一种(有希望的)方法是关注消息来源。”“虽然‘假新闻’(帖子)主要在社交媒体上传播,但他们仍然有最初来源,即某个网站,因此,如果一个网站曾经发布过假新闻,很有可能未来还会发布。”

AI系统的新颖之处在于它对所评估的媒介有广泛的语境理解,没有单独从新闻文章中提取特征值(机器学习模型所训练的变量),而是兼顾了维基百科、社交媒体,甚至根据url和web流量数据的结构来确定可信度。

该系统支持向量(SVM)训练来评估事实性和偏差,真实性分为:低、中、高;政治倾向分为:极左、左、中偏左、中偏右、右、极右。

根据该团队所述,系统只需检测150篇文章就可以确定一个新的源代码是否可靠。它在检测一个新闻来源是否具有高、低或中等程度的“真实性”方面的准确率为65%,在检测其政治倾向是左倾、右倾还是中立方面的准确率为70%。

雷锋网注:AI系统分析示例

在上图显示的文章中,AI系统对文章的文案和标题进行了六个维度的测试,不仅分析了文章的结构、情感、参与度(在本例中,分析了股票数量、反应和Facebook上的评论),还分析了主题、复杂性、偏见和道德观念,并计算了每个特征值的得分,然后对一组文章的得分进行平均。

雷锋网注:“真实性-偏见”预测模型图

维基百科和Twitter也被加入了AI系统的预测模型。正如研究者们所言,维基百科页面的缺失也许说明了一个网站是不可信的,或者网页上可能会提到这个问题的政治倾向是讽刺的或者明显是左倾的。此外,他们还指出,没有经过验证的Twitter账户,或者使用新创建的没有明确标注的账户发布的消息,不太可能是真的。

该模型的最后两个向量是URL结构和web流量,可以检测试图模仿可信新闻来源的url(例如,“foxnews.co”),参考的是一个网站的Alexa排名,该排名根据网站总浏览量进行计算。

该团队在MBFC(Media Bias/Fact Check )网站的1066个新闻源上对此AI系统进行了训练。他们用收集的准确性和偏见数据手工标注网站信息,为了生成上述数据库,研究人员在每个网站上发布了10-100篇文章(总计94,814篇)。

正如研究人员在他们的报告中煞费苦心的介绍所示,并不是每一个特征值都能有效预测事实准确性或政治偏见。例如,一些没有维基百科页面或建立Twitter档案的网站有可能发布的信息是公正可信的,在Alexa排名靠前的新闻来源并不总是比流量较少的新闻源更公正或更真实。

研究人员有一个有趣的发现:来自虚假新闻网站的文章更有可能使用夸张和情绪化的语言,左倾媒体更有可能提到“公平”和“互惠”。与此同时,拥有较长的维基百科页面的出版物通常更可信,那些包含少量特殊字符和复杂子目录的url也是如此。

未来,该团队打算探索该AI系统是否能适应其他语言(它目前只接受过英语训练),以及是否能被训练来检测特定区域的偏见。他们还计划推出一款App,可以通过“跨越政治光谱”的文章自动回复新闻。

该论文的第一作者、博士后助理拉米•巴利(Ramy Baly)表示:“如果一个网站以前发布过假新闻,他们很可能会再次发布。”“通过自动抓取这些网站的数据,我们希望我们的系统能够帮助找出哪些网站可能首先这么做。”

当然,他们并不是唯一试图通过人工智能打击假新闻传播的机构。

总部位于新德里的初创公司MetaFact利用NLP算法来标记新闻报道和社交媒体帖子中的错误信息和偏见;SAAS平台AdVerify.ai于去年推出beta版,可以分析错误信息、恶意软件和其他有问题的内容,并可以交叉引用一个定期更新的数据库,其中包含数千条虚假和合法的新闻。

前文中也提到过,Facebook一度深陷假新闻的泥淖,已经开始尝试使用“识别虚假新闻”的人工智能工具,并于近期收购了总部位于伦敦的初创公司Bloomsbury AI,以帮助其鉴别消除假新闻。

假新闻会被消除吗?

然而,一些专家并不相信人工智能可以胜任这项任务。卡内基梅隆大学机器人研究所(Carnegie Mellon University Robotics Institute)的科学家迪恩波默洛(Dean Pomerleau)在接受外媒 the Verge 采访时表示,人工智能缺乏对语言的微妙理解,而这种理解是识别谎言和虚假陈述所必需的。

“我们最初的目标是建立一个系统来回答‘这是假新闻,是或不是?’”他说,“但我们很快意识到,机器学习无法胜任这项任务。”

但是,人类事实核查者做的不一定比AI更好。今年,谷歌暂停了“事实核查”(Fact Check)这一标签,该标签曾位于谷歌新闻报道栏,此前保守派媒体也曾指责谷歌对他们表现出了偏见。

不过,无论最终鉴别假新闻和个人偏见的解决方案是AI系统还是人工,抑或两者兼而有之,假新闻被彻底消除的那一天都不会立刻到来。

据咨询公司Gartner预测,到2022年,如果目前的趋势不变,大多数发达国家的人看到的虚假信息将会多于真实信息。

via: venturebeat

相关 [mit 人工智能 实验室] 推荐:

MIT人工智能实验室最新研究成果:AI系统不仅可以识别假新闻,还能辨别个人偏见

- - 雷锋网
互联网时代,假新闻铺天盖地,而且极具迷惑性,Facebook一度深陷虚假新闻的泥淖,不但被控影响了美国总统大选结果,甚至引发了 德国政府的巨额罚金. 甚至连以公信力著称的BBC也难以幸免,比如BBC北安普顿分站的推特账号就曾发过这样一条消息:Breaking News: President Trump is injured in arm by gunfire #Inauguration.(劲爆消息:特朗普总统在就职典礼后遭遇枪击,手臂受伤.

诞生于MIT多媒体实验室,已经或即将改变世界的9个天才思想

- Aaron Xu - 译言-每日精品译文推荐
We may not know what the future holds, but we can take a pretty good guess where it will come from: MIT's Media Lab. The renowned Cambridge workspace throws imaginative people of different disciplines together and encourages them to learn by building, tinkering, and designing.

MIT开放获取论文

- Hafid - Solidot
2009年3月,MIT教职工无记名投票通过了一项决议,支持学术论文的开放获取. 今天MIT官网总结过去一年来的努力,称MIT开放获取论文库DSpace@MIT已经汇集了超过1900篇学术论文,自2009年10月以来下载论文超过63,000篇. 开放获取运动致力于挑战传统的学术出版模式——也就是作者将论文版权交给出版商,出版商再向学校收费.

Bose将公司捐给MIT

- rIPPER - Solidot
慈善家通常是给自己喜爱的学校捐钱,但Bose公司的创始人Amar Bose决定将公司赠送给MIT. MIT本周五宣布,81岁的Bose公司创始人向该校捐赠了公司绝大部分股票. 捐赠的股票形式是“无投票权股份”,MIT无权出售Bose公司,也无法参与管理,但将能收到年度现金分红. 公司仍然由Amar Bose控制.

MIT监控摄像头抓住Aaron Swartz

- vieplivee - Solidot
据《连线》的报导,上周被起诉的黑客Aaron Swartz是在MIT摄像头的帮助下被抓住的. Aaron Swartz因为下载了480万篇学术论文而面临最高35年徒刑和100万美元罚款. MIT的警卫是于1月4日首次听到技术人员报告有笔记本和外置硬盘藏在网络柜内,三名警察在上午进入房间取出了笔记本寻找指纹,然后将笔记本放回去,并安装了摄像头监控房间.

App Inventor交给MIT继续开发

- lin - Solidot
Google将在年底关闭教育工具Android App Inventor,让外界颇感失望. 但事态发展旋即又峰回路转,MIT接过了Google的烫手山芋. MIT Media Lab宣布成立MIT Center for Mobile Learning,专注于移动领域的教育革新和创新学习. Google Education捐助了初始资金,新研究中心主任之一是领导Android App Inventor开发的MIT计算机科学Hal Abelson教授,中心的第一个项目就是App Inventor for Android.

介绍几本数学书(By Dahua Lin@MIT)

- Kpon - 丕子
优秀的人我们就去要学习,学习人家的长处. Dahua Lin原来是科大的本科,然后去港中文读的硕士,现在在MIT. NIPS2010的Best Student Paper. 他的数学功底很好,在原来的MSN博客上推荐了基本数学书,我转载至此. 前面几篇谈了一些对数学的粗浅看法. 其实,如果对某门数学有兴趣,最好的方法就是走进那个世界去学习和体验.

Google 联合 MIT 开源 Android App Inventor

- - 博客园_新闻
Google 联合 MIT 发布了 App Inventor for Android 的开源版本.. AppInventor 是谷歌推出一种软件工具. 这种工具可以使用户更容易的为 Android 智能手机编写应用程序. 谷歌该 Android 应用工具使人们可以拖放代码块(表现为图形图像代表不同的智能手机功能),将这些代码放在一起,类似于将 Lego blocks 放置在一起.

真空实验室人生

- ye - 庄雅婷
        很多事从道理上来说,从逻辑上来说,都应该那么干吧. 当然,这些事各有各的掣肘,各有各的特殊情况需要网开一面分别对待,寻找变通方式处理,你一定见识过吧. 那你知道为什么很多事到了咱们村儿就有特色了吗. 说起规矩、礼教、道德,这东西咱不缺啊,甚至多得都淤了,那怎么就没养成一丝不苟的精密社会准则呢.

了解 GNU GPL/GNU LGPL/BSD/MIT/Apache协议

- aoao - IFLONELY
越来越多的开发者与设计者希望将自己的产品开源,以便其他人可以在他们的代码基础上做更多事,开源社区也因此充满生机. 在我们所能想到的应用领域,都有开源软件存在(象 WordPress,Drupal 这些开源CMS). 然而很多人对开源许可并不了解,本文介绍开源领域常用的几种许可协议以及它们之间的区别.