互联网时代里的用户模型

标签: 技术 | 发表时间:2011-10-14 09:53 | 作者:微软亚洲研究院 xcv58
出处:http://blog.sina.com.cn/msra

编者按:还记得在电影《黑客帝国》里,人们生活在一个虚拟的世界中,每个人都只是一段程序,一个模型。当然,现在的科技还不具有这么大的能力。但是,你知道吗?在如今的互联网时代里,有很多网站、计算机都在试图去建立用户模型,理解个人的行为和想法,甚至试图去预测人们的意图。或许有一天,会有那么一个模型出现开启了一个崭新的世界。

作者:林榕程 中科大-微软亚洲研究院创新人才培养实验班学员

 

201010月启动以来,中科大-微软亚洲研究院创新人才培养实验班已经迎来了两期学生。他们作为从中国科学技术大学的少年班、信息学院、计算机学院、数学学院选拔出的优秀本科生,将在微软亚洲研究院进行为期一学年的培养,接受系统而完备的计算机科学基础教育。其中,前沿科学讲座,是为这个实验班重点推出的一个特别系列——邀请研究院内各个研究领域的资深研究员们为学生们讲述该领域的最新发展和动向,传授自己深刻的研究心得,以帮助同学们开拓视野,深入思考。

 

本次系列演讲我们很荣幸地请到了微软亚洲研究院机器学习组主任研究员陈正博士,给我们带来题为“用户建模(user modeling)”的讲座。那么什么是用户建模?为什么要研究用户建模?用什么办法来实现用户建模?以及今后的研究发展方向会是如何呢?请听陈正博士娓娓道来。

 

什么是用户建模

用户建模涉及到很多不同领域,包括人机交互、数据挖掘、机器学习、心理学和哲学、以及其他如语言学和设计学等。不同的学科有着不同的定义。但针对本文,简要地说,用户建模就是在保护用户隐私的前提下, 利用计算机通过建立机器学习模型来模拟用户的现有的行为和知识,并以此来预测用户未来的行为和意愿等等。

 

事实上,用户建模发生在每个人的日常生活当中。当你刚买了一辆新车,回到家可能就会接到保险公司的广告电话;当你刚买了一套新房,就可能收到装修公司的服务广告邮件;当你在浏览购物网站,服务端会根据你之前的行为来推介商品;甚至,当你在浏览网上的新闻,周边的广告也是根据你的喜好选择的。可见,信息直接影响了个人的生活质量,而研究用户建模就是为了让正确的信息传给正确的人而不断努力,并使用户免受无关信息骚扰之苦。看似普通的生活,却带着量身订制的特别。


利用用户搜索的行为分析,判断出用户是否是游戏爱好者,继而决定是否将XBOX游戏广告显示给用户

 

为什么要研究用户建模

首先,在现实应用中,用户建模有着巨大的商业价值。举两个例子,现在的搜索引擎开始强调用户个性化,这本身就是一个用户建模的过程。另外,在如今的广告市场,以雅虎为代表,出现了一种名为“窄告”的技术,让正确的广告传给正确的用户,也包含着用户建模。可以说用户建模是现在互联网商业的一把利器。

 

其次,不可否认,用户建模的研究有很多难题值得研究。如果一个领域已经不存在研究难题,本身也就没有了研究的价值。总结一下研究的挑战有:研究的数据整体很多,局部又很稀疏,还有很多的“噪声”数据。标记数据需要很多的人工劳动,用户模型需要不断更新等等。我们期待有这样一篇文章:利用噪声数据建立具有鲁棒性和实时更新特性的并行半监督用户模型。那么会不会出现类似的文章呢?

 

如何研究用户模型

现在研究的主要方法包括:关联模式挖掘,监督式学习,无监督式学习,半监督式学习。关联模式挖掘是利用现在的概率论中的联合概率以及条件概率来模拟用户执行某些行动的可能性。后三种都是机器学习领域中基本的学习方法。

 

不得不提的是,利用概率论来研究包括用户建模的人工智能问题是最近兴起的方法,以前也用过数理逻辑推理、谓词推导,以及神经网络方法等等方法,只是最近几年慢慢被基于概率论的学习方法取代。那么会不会有这样一个新的研究方法被提出来改变现在的研究格局呢?

 

未来研究的方向是什么

未来从来就是一件很抽象、很难以捉摸的的事情。这里就介绍现在的几个具有前瞻性的研究方向,或许也能预示一些未来的发展前景吧。

 

1、让手机成为你的秘书

“让你的手机成为你的秘书”,陈正研究员如是说。而Magic Button就是这其中的一个项目。当你晚上不知道去哪里吃饭,你按一下Magic Button,她就会告诉你附近有哪些餐馆,各自的评价如何;当你正在为假期去哪玩儿揪心时,按一下Magic Button,让她告诉你什么地方很不错,并帮你订好机票和旅馆;当你走在一条陌生的道路上时,按一下Magic Button,让她告诉你周围的建筑是什么,什么路线能让你最快到达目的地。

 

当你听到这样一个想法时,是不是已经抑制不住内心的冲动了呢?不管你有没有激动,反正我是激动了J。我想,技术最重要的目标就是服务于人。一部手机,就是你身边的一个秘书,他能给你提供想要的数据,这是怎样一个美好的未来!当然,这其中还有着很多需要研究的难题,包括对不同类型服务的分类,可能源于用户输入的查询条件,也可能源于用户所在的地方,包括理解用户的意图,以及对用户喜好、兴趣的学习等等方面。

 

2、行为定向技术(Behavioral Targeting,简称BT

显然,BT的目标就是通过挖掘出的数据,将用户进行分组,这样就可以和广告厂商合作,将正确的广告告知给真正需要的人。很明显,这个项目对于用户和厂商是互利双赢的。一方面厂商可以提高广告效率,减小宣传成本。另一方面用户可以摆脱看与自己无关的广告的烦恼,同时也享受产品成本减少的利益。

 

当然,梦想总是美好的,但实际需要克服的问题还有很多,如:

(1) 如何处理足够多的数据?

(2) 对于各种各样的需求,如何实现不同层次的分类?

(3) 如何正确预测用户的兴趣和需求?

(4) ……


中科大-微软亚洲研究院创新人才培养实验班学员与陈正博士(左五)合影

* 科研小贴士

在讲座过程中,陈正研究员给我们留下了一些做科研的提示:

(1)当你开始一个新的研究时,要做好可行性分析,调查好研究的应用市场,要想一想研究会不会带来变化。

(2)每个人做研究都有一个基准线,若是每个人都能想到解法,问题本身也就不值得做研究了。

你是这样认为的吗?

(本文部分图片来自于网络)

 

研究员介绍

陈正博士:现任微软亚洲太研究院机器学习组主任研究员。陈正博士于1994年和1999年在清华大学获得本科、硕士和工学博士学位,并于1999年加入微软亚洲研究院,致力于研究机器学习、信息检索、语音识别、自然语言理解、多媒体检索、个性化信息管理,以及人工智能等多个领域的研究。陈正博士曾担任多个学术会议的程序委员会职务,包括AAAI, CIKM, ICDM, PAKDD, IAT, AIRSAPWeb等会议。他在国际学术会议以及期刊上发表了60余篇文章,其中包括15SIGIR会议文章。


 

相关阅读

科学之艺术,艺术之科学——网络图形学之大观

机器学习正在改变我们的工作与生活

首堵不再“堵” 出租车GPS数据出妙方

下一代互联网搜索的前沿:意图、知识与云

________________________________________________________________________

欢迎关注

微软亚洲研究院人人网主页:http://page.renren.com/600674137

微软亚洲研究院微博:http://t.sina.com.cn/msra

相关 [互联网 时代 用户] 推荐:

互联网时代里的用户模型

- xcv58 - 微软亚洲研究院
编者按:还记得在电影《黑客帝国》里,人们生活在一个虚拟的世界中,每个人都只是一段程序,一个模型. 当然,现在的科技还不具有这么大的能力. 在如今的互联网时代里,有很多网站、计算机都在试图去建立用户模型,理解个人的行为和想法,甚至试图去预测人们的意图. 或许有一天,会有那么一个模型出现开启了一个崭新的世界.

移动互联网时代的女性用户群,值得更多关注

- - 动点科技-独立原创科技博客
每当谈论起互联网初创公司的时候,我们首先不会注意到他们的目标用户,而是会更注重功能,并把他们按照功能分类,譬如社交网络、游戏、电子商务、广告、媒体等等,就像对待传统产业一样. 在我看来,互联网的商业模式很简单:一种是直接向最终用户出售虚拟或实体的产品;另一种就是在有一定的用户之后,卖广告. 借此我想说的是,在初期,相比起产品设计或是功能,你的目标用户才是最重要的.

互联网时代的应用设计

- james - 所有文章 - UCD大社区
在互联网时代如何开发一个成功的应用. 先发放一万份调查问卷,找几十个人关在黑屋子里花两年时间研发,然后期待着一旦推出就颠覆整个互联网. 我不得不抱歉地说,以这样一种方式研发一款互联网应用,在互联网时代已经不太适用. 互联网应用单纯地从和传统应用的运行环境下的不同所带来的差异就足够决定互联网应用并不是把传统应用简单地搬到网上.

互联网:用户即信仰

- - 最科技 | 关注互联网科技与应用创新的TMT媒体
创新工场的创始合伙人汪华曾经总结:现在的很多应用和方案对接下来要进入的人群过于复杂,应该要简单化,还要挖掘他们的新需求. 笔者认为这便是中国最顶级的产品经理对用户需求之于产品最简练的总结. 从BBS到门户网站到微博,互联网信息传递的速度越来越快,互联网产品与用户之间的距离也越来越近,然后只是因此就说明互联网产品经理要以用户为信仰否.

几款移动互联网时代的本地化应用

- WanZheng - 爱范儿 · Beats of Bits
从未想到基于手机的生活方式会变成这样,也没想到手机会变成如此的重要. 变化如此之快,真的难以想象,这就是移动互联网时代的移动生活. 大家都知道移动互联网是一座金矿,而且很多的互联网从业者或者是爱好者已经投入到挖矿过程当中. 在这样的时代背景下不断产生很多有价值的商业模式和很 Cooool 的产品,而且它们在不断融入到我们的生活当中.

移动互联网时代的本质与机会

- 彭全兵 - 互联网的那点事...
在2008年,2009年的系列前文《Web3.0:呼唤虚拟机器人时代的到来》,《心理学与SNS:观察与实践》,从信息与信任的角度,辨析了Web的下一步发展方向,并为互联网界的同仁引入一个社会网络分析的视角. 今天,继续心理学的视角,从物理计算与心智计算的交互角度,探讨移动互联网时代的本质与投资机会,同样,希望为新时代来临而兴奋的各位提供一个计算心理学的视角.

马化腾:互联网新时代的晨光

- 品味视界 - cnBeta.COM
不管已经出现了多少大公司,人类依然处于互联网时代的黎明时分,微微的晨光还照不亮太远的路. 在这个行当里,不管一家公司的赢利状况有多么喜人,也都随时面临着被甩出发展潮流的风险.

互联网时代,数字遗产何处以安?

- - FeedzShare
来自: tech2ipo - FeedzShare  . 发布时间:2012年04月18日,  已有 2 人推荐. 数字化时代来临之前,死亡还是一个简单问题,人们的财产可以按照其遗愿分配. 但这些财产都是物质财产,比如汽车、房屋、珠宝等等. 而现在,Facebook、PayPal、邮箱、网游帐号等这些数字财产的处置却成了棘手的问题.

马化腾:移动互联网时代的机遇

- - 行业资讯
  【创业邦讯】2012全球移动互联网大会(GMIC)今日上午9时将在北京拉开帷幕,为期三天的本届大会以跨界、融合、变革为主题,通过全球移动互联网产业的巅峰对话、G20闭门峰会等多个单元,探讨移动互联网领域的趋势与机遇. 腾讯CEO马化腾出席大会并发表演讲,他表示应用、数据流,搜索和安全是移动互联网时代充满机遇和挑战.