年底了,有关 2015 年的数据预测都是怎么得来的

标签: 数据 预测 | 发表时间:2014-12-26 17:15 | 作者: lydiaxin
出处:http://www.geekpark.net/
作者: lydiaxin

像年终总结报告一样,每到年底,关于 2015 年的预测也相继涌现出来,亚马逊前不久预测 2015 年网购热销排行榜,大胆提出明年热销第一名是智能手环等智能硬件。

必应的预测团队也为未来的新趋势描绘出具体的画像,从时尚潮流,体育,美食,旅行等,不一而足。必应还预测在 2015 年,Apple watch 无论是在北美、欧洲、南美还是亚太地区将成为热卖第一名。

这些预测究竟准不准,要等到 2015 年过去之后才能知晓,不过按照以往的经验,必应在世界杯上的猜想都得到了证实,在今年的世界杯上,微软必应预测引擎在世界杯的预测全部正确,包括世界杯决赛中德国战胜阿根廷。

你负责检索,我来预测

必应的核心排名小组的研发经理 Walter Sun 在2008年的一个冬天偶然发现,在相同时间一个特定的区域,对于一些特定学校区域的查询会突增,他意识到,这可能预示着暴风雪天气的到来。因为人们通常会在查询当地的学校会不会在暴风雪天气下停课。通过这些访问查询,Sun 就可以在不看天气预报的情况下,精确地估计到暴风雪天气发生的时间和地点。

随后,Sun 开始建议将这种预测用于其他电视节目上,特别是投票选举中,几个月后,必应预测就上线了。自从问世后,它就一直精确地预测着每周美国偶像的结果。

如今,必应预测还将其注意力放在世界杯上,除了依赖整体数字外,必应还需要更多相关数据,比如,比较不同队伍之间的竞争优势并且权衡专家的意见。

据了解,在世界杯上,必应预测引擎所给出的结果是通过数据模型产生,其综合的因素包括过往比赛结果、比赛时间、天气情况以及主场优势等,并通过微软的个人语音助手 Cortana 和必用搜索引擎发布。

必应还曾经借鉴了 David Rothschild 的预测,他一度精确预测了世界杯的战况,Rothschild也正在开放 API 数据,好让必应预测可以获取到。

在严肃领域,数据预测真的靠谱吗

流行病学家想像气象学家预测天气一样预测疾病,在他们看来,人们浏览维基百科的过程也会是一个重要的线索。

亚特兰大疾病防控中心的 Hickmann 和同事就通过分析维基百科的数据来了解疾病,原理就是,人们对和流感相关的文章的浏览变化会成为疾病扩散的一个重要预测指标。

由于维基百科公开自由地将其资料面向任何利益群体,所以对于预测未来来说,这是一个十分透明的信息来源。

资料的公开透明对于疾病的预测来说很重要, Hickmann 之前曾想过利用 google 上的数据来预测,因为在其搜索引擎中产生了大量的相关搜索。但是一个潜在的问题是,谷歌并没有将其数据公开,缺乏透明性可能会给这类研究预测带来一些麻烦。

Hickmann 和他的同事分析了维基百科上前些年与流感相关的文章数据,他们将这些数据收集起来,训练机器用算法在这些文章数据和流感疾病的数据建立联系。然后,他们让算法去“预测”历史上流感发生的情况。

令人欣慰的是,两周后,疾病控制中心的人员发现,维基百科上的数据和历史上真实的流感纪录有着很高的相关性。这样,预测未来的流感数据也是可以实现的。

但是可能存在的一个问题是,这些预测可能低估了疾病后期的感染的人群规模,因为人们再次感染另一种流感病毒时就不会再去维基百科了,所以研究人员也承认 ,在流感季的高峰期过去后的预测没法完全精确。

这类研究还包括通过观察人们在谷歌上的搜索来预测股市情况等。我们每天在了解的信息汇总起来产生了数万亿次搜索。搜索的数据蕴含着无数的价值,预测也许只是其中一部分。

相关 [数据 预测] 推荐:

2012,大数据五大预测

- - 雷锋网
更加强大且富有表现力的分析工具. 在过去的一年中,围绕着NoSQL和Hadoop,基本的存储与数据处理引擎方面的改进工作得到了加强并且日趋工程化. 毫无疑问,这种态势将会持续 下去,因为我们看到了Hadoop世界中有越来越多形态各异的产品融入到了各种发布包、设备和按需的云服务当中. 我衷心希望在不远的将来Hadoop能够 成为必要的基础设施.

大数据(Bigdata)未来发展趋势预测

- - 博客园_新闻
随着云时代的来临,大数据(Bigdata)也吸引了越来越多的关注. 大数据(Big data)通常用来形容一个公司创造的大量非结构化和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱. 大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像 MapReduce 一样的框架来向数十、数百或甚至数千的电脑分配工作.

日本利用大数据预测流感 结果精确

- - TECH2IPO创见
日本 NHK 网站报道,日本国内有一个网站,你只要打开这个网站用自己的 Twitter 账号登录,就可以在短时间内通过数万条 Twitter 找出可能感冒的人,并通过过去的感冒情况和今日的感冒情况进行分析(以及统计目前发烧以及嗓子痛的患者数量),另外该程序还会结合气温和湿度的变化来预测将来感冒的流行情况,并制作一个“易感冒日历”.

【大数据】揭秘谷歌的票房预测模型

- - 互联网分析
【导语】近日,谷歌公布了一项重要研究成果 – 电影票房预测模型. 该模型能够提前一个月预测电影上映首周的票房收入,准确度高达94%. 这在业内引起了强烈讨论,不少内人士认为该模型非常适合好莱坞电影公司通过预测票房来及时调整电影营销战略,但同时也有吐槽者暗示谷歌的票房预测模型别有用心,旨在鼓动电影公司购买其搜索引擎广告.

2014年数据新闻新趋势预测

- - 绝版青春
站在2014年的开头前瞻一整年的媒体变革,已经获得相当多关注的数据新闻(Data-Driven Journalism)将继续成为核心关键词之一. 美国传播学者Amy Schmitz Weiss在 自己的网站上预测了2014年的数据新闻新趋势. 2014年,通过传感器获取的数据将会成为前沿和中心. 如今,很多设备都带有传感器(从你的冰箱到你的智能运动腕带).

2014年大数据市场趋势十大预测

- - IT经理网
大数据是2013年热度最高的技术词汇,这一年大数据市场也实现了高速增长,越来越多的企业开始拥抱大数据解决方案,而随着生态系统的日益成熟,Hadoop也不再是天才技术人员的玩具,而是数据科学家和业务人员手中挖掘数据商业价值的强大“矿机”. 如果说2013年只是大数据市场的热身赛和预选赛,那么2014年大数据市场将迎来世界杯盛宴,近日CIO杂志给出了2014年大数据市场十大预测,IT经理网编译整理如下:.

大数据预测:4个特征,11个典型行业

- - TECH2IPO创见
本文作者罗超 编辑 reMake. 世界杯期间各家科技巨头利用大数据预测比赛结果,再现“章鱼保罗”雄风. 世界杯结束了但大数据预测还会继续. 从夜观天象到气象预报,从童话里的水晶球到今日的科技预言家,从地震云的传说再到科学家猛攻的地震预测,人类一直希望能够更早突破局限看穿未来. 随着信息革命的深入,大数据时代的预测更加容易,人类的生活正在被大数据预测深刻改变.

MapR CEO对2016大数据的5个预测

- - 199IT互联网数据中心
MapR Converged Data Platform将Hadoop和Spark的强大功能与全局事件流、实时数据库能力与企业存储集成到了一起,用于开发与运行创新性的数据应用. MapR Platform由业界最快速、最可靠、安全且开放的数据基础设施所驱动,极大降低了TCO,并实现了全局的实时数据应用.

2011-2016 全球移动设备与数据增长预测——解读思科移动增长预测报告

- - 36氪
昨日,思科发布了《 思科视觉化网络指数:全球移动数据流量预测更新2011-2016》报告. 该报告通过对1997年到2011年互联网和移动设备相关的数据进行统计,然后对未来移动设备和数据的发展趋势进了的预测. 我们筛选了其中16个自2011到2016年移动设备和数据分析趋势图,并简单解析,供各位参考.

案例干货:数据到底如何搞定电影票房预测?

- - 钛媒体网
怎样利用微博数据从股市中掘金. Google如何通过搜索行为预报流感爆发. 这些有趣的问题背后,其实都隐藏着 大数据的影子. 基于对搜索行为、社交媒体等数据的深入分析,可以测量亿万用户的情绪变化、描绘用户的行为模式、挖掘用户的潜在需求,最终发掘出数据中蕴含的真正价值. 2009年Google在《Nature》上公布了其利用搜索数据对全球流感疫情近乎实时评估的技术:(1)2012年微软纽约研究院经济学家David Rothschild在51个选区中准确预测了50个选区的总统大选结果 (2)美国印第安纳大学和曼彻斯特大学的三位学者依靠Twitter的情绪分析预测未来3-4天道琼斯指数的涨跌 ,准确率高达87.6%(3).