何为大数据及大数据在教育中的应用

标签: 教育技术研究 | 发表时间:2013-12-26 06:21 | 作者:szichuan@gmail.com (szichuan)
出处:http://www.qiexing.com/

大数据(big data),大在哪里,它和传统数据又有何区别,在教育领域有何应用?

大数据:也称巨量资料,指的是所涉及的资料量规模巨大,其产生背景是随着当前网络技术及智能设备的普及,使数据产生极其便利 。物联网、云计算、移动互联网、车联网、手机、平板电脑、PC以及遍布地球各个角落的各种各样的传感器,无一不是数据来源或者承载的方式

但大数据技术并不在于掌握庞大的数据信息, 而在于对这些含有意义的数据进行专业化处理。换言之,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。或者说是从各种各样类型的数据中,快速获得有价值信息的能力。

原始的数据信息并没有利用价值,或价值利用度很底, 因此需要——快捷的选择、关联和处理加工技术,大数据技术可能更指这种数据处理技术

一、大数据及其特点:

1,Volume(大量)

数量级别从TB级别,跃升到PB级别,数据产生的类型、维度与传统的结构化数据采集有了质的不同。对于一个人的传统数据描述可能是姓名、身高、体重等标准化数据,大数据背景下是关于一个人的全面信息。

        1 Byte = 8 bit
1 KB = 1,024 Bytes
1 MB = 1,024 KB = 1,048,576 Bytes
1 GB = 1,024 MB = 1,048,576 KB
1 TB = 1,024 GB = 1,048,576 MB
1 PB = 1,024 TB = 1,048,576 GB
1 EB = 1,024 PB = 1,048,576 TB
1 ZB = 1,024 EB = 1,048,576 PB
1 YB = 1,024 ZB = 1,048,576 EB
1 BB = 1,024 YB = 1,048,576 ZB
1 NB = 1,024 BB = 1,048,576 YB

        1 DB = 1,024 NB = 1,048,576 BB

2,Velocity(高速)

包括数据产生以及传输处理的速度。

3,Variety(多样)

数据类型繁多,包括传统的文本、图像声音以及各种设备载体的稳定信息类型,如网络日志、地理位置、物联网传感器获取对象的实时运行信息等等。

4,Veracity(精确)

一张试卷,它带给我们的数据是什么?可以是简简单单的一个 92 分,但如果我们拥有足够的技术与耐心,我们还可以得到许多充满想象力的数据:可以是每一大题的得分,每一小题的得分,每一题选择了什么选项,每一题花了多少时间,是否修改过选项,做题的顺序有没有跳跃,什么时候翻卷子,有没有时间进行检查,检查了哪些题目,涂改了哪些题目……等等,这些信息远远比一个 92 分要来的有价值得多。不单是考试,课堂、课程、师生互动的各个环节都渗透了这些大数据。

二、大数据利用的关键技术

如何利用信息技术等手段处理非结构化和半结构化数据
如何探索大数据复杂性、不确定性特征描述的刻画方法及大数据的系统建模
数据异构性与决策异构性的关系对大数据知识发现与管理决策的影响

三、大数据技术在教育中的应用

1,让所有社会科学领域能够借由前沿技术的发展从宏观群体走向微观个体,让跟踪每一人的数据成为了可能,从而让研究“人性”成为了可能。而对于教育研究者来说,我们将比任何时候都更按近发现真正的学生。

传统数据诠释宏观、整体的教育状况,用于影响教育政策决策;大数据可以分析微观、个体的学生与课堂状况,用于调整教育行为与实现个性化教育。

你现在上网的时候,有没有发现,这些网站正在变得越来越了解你?比如淘宝网,它会根据你买过一些什么,浏览过一些什么商品,来判断你还有可能购买一些什么。比如新浪微博,它会根据你关注了哪些人来判断你还可能对哪些人感兴趣。这种技术实质上是通过数据的归类与分析,来预测“出现某种行为的人还很有可能出现另种行为”。

如果这样的技术能够应用在作业上,会是怎样呢?比如A同学做对了第4题,系统马上可以告诉他,他可以跳过第7题和第9题,这是因为,做对第4 题的学生几乎不可能做错第7题与第9题,做这些题目是简单重复浪费时间。如果B同学做错了第 5 题,那么系统也会提示他继续练习第 6 ,第 9 题,这是因为数据显示,做错第 5 题的人很可能做错后两题,这个知识点是该学生需要反复进行操练与巩固的。这样的应用,对于我们实现个性化教育有何启示?

2,信息真实性的凸显,让信息从可疑到可信,使研究者能够真正获悉真实的情况。

比如调研学生课外运动的时间,我们最通常的做法是设计一个问卷,问他“本学期平均每周参加课外运动的时间,A、l 小时以下,B、1-1.5 小时,C、1 .5-2 小时,D、 2小时以上”,且不论选项的设计是否能体现区分度,我们自己又能否比较准确地估算出自己一个学期里平均每周参加多少运动呢?
经常上微博的人也许会关注SOHO中国的总裁潘石屹,他每天早上都会发微博“今天早上我跑了几点几公里”。他的数据是可信的吗?我相信是非常准确的。为什么呢?因为他随身携带的手机上有这样个 App ,能够记录他跑了多少公里,花了多少时间,甚至跑步的路线也能记载下来。

3,思维路径的改变——从演绎转向归纳,在“去经验”的过程中找到真正重要的教育影响因素。

一个经典案例:作为一个笔记本电脑销售门店的主管,哪些方法可以帮助提高销额呢?有许多专家、专业人士会给出建议,比如提高库存管理的能力,提供员工更多专业培训,做更新更炫的广告,或者搞一些促销活动。这些方式当然都会很有效,分别能够提高 2%-9%左右的销售额。但是,历来讲求创新的苹果公司偏偏不信这个邪,而是将门店中所有能够收集到的数据,不管看上去是不是有关联,全都输入了软件。最后发现了一个惊人的现象,电脑屏幕和桌子呈70度角左右的电脑销售量比其他电脑高出15%,比其他任何经验式的建议更有效。这是为什么呢?因为当我们走到一个70度角的电脑前,总觉得反光非常地不舒服,而当人觉得电脑屏幕反光不舒服,很自然而然地会伸手去扳动屏幕。心理学理论告诉我们,一旦潜在客户与货物发生了肢体按触,他购买这个商品的可能性就上升了15%。

教育技术研究对大数据也比较关注的,现在可以看到一篇文章:基于大数据的教育技术研究新范式。 且行资源收集整理

《何为大数据及大数据在教育中的应用》Copyright © 且行 教育技术:欢迎复制-转载-传播

继续阅读《何为大数据及大数据在教育中的应用》的全文内容...

分类: 教育技术研究 | Tags: 研究   | 添加评论(0)

相关文章:

相关 [大数据 大数据 教育] 推荐:

何为大数据及大数据在教育中的应用

- - 且行资源
大数据(big data),大在哪里,它和传统数据又有何区别,在教育领域有何应用. 大数据:也称巨量资料,指的是所涉及的资料量规模巨大,其产生背景是随着当前网络技术及智能设备的普及,使数据产生极其便利. 物联网、云计算、移动互联网、车联网、手机、平板电脑、PC以及遍布地球各个角落的各种各样的传感器,无一不是数据来源或者承载的方式.

关于遗忘、发明与教育:“大数据”未来的若干可能

- - PingWest
我们生活在一个被几何级爆炸的数据包围的时代,现在,这些数据被叫作“大数据”. 大数据将深刻影响人们的生活、工作和生活方式——而反过来说,你留在数字世界里的任何踪迹都变成了数据的一部分. 它包括你在社交网络上的每条口水吐槽和照片,你的地理位置签到,你点击的每一个“like”,你与任何人的“好友”链接,你在亚马逊上每一次“点击”的购买记录甚至你的每一次搜索内容……也就是说,每个人创造的数据就是“大数据”的一部分,每个人都是大数据的生产者和消费者.

谈大数据(2)

- - 人月神话的BLOG
对于大数据,后面会作为一个系列来谈,大数据涉及的方面特别多,包括主数据,数据中心和ODS,SOA,云计算,业务BI等很多方面的内容. 前面看到一个提法,即大数据会让我们更加关注业务方面的内容,而云平台则更多是技术层面的内容. 对于大数据会先把各个理解的关键点谈完了,再系统来看大数据的完整解决方案和体系化.

大数据之惑

- - 互联网分析
算起来,接触大数据、和互联网之外的客户谈大数据也有快2年了. 也该是时候整理下一些感受,和大家分享下我看到的国内大数据应用的一些困惑了. 云和大数据,应该是近几年IT炒的最热的两个话题了. 在我看来,这两者之间的不同就是: 云是做新的瓶,装旧的酒; 大数据是找合适的瓶,酿新的酒. 云说到底是一种基础架构的革命.

白话大数据

- - 互联网分析
这个时代,你在外面混,无论是技术还是产品还是运营还是商务,如果嘴里说不出“大数据”“云存储”“云计算”,真不好意思在同行面前抬头. 是千万级别的用户信息还是动辄XXXTB的数据量. 其实,大数据在我的眼里,不是一门技术,而是一种技能,从数据中去发现价值挖掘价值的技能. ”当我掷地有声用这句话开场时,正好一个妹子推门而入,听到这句话,微微一怔,低头坐下.

交通大数据

- - 人月神话的BLOG
本文简单谈下智慧交通场景下可能出现的大数据需求和具体应用价值. 对于公交线路规划和设计是一个大数据潜在的应用场景,传统的公交线路规划往往需要在前期投入大量的人力进行OD调查和数据收集. 特别是在公交卡普及后可以看到,对于OD流量数据完全可以从公交一卡通中采集到相关的交通流量和流向数据,包括同一张卡每天的行走路线和换乘次数等详细信息.

全球10大数据库

- - 译言-电脑/网络/数码科技
原文: Fiorenttini   译者: julie20098. [非商业性转载必须注明译者julie20098和相关链接. ,否则视为侵权,追究转载责任. 世界气候数据中心:气候全球数据中心, 220TB 的网络数据, 6PB 的其它数据. 国家能源研究科学计算中心,有 2.8PB 容量.

谈大数据分析

- - 人月神话的BLOG
对于数据分析层,我们可以看到,其核心重点是针对海量数据形成一个分布式可弹性伸缩的,高查询性能的,支持标准sql语法的一个ODS库. 我们看到对于Hive,impala,InfoBright更多的都是解决这个层面的问题,即解决数据采集问题,解决采集后数据行列混合存储和压缩的问题,然后形成一个支撑标准sql预防的数据分析库.

大数据的一致性

- - 阳振坤的博客
看到了一篇关于数据一致性的文章:下一代NoSQL:最终一致性的末日. (  http://www.csdn.net/article/2013-11-07/2817420 ),其中说到: 相比关系型数据库,NoSQL解决方案提供了shared-nothing、容错和可扩展的分布式架构等特性,同时也放弃了关系型数据库的强数据一致性和隔离性,美其名曰:“最终一致性”.

大数据Lambda架构

- - CSDN博客云计算推荐文章
1 Lambda架构介绍.          Lambda架构划分为三层,分别是批处理层,服务层,和加速层. 最终实现的效果,可以使用下面的表达式来说明. 1.1 批处理层(Batch Layer, Apache Hadoop).          批处理层主用由Hadoop来实现,负责数据的存储和产生任意的视图数据.