数据采集的新时代

标签: 数据 新时代 | 发表时间:2013-11-17 00:04 | 作者:gigix
出处:http://gigix.thoughtworkers.org/

中午帮同事订餐,大家都想吃点什么?周末搞个团队建设,大家想去哪里玩?买保险,要提供个人信息。进医院,要先挂个号。

这几件事有什么共通之处?答案是,它们本质上都是在做数据采集。如果把这些收集信息的过程放到电脑上做,可能会用个Excel表格;如果要做个软件来处理这些事,大概最主要的界面就是一张表单(form),有文本框啦单选按钮啦多选按钮啦下拉列表啦之类的,最后还有个“提交”或者“完成”之类的按钮。

这些表单比乍一看的要复杂。比如说,你会希望表单有校验,明显不合法的数据最好就不要填进去了。再比如说,表单会有条件判断在里面,例如男性就不用问是否怀孕女性就不用问是否做过结扎。当然了,表单还应该长得好看,而且最好在电脑上和手机上都好看。更不用说还有一些并非HTML直接支持但颇为常见的数据类型,比如地点经纬度,比如照片。

你还在用HTML一个字段一个字段实现表单吗?你的开发工作量还和表单长度成正比吗?那弱爆了好吗?

金数据 是一个在线创建和管理表单、收集数据的工具。不用多废话介绍它,网站上一看就知道了。有趣的部分在于,金数据提供了 JSON格式的API ,你可以把放在金数据上的表单拿给别人去填,收到新数据的时候通过这个API推送给你自己的服务器程序。觉得金数据的表单还不够好?或者压根儿不想让金数据知道你采集了哪些数据?你还可以把表单定义抓下来,自己写程序解释这个JSON定义,得到完全自己控制的表单——听起来有点麻烦,但至少有意思,总好过一个字段一个字段写HTML。

如果解释金数据的JSON格式表单定义确实有点麻烦(或者技术挑战),这儿还有个更简单一点的解决方案。 Enketo 也是一个在线设计表单和手机数据的工具,不过不像金数据,Enketo更多像是一个帮助软件开发者的工具:你可以用Excel设计表单,然后把Excel格式的表单定义上传到 FormHub (Enketo的一个部署),然后就可以让用户在线填表;更妙的是当你把表单定义下载过来,Enketo还提供了开源的 Javascript Library 帮你显示和操作表单——所以就不用操心“自己写程序解释表单定义”什么的啦,毕竟要实现那些常见的表单功能并不是件很容易的事。

如果感兴趣怎么使用Enketo来做你自己的表单,我做了一个 简单的Demo 来演示。

$ git clone https://github.com/gigix/shivaganda.git
$ cd shivaganda/village-enketo
$ npm install
$ bin/server.js

然后就可以去 http://localhost:8002 看这个表单了。代码非常简单,40行HTML加100行Javascript而已,表单就搞定啦,而且做成手机应用也完全没问题。点“提交”按钮的话,你得到的是一个XML格式的数据包,所以程序员就只管处理数据就好啦。

还是那话:你还在一个字段一个字段拿HTML写表单吗?那弱爆了好吗?……可是这真的还在很多我所知道的项目里发生呢。特别是来自发达国家(尤其是南太平洋发达国家,嗯,你懂的)的项目,客户似乎对于花这点工夫也不在意,毕竟一个项目上线就能赚很多钱回来嘛。但是在,比如说,UNICEF在非洲的项目里,我们没钱啊,我们资源非常受限啊,我们舍不得把程序员宝贵的时间拿去复制粘贴HTML表单字段啊,所以我们就得想破脑袋找这些法子,让程序员做必须做的事,可以自动化的全都自动化。其结果呢,就是项目做得很有意思,每段程序写下去都是有创造性的——没创造性的那些都被自动化了。

所以呢,穷人的孩子早当家,穷人的项目更好玩 :D

相关 [数据 新时代] 推荐:

数据采集的新时代

- - 透明思考 - Thoughts
中午帮同事订餐,大家都想吃点什么. 周末搞个团队建设,大家想去哪里玩. 答案是,它们本质上都是在做数据采集. 如果把这些收集信息的过程放到电脑上做,可能会用个Excel表格;如果要做个软件来处理这些事,大概最主要的界面就是一张表单(form),有文本框啦单选按钮啦多选按钮啦下拉列表啦之类的,最后还有个“提交”或者“完成”之类的按钮.

国内数据分析“七宗罪” 美国进入“非结构化”数据分析新时代

- - 199IT互联网数据中心
199IT数据中心微信账户:i199IT. 目前,对国内大部分企业级客户而言,大数据时代已经真正到来了. 虽然,近年来“大数据”及“数据分析”概念被炒得很火,但国内,国内很多CIO/CTO们仍很“害怕数据”——一方面,企业充斥着无从分析的非结构化数据;另一方面,结构化数据分析方面,与非结构一样面临着方法不科学、周期冗长、性价比低、不能直接产生经济效益等典型的问题.

马化腾:互联网新时代的晨光

- 品味视界 - cnBeta.COM
不管已经出现了多少大公司,人类依然处于互联网时代的黎明时分,微微的晨光还照不亮太远的路. 在这个行当里,不管一家公司的赢利状况有多么喜人,也都随时面临着被甩出发展潮流的风险.

新时代的QA角色:IT全能战士

- - 透明思考 - Thoughts
故事开始于客户告诉我的一个反馈:ThoughtWorks成都的一个项目组,最近这段时间开发工作量变多,于是担任QA角色的某同学自动转入开发模式开始写代码. 不仅自己写,还拉上远在墨尔本的客户QA一起远程结对. 两个QA结对开发,效果出奇的好:代码质量毫无问题,而且对需求理解充分透彻,story完成得又快又好.

Marty Cagan带你走进产品新时代

- - 技术改变世界 创新驱动中国 - 《程序员》官网
文 / Marty Cagan  译 / 林航,张莹莹,黄捷文. Marty Cagan是享有世界声誉的产品管理专家,曾经担任网景副总裁、eBay产品管理及设计高级副总裁. 本文是他回顾自己二十多年来从事软件产品管理工作的总结和经验分享,介绍了在互联网行业生机蓬勃的背景下,产品经理应该怎样大显身手.

浅谈互联网新时代的商业模式

- - 人人都是产品经理
[核心提示] 在新互联网时代驱动用户使用某产品的动力将从需要转向喜欢,人们渴望的是情感的认同和共鸣,哪怕是让消费者悲伤,也心甘情愿掏腰包. 「CY故事」是一个十分文艺的店,它卖的不是商品,而是共鸣. 这家店的商品全部是虚拟物品,也就是故事,每一个故事标价一元钱. 不过,客官大可以免费阅读,因为物品详情里就包含了完整的故事.

WebKit是新时代的IE6,微软修改移动版IE11

- - Solidot
微软IE团队调查了500家最流行网站在不同移动浏览器中的行为,发现很多网站会将移动版IE11浏览器识别为桌面版本,并特别为基于WebKit的浏览器优化. 基于WebKit引擎的浏览器如Mobile Safari统治了移动浏览器市场,这些浏览器包含了许多非标准化的特性,此类的优化会给不支持这些特性的浏览器带来问题.

Oculus Rift :开拓虚拟现实新时代

- - 爱范儿 · Beats of Bits
Oculus Rift 是一款激动人心的设备. 它不仅仅有改变视频游戏界的潜力,而且有可能打开虚拟现实的新时代,使人们以新的方式进行各种交互,玩游戏、在线教育,甚至畅游互联网,都会有一种完全不同的面貌. 这令人兴奋,同时也有一丝隐隐的不安. 全球最顶尖的游戏公司之一 Valve 已经表示了对 Oculus Rift 的支持,而它看重的不仅仅是游戏方面,而且包括它在内容交互方面的巨大潜力.

合成皮肤可替人体软组织 有望引领整容新时代

- longman - cnBeta.COM
据欧洲设计和技术网站Gizmag近日报道,美国科学家在《科学・转化医学》杂志上撰文指出,他们研发出了一种新的生物合成材料,只需在皮下注入这些可永久取代身体软组织的光激活移植物,医生们就可对创伤或疾病造成的组织损伤进行修复和功能重建. 这种非侵入式的移植技术尤其适用于面部整形,避免了现有技术存在的疤痕形成及功能丧失等问题,有望开启新的整容时代.