Google 发布帮你整理乱七八糟数据的 Google Refine

标签: Google新闻 Google Refine Spreadsheets | 发表时间:2010-11-18 10:08 | 作者:gkp willian
出处:http://www.guao.hk

google_refine

Google Code出现了一个新的 Google 产品:Google Refine。用户在电脑上运行这个应用程序后就可以通过浏览器访问之。这个东西的主要功能是帮用户整理数据,接下来的演示视频效果非常好:用户下载了一个 CSV 文件,但是同一个栏中的同一个属性有多种写法:全称,缩写,后面加了空格的,单数复数格式不一的。。。但是这些其实都代表了同一个属性,Google Refine 的作用就是帮你把这些不规范的写法迅速统一起来。

其实我很不明白 Google 为什么不把这个功能放到 Spreadsheets 里面,而是单独发布一个应用呢?

点击这里进入 Google Refine 项目页面,点击继续观看三段演示视频。

点击查看原始视频(123

via downloadsquad


© gkp 发表于 谷奥——探寻谷歌的奥秘 ( http://www.guao.hk ), 2010. | 14 条评论 | 永久链接 | 关于谷奥 | 投稿/爆料
Post tags: ,

相关 [google 数据 google] 推荐:

谷奥: Google = Google+

- 吞佛 - 谷奥聚合——谷奥主站+谷安 aggregator
在上周举办的Google Zeitgeist 2011大会上,John Battelle问Larry Page:在Google大部分的历史里,人们会想到搜索,那么Google品牌=搜索. 但在随后Google的发展史里,Google品牌会等于什么. Larry Page并未直面回答这个问题,至少没有从市场角度来回答.

Google 数据解放计划发布 Google Takeout 工具,可导出 Google+ 信息

- 加州旅客 - 谷奥——探寻谷歌的奥秘
2007年开始建立的Google Data Liberation Front(数据解放计划)目的很明确,就是让你解开束缚,可以自由的导出在Google网站和产品里的个人信息. 今天,他们发布了Google Takeout这个新的产品,可导出更多产品里的信息,尤其是新的Google+里的信息,包括:.

Google Tasks Porter 可帮你导入/导出 Google Tasks 数据

- lichzy - 谷奥——探寻谷歌的奥秘
Google Tasks Porter作为 Data Liberation Front 的一部分发布,它可以帮助你导入/导出 Google Tasks 数据. Google Tasks Porter支持导入/导出的数据格式包括:. Microsoft Outlook(通过CSV). Remember the Milk(通过iCalendar导出,通过邮件导入).

Google 发布帮你整理乱七八糟数据的 Google Refine

- willian - 谷奥——探寻谷歌的奥秘
Google Code 上出现了一个新的 Google 产品:Google Refine. 用户在电脑上运行这个应用程序后就可以通过浏览器访问之. 这个东西的主要功能是帮用户整理数据,接下来的演示视频效果非常好:用户下载了一个 CSV 文件,但是同一个栏中的同一个属性有多种写法:全称,缩写,后面加了空格的,单数复数格式不一的.

Google Takeout 开始支持导出 Google Voice 数据

- Lee Jia - cnBeta.COM
Google Takeout是Google的数据导出服务,Google利用该服务允许用户将各个Google产品的数据导出,不会利用自己的平台优势而将用户死死的拴在Google这一棵树上吊死(喂,Facebook. 最近Google Takeout开始支持导出Google Voice的数据.

Google推出云端数据库:Google Cloud SQL

- Johnny - 36氪
昨天Oracle推出了数据库即服务和Java平台即服务,现在处于开发者预览阶段,今天,Google在博客中宣布,推出自己的基于MySQL的云端数据库:Google Cloud SQL. 目前只支持Google App Engine. 下面是Google在博客中提到的一些功能:. 不需要维护和管理 – 我们帮你管理数据库.

Google Takeout 开始支持导出 Latitude 和 Google Reader 的数据

- - 谷奥——探寻谷歌的奥秘
由 Data Liberation Front创造的Google Takeout服务是一个帮你导出Google各种数据的服务,方便你迁移到其它服务上继续使用. 其口号是“用户应该可以控制他们在任何Google服务所创建的数据,我们团队的目标就是使其更简单的转移数据”. 今天开始Latitde和Google Reader两个服务也加入到了Google Takeout之中,让你导出自己的足迹数据和RSS阅读数据.

Google Cloud SQL 云端数据库开测

- xcv58 - 谷奥——探寻谷歌的奥秘
很多Google App Engine用户都想要一个简单而传统的数据驱动应用,于是今天Google宣布开放测试Google Cloud SQL. 这是一个接近传统数据库的云端服务,并可与App Engine整合:. 不需要管理员和维护,Google会帮你搞定一切. 高可靠性和可用性,你的数据会在多个数据中心之间同步,即便一个出问题也不会影响使用.

Google 搜索背后的数据

- - 爱范儿 · Beats of Bits
对于互联网用户来说,搜索是一件非常简单的事情. 在搜索框输入关键词,回车(或点击搜索框),等待. 而对于搜索公司来说,这是一个复杂的技术问题. 从你开始搜索到获得结果的短暂时间里,究竟发生了什么. 从 Google 发给 Mashable 网站的 这幅信息图里,我们可以了解到一些相关的数据. 在你进行搜索之前,Google 的搜索爬虫已经走遍了整个网络,它们从一个链接跳到另一个链接,将数据带回 Google 的服务器.