谁来保存互联网上的历史资料?

标签: 业界趋势/Trend 历史 图书馆 英国 | 发表时间:2013-04-05 15:45 | 作者:崔绮雯
出处:http://www.ifanr.com

Disappear_in_Time_by_Nazkam
是的,我们将越来越多的东西搬到互联网上:图片、映像、新闻、书籍、社交……但你认为互联网上的内容会一直存在吗?现有的机制,就是用让新消息冲刷旧消息,将“新”的价值放大,“老”的价值弱化。互联网还没有建立“保存有价值的历史资料”的系统。

英国的学者悲观地认为,互联网上的“历史资料”会随着网站的关闭和内容的删除而消失,他们称之为“21 世纪的数字黑洞”。很多现在看来平常但却具有历史价值片段,将会随着互联网的变迁而消失得无影无踪。

如果你想要看到人们过去生活中的某一天,那么你需要连接到互联网。我们已经丢掉过去 10 年的资料了。

为此,英国数个图书馆联手开展一项 历史资料保存计划,将互联网上的内容保存下来——涵盖杂志,图书,学术论文,文学,新闻,评论,包括在 Twitter 和 Facebook 上公开发布的内容,都会收集存底,以便做历史研究使用。初始项目将会从 500 万个英国的网站中保存超过 10 亿个网页内容,这还不止,智能手机和平板设备的新闻内容,以及电子书,也会被存底。

与这个保存计划同时进行的是 “百强网站”的评选。这些网站内容将会被优先保存为历史和研究资料。网站的覆盖面广泛,除了掌握话语权的媒体,还包括电商网站 eBay,伦敦时尚街拍博客 Style Scout。项目负责人 Ben Sanderson 认为,他们是想要给以后的历史学家和学者提供研究资料,让他们能全方位地了解现在的人们是如何生活、阅读。打扮等等。

12 个月内保存 10 亿个网页,这已经比过去 300 年的工作量要大了,在过去的 300 年中,人们从纸质报纸和杂志当中储存了总共 7.5 亿页的资料。项目负责人们认为这种资料的搜集就如同将互联网“截图”,以备未来研究使用。Ben Sanderson 今天向 卫报抱怨,在英国,即使是 2005 年的发生的“7·7”爆炸案,到现在也已经丢失了大量的历史资料:图片以及文字。

互联网的按时间“倒叙”放置内容的方式,难以让优质和有历史价值的信息被珍视和保存。所以我才更加喜欢类似 Brain Pickings 和 Medium 这些以保存推荐优质内容为先的服务。同时也希望能够有更多类似文中的保存互联网历史资料的项目出现,毕竟现在按照时间“倒叙”放置信息的方式已经让我前所未有地浮躁。

一个显著的例子是,两天前的新闻我只记得三亚的惊天大趴体。

题图来自: deviantart.com

保持对世界的好奇心

#欢迎关注爱范儿认证微信公众号:AppSolution(微信号:appsolution),发现新酷精华应用。



爱范儿 · Beats of Bits | 原文链接 · 查看评论 · 新浪微博 · 微信订阅 · 加入爱范社区!


相关 [来保 互联网 历史] 推荐:

谁来保存互联网上的历史资料?

- - 爱范儿 · Beats of Bits
是的,我们将越来越多的东西搬到互联网上:图片、映像、新闻、书籍、社交……但你认为互联网上的内容会一直存在吗. 现有的机制,就是用让新消息冲刷旧消息,将“新”的价值放大,“老”的价值弱化. 互联网还没有建立“保存有价值的历史资料”的系统. 英国的学者悲观地认为,互联网上的“历史资料”会随着网站的关闭和内容的删除而消失,他们称之为“21 世纪的数字黑洞”.

终结互联网历史的 10 大流言

- anant - 果壳网 guokr.com - 果壳网
因特网曾用于军事网络部署,以应对核攻击. 阿帕网(ARPANET)作为全球互联网的鼻祖,第一次使用了报文交换技术,并且目前业已证实,该技术是由美国国防部高级研究计划局(DARPA)提供资金支持的. 其设计初衷是,基于该技术建立的网络可用于各所大学与科研单位之间的相互交流,而不必担心网络连接不稳定问题.

互联网广告过滤的小历史

- 纸条 - 月光博客
  摘要:Adblock Plus的历史几乎就是从网景公司将Netscape的大部分源代码以Firefox之名开源后,互联网的广告过滤史. 目前,Adblock plus不仅是Firefox上用户最多的扩展(活跃用户1000~1500万,是排名第二的的两倍).   Adblock系列扩展程序的最重大的贡献:.

“十年”经历互联网架构的演进历史

- - ITeye博客
一个成熟的大型网站(如淘宝、京东等)的系统架构并不是开始设计就具备完整的高性能、高可用、安全等特性,它总是随着用户量的增加,业务功能的扩展逐渐演变完善的,在这个过程中,开发模式、技术架构、设计思想也发生了很大的变化,就连技术人员也从几个人发展到一个部门甚至一条产品线. 所以成熟的系统架构是随业务扩展而完善出来的,并不是一蹴而就;不同业务特征的系统,会有各自的侧重点,例如淘宝,要解决海量的商品信息的搜索、下单、支付,例如腾讯,要解决数亿的用户实时消息传输,百度它要处理海量的搜索请求,他们都有各自的业务特性,系统架构也有所不同.

互联网是人类历史的一段弯路吗?

- -
本文大约 40000 字,阅读需要 102 分钟,由于存在主动或被动删稿风险,建议先行保存. 本文写成于2019年12月,原本预计 2020 年 1 月发表,疫情爆发后一直感觉需要加笔. 但时至 2020 年 4 月,新冠疫带来的变化似乎并未影响本文叙事,新加内容也仅起到案例更新作用,遂以去年完稿的版本发布.

移动互联网=移动+互联网?

- 可可 - It Talks-魏武挥的blog
从名词上看,移动互联网似乎就是互联网加上一个移动. 但移动互联网远不是“移动的互联网”那么简单. 它的本质——网络部分,就和互联网大不相同;而它的表现——移动部分,也正因为移动,造就了很多和互联网相当不一样的商业机会. 而更重要也是很多人并没有注意到的是,它可能会改变整整一代人的信息处理习惯. 从网络部分而言,我们都知道,理论上互联网是没有拥有者的.

《枪版历史》

- Dre.J - 【枪·东东枪的枪】
旧笑话书中说,曾有父子二人在街上同行,有人见了,不识其子,便问他:这一位是何人. 这父亲听了,回答说:“此人虽然是朝廷极宠爱礼部尚书真正外孙第九代的嫡亲女婿,却是我生的儿子. 还有一则类似的笑话,也被很多笑话书收录过,说的是某时某地曾有一老妪,叫作王婆,这王婆家中富足,且素喜矜夸. 年岁大了,为自己准备了一口寿材,请一道士在上头题字,银钱多给,只求多写些好字,也好在乡邻面前夸耀争光.

DOS的历史

- andi - 阮一峰的网络日志
昨日(7月27日),微软公司的DOS操作系统迎来了30岁生日. DOS是历史上一个划时代的产品,标识着PC(个人电脑)的崛起和普及,对计算机行业影响深远. 只有了解DOS的历史,才能理解今天的计算机工业从何而来. 1974年4月,Intel推出8位芯片8080. 这块芯片的体积和性能,已经能够满足开发微型电脑的需要,标志微机时代即将来临.

重新索引互联网

- keso - 爱范儿 · Beats of Bits
重新索引互联网 Facebook 雇佣公关抹黑 Google 的过程已经水落石出. 问题是: Google 那么多产品, Facebook 为何对 Social Circle 这么敏感. Google 号称自己的使命是“索引互联网”. 这件事的难点并非派出多少爬虫,而是对收集来的海量内容做排序:怎样让真正重要的网页,的排到 Google 搜索结果的前面来.