志愿计算:足不出户,窥探星辰

标签: 学科 计算机科学 分布式技术 原创 大众科学 | 发表时间:2011-04-06 07:38 | 作者:方弦 GuanHong
出处:http://songshuhui.net

按语:这篇文章在我的电脑上躺了很久了,一直没有写完。近日松鼠会受分布式拒绝服务攻击(DDoS)下线数天,有感于类似的分布式技术能被不法分子利用作凶器,也能为科学家利用而探索万千世界,一鼓作气赶写完了这篇文章,希望能让大家看到分布式计算技术的善意一面。

在我打下这行字之时,我的电脑正在分析着无线电信号,尝试在其中找到一种特殊的模式。这些无线电信号可能来自数万光年外的星球,而我的电脑正在寻找的,是一种特殊的无线电波模式,它最可能来自一种特殊的天体系统:由两颗超高密度的天体——其中一颗是中子星或者黑洞——紧密围绕组成的双星系统。这种系统非常稀少,现今发现的不过几十。

不要被术语吓倒,其实我和你一样,对天体物理所知甚少。我所做的,只是简单地下载了一个叫BOINC的软件,加入了Einstein@home项目,让它利用我的电脑空闲时的资源,为科学而计算。

大众科学

长久以来,科学似乎一直给人的印象,是少数有天赋的科学家才能成就的伟大事业。从牛顿到爱因斯坦,从波义耳到凯库勒,科学一直以来都有着这种精英主义式的印象。才智似乎是参与科学不可或缺的要素。但在近代,随着计算机的发展,起码在实验科学中,数据逐渐变得重要起来。现在的技术条件越发进步,使得研究人员能获得大量的数据,而在以前这是不可想象的。例如密立根的油滴实验,当年需要研究人员肉眼盯着实验仪器手工记录油滴的运动状况,而现在,如果配备上适当的图像处理系统,研究人员只需简单敲敲键盘就能获得数据。

当数据丰盛起来之时,难题也随之而来:单凭人类的能力,无法处理越来越海量的数据。一个极端的例子是在日内瓦的大型强子对撞机(LHC),它每秒钟吞吐的数据量可达800MB,每秒的数据能填充一张CD还有余,一天下来大约有10万张CD-ROM,大概一万张DVD。这种“能压死人”级别的数据,如果没有计算机的强大计算能力的话,研究人员早已被数据淹没。

计算机在数据处理中的地位日渐强化,也意味着只要拥有计算机,一般人也可以参与到科学研究中。尽管没有实验仪器,对分析后数据的意义也不甚了解,但通过运行特定的数据处理程序,一般的科学爱好者也可以在科学研究中助研究人员一臂之力。就像我虽然不懂天体物理,但仍能搜寻新的天体,算是能一偿夙愿。另一方面,研究人员也需要对海量数据处理的能力。希望为科学出一份力的志愿者,需要计算能力的研究人员,两者干柴烈火一拍即合。

这种新的科研形式,就是志愿计算。

蓬勃发展

在1996年1月,George Woltman将他编写的Prime95程序发布到网上,并开始组织一场针对梅森素数的互联网大搜索,这个宏大的计划被命名为GIMPS(Great Internet Mersenne Prime Search)。当时,最强大的个人电脑CPU不过是奔腾Pro,奔腾II还要在一年半后才推出。在短短一年内,数以千计的数学奇客(Geek)参加了这个项目。也正是在这一年,一位参加者Joel Armengaud在他的电脑上发现了这个项目的第一个梅森素数:21398269-1,打破了当时最大质数的世界纪录。这也许是Woltman意料之中的,但也许在他意料之外的是,他的这个项目开创了志愿计算的新时代,也是普通人参加科学研究的新时代。

至今,志愿计算仍在蓬勃发展。从寻找梅森素数的GIMPS到寻找外星文明的SETI@home,从搜寻引力波的项目Einstein@home到计算蛋白质折叠的Rosetta@home,这些志愿计算项目在研究领域上形成了一个很宽的谱。直至现在,活跃的志愿计算项目数量已经过百,其中新项目多半使用了志愿计算平台BOINC。这个平台与SETI@home这个人气最高的志愿计算项目是由同一个小组开发的。这就不难理解为何小组的负责人,加州大学伯克利分校教授David Anderson,会被一些志愿者视为这个领域的偶像了。

同时,志愿者的数量和捐献的计算能力也在不断增长。仅在BOINC平台上,目前活跃捐献计算能力的志愿者大约有30万名,投入了大约50万台计算机,计算能力大约是5.8TFlops,计算能力相当于2台目前最强的超级计算机——天河1A超级计算机。虽然总量很大,但志愿计算利用的,实际上只是计算机的空闲资源。在技术不断发展的今天,一般家用电脑的性能已经远超人们的想象。一台电脑,如果只是上上网写写报告的话,用到的CPU资源不过20%,而剩下的80%相当于浪费了。志愿计算利用的,正是这80%的资源。

聚沙成塔,对于研究人员来说,志愿计算项目就像一台便宜的超级计算机。如果研究课题能吸引大众兴趣的话,只要建立一个项目并做适当的宣传,研究人员就可以获得相当充足的计算资源。当然,这些运算能力并不是凭空得来的。谁能抓住志愿者那慷慨的心,谁就抓住了巨大的计算能力。项目的流行程度其实也就反映了该领域的流行程度。目前来说,最热门的是SETI@home,这反映了人们对地外文明的关注,其次就是物理类、生物医药类和环境气候类。

硕果累累

虽然只有15年的历史,但不少领域得益于志愿计算,作出了不少成果。基于不同志愿计算项目的结果发表的论文数以百计,而且还在不断增长中,其中不乏高素质的研究成果。

例如Einstein@home,本来是用于处理引力波探测器LIGO和GEO 600的信号,尝试找到广义相对论所预言的“引力波”——时空的波动。大约在2008年,他们开始了一个新的子项目:搜寻短周期脉冲双星。脉冲双星(Binary Radio Pulsar,简称BRP)指的是两颗高密度星体——至少其中一颗是脉冲星——相互绕转组成的双星系统。这种双星系统会引起不小的时空弯曲,理论上来说也会发射引力波,可能成为以后探测的重点观察对象。此前多年的努力也只发现了8个BRP,但仅仅经过两年,这个子项目就找到了两个新的BRP。这也属于一种歪打正着。

另一个更现实的项目——Climate Prediction.Net——进程则稳定得多。这个项目旨在通过计算机模拟来研究各种不同要素对气候的影响。他们先后研究了洋流、硫化合物对气候稳态的影响,然后又对增加的二氧化碳浓度如何逐步演变气候进行了研究,而研究结果很多发表在重要的期刊上,比如说Nature。由于掌握了巨大的计算能力,这个项目的计算结果使研究人员对全球气候的变化有了更深的了解。在全球变暖的背景下,这些结果看来是相当重要的。

其实很多研究团队,如果有足够的计算能力的话,也能做出不俗的工作。但由于经费的问题,他们常常不能如愿。如果只需要下载一个软件自动运行就能帮助这些研究人员,那么何乐而不为呢?

——————————

对志愿计算感兴趣或者有别的疑问的朋友,欢迎访问中国分布式计算总站(http://www.equn.com/),在站点维基上有丰富的资料介绍。

图片取自中国分布式计算总站与LHC官方网站,数据采自2011年4月3日。

相关 [志愿计算 星辰] 推荐:

志愿计算:足不出户,窥探星辰

- GuanHong - 科学松鼠会
按语:这篇文章在我的电脑上躺了很久了,一直没有写完. 近日松鼠会受分布式拒绝服务攻击(DDoS)下线数天,有感于类似的分布式技术能被不法分子利用作凶器,也能为科学家利用而探索万千世界,一鼓作气赶写完了这篇文章,希望能让大家看到分布式计算技术的善意一面. 在我打下这行字之时,我的电脑正在分析着无线电信号,尝试在其中找到一种特殊的模式.