读书笔记:对线程模型的批评

标签: 技术读物 操作系统 程序设计 编程语言 Design | 发表时间:2011-05-03 10:23 | 作者:Ian.sino 阿贡
出处:http://coolshell.cn

——感谢Ian.Sian投递本文——

多线程模型是主流的并发编程模型。在过去几十年来,多线程模型一直是开发并发程序的有力工具。然而,它的历史并非总那么美好。1997年,NASA 的“火星探路者”号在执行任务的途中遭遇了严重的时序异常(参见 “What really happend on Mars“,注目 follow-up 中的现身说法),无法发回探测数据。如果不是 NASA 远程刷新了程序,它的结局就只能是报废在火星上。这一切都是由程序中潜藏的一个优先级反转 bug 造成的。更早的例子还有80年代的一系列 Therac-25 型医用粒子加速器事故。在这些加速器释放出的过量辐射照射之下,数位病人死亡。事后调查显示,至少有一次发生事故的原因,是加速器的控制软件中,存在一个只能由特定操作序列引发的竞争条件 bug。你也许认为这些只是陈年往事,但是直到现在,即便是世界500强公司们高价买来的信息系统,也同样避免不了这些问题。这导致许多程序员认为线程是个潘多拉魔盒,对它采取能躲就躲的态度。然而近来计算机的发展使得躲猫猫的空间越来越小:随便从市场上淘一个CPU,它里面也有不止一个核心。未来的程序员只会有越来越多的机会接触到并发编程,而无法再独善其身了。

加州大学伯克利分校教授,爱德华 A. 李在2006年做了一次题为《线程的麻烦 (The Problem with Threads)》的学术报告。在报告中他提到:看上去,多线程只是对核心语言的小小扩展,甚至可以以第三方库的形式存在。但实质上,多线程程序和原有的核心语言编写的程序已经完全不同了。其原因在于,由于多线程程序可能以任意的次序交错执行,程序再也无法像顺序执行时那样产生确定的结果。多线程程序容易编写(因为写的是顺序程序),但是难分析,难调试,更容易出错。

在我的想法中,产生问题的根源,是多线程模型作为对并发问题的一个抽象,是很不完善的。抽象的实质是对问题的转换。我们可以把抽象应用于一个问题,把它转换成另一个(或许)更简单的问题来解决。解决了转换后的简单问题,就意味着解决了原有的困难问题。严格来说,一个抽象一定要保存原有问题的结构,同时去除无关细节。但是,由于我们生活的世界并没有什么东西是完全“严格”的,现实中使用的抽象有时会隐藏解决问题的关键细节,或者残留一些不该漏出来的东西。评价一个抽象的好坏,也就不止是看它能节省多少代码,和它的界面有多优美这么简单,同时还要看看在一个问题被抽象转换之后,留了下来的细节还能不能好好地解决它。

我们可以从这个意义上理解为什么线程模型是个很糟糕的抽象。一方面,对解决问题很关键的细节(如执行次序)被隐藏起来并受到了粗暴的对待。另一方面,线程模型极力兼容顺序程序的设计思想也使得如共享变量这样的,与线程不兼容的细节依然残留在程序员们的视线之内。我们无力控制程序的执行次序,而我们程序的正确性却依赖于对共享变量的有序变更。可以说,线程提供给我们的抽象简直是千疮百孔。我们还能用它干活,只是因为我们手里还有加锁机制,而它可以部分地堵上线程模型的漏洞。讽刺的是,引入加锁机制解决问题的同时,又带来了新的问题,所以我们编写多线程程序总会遇上死锁,活锁,优先级反转……等等。

同样作为并发编程问题的抽象,角色模型(Actor Model) 比线程模型好就好在,它的资源分享不像线程模型那样通过共享变量来进行。角色模型中的资源分享只能通过特定的机制(消息传递)来进行。你在角色模型里依然可能犯错误,如你可能制造死锁,也有可能造成优先级反转。但是没有共享变量就意味着没有了竞争条件,所以绝大部分资源也用不着上锁了。这样一来,原先至关重要的细节变得不那么重要,问题就这么解决了。

一般来说,在修复一个糟糕的抽象时,可以采取的策略分如下两类:

  • 把造成问题的那部分抽象拿掉,直接露出底层的细节
  • 换一个和底层兼容性更好的抽象模型

MapReduce 为例,它在解决分布式计算问题时,采取的是第一类策略。与现时流行的做法相反,MapReduce 并不试图制造计算是在单一场所完成的假象(流行话讲叫“云计算”),相反它需要程序员自己把问题拆分到集群中不同的机器上。同时,它却隐藏了大量其他细节。这种另类策略导致批评 MapReduce “太底层,不通用” 的声音不绝于耳, 然而这正是 MapReduce 聪明的地方。它放弃面面俱到,集中精力于高效地解决一小类问题(这类问题与排序问题有类似的结构),同时对其他的问题故意视而不见。它的流行证明了这一策略的成功。

角色模型,通信进程(Communicating Sequential Processes, CSP),以及函数式编程(FP)在应对并发编程问题时不约而同地选择了第二类策略。它们采用了与并发兼容性更好的抽象。角色模型与通信进程从线程模型的问题中抹去了共享变量,纯粹 FP 则抹掉了“变量”的可变性。CSP 还可以降低程序执行次序的不确定性(因为在CSP中执行次序默认是确定的,不确定性必须在程序设计时显式声明)。由于这些努力,这几种模型都避免了落入线程模型的麻烦中,得到了对并发问题的更优美的解法。我们可以说,这些模型提供的抽象比线程模型的都要好。很遗憾的是,它们尽管优美,但却乏人问津。角色模型与通信进程目前不被任何主流操作系统原生支持(微软在 Windows 7 附带的新并行运行时 ConcRT 中加入了基于角色模型的 Asynchronous Agents Library,使得状况稍微改观了一点)。FP 的年岁几乎和计算机语言的历史一样古老, 但它的市场份额直到现在也小得可怜。

也许一切都是因为线程模型表面上那迷惑人的简单性,以及墨菲定律的变体:布劳尔技术惯性定律(已经成功的技术在新的,更好的技术出现时也会赖着不走)。我们曾经接纳了一个有缺点的解决方案,而现在我们被捆绑在这个方案上了。我们为线程模型写了成百上千万行的代码,而现在这些代码的重量束缚住我们的手脚,使得我们无法前行。

解决线程模型带来的问题的正确做法,是推广新的,更完善的模型。既然解决问题的阻碍同时来自于新技术的低认知度和现有代码的拖累,很自然地有两个方面的工作要做。一、使得新技术更容易被多数程序员使用,二、想办法让现有的代码和新技术兼容。

在兼容老代码这一头,我们已经有了一些行动。微软在 Windows 7 中提供一个称为用户模式调度 (UMS) 的功能。UMS 可以将内核模式的线程转换为用户模式线程,而应用程序可以自己提供一个 UMS 调度器来调度它们。这意味着,我们现在有机会重载掉系统调度器的默认行为,而根据应用自身的特点给出更合理的调度安排来。这个功能可以用在构造更容易使用的并发模型上,这样开发的模型可以与老代码兼容(但 UMS 有一个让人迷惑的限制:只能用在64bit 的Windows 7 版本上)。

同样地,在推广新技术方面,现在也有了很多成果。除了角色模型外,事务性内存(这又是一种避免竞争条件,从而避免加锁的方法)正在研究中;CSP 已经有了数个实现(如由 Kent 大学开发,针对 Java 的 JCSP),同时还有针对 CSP 的模型检证工具;至于 FP,最近因为人们认为 Web 系统的建模可以在函数式编程范式中更好的表达,FP 正在唤起人们的注意。我们缺的只剩下新技术的成功应用范例(实际上,前面的技术并不是没有成功范例,我们缺的是经验能够大规模运用的范例 ),以及一支理解这些技术的程序员大军了。对于这后一条,我甚至想,既然多线程编程唯一”容易”的事情是写代码,何不做出一种工具来让程序员们可以用写顺序程序的思维来在这些新模型中编写程序呢?这样的工具会帮助程序员利用线性程序的思维来理解代码,但是同时又让人注意到自己的改动正在影响系统的哪一部分。如果新模型的代码变得好理解了,也许更多的人会使用它们。

(全文完)

相关文章

相关 [读书 笔记 线程] 推荐:

读书笔记:对线程模型的批评

- 阿贡 - 酷壳 - CoolShell.cn
——感谢Ian.Sian投递本文——. 多线程模型是主流的并发编程模型. 在过去几十年来,多线程模型一直是开发并发程序的有力工具. 1997年,NASA 的“火星探路者”号在执行任务的途中遭遇了严重的时序异常(参见 “What really happend on Mars“,注目 follow-up 中的现身说法),无法发回探测数据.

设计高效的线程安全的缓存--JCIP5.6读书笔记

- - ITeye博客
[本文是我对Java Concurrency In Practice 5.6的归纳和总结.  转载请注明作者和出处,  如有谬误, 欢迎在评论中指正. 几乎每一个应用都会使用到缓存, 但是设计高效的线程安全的缓存并不简单. // 使用synchronized同步整个方法解决线程安全. Memorizer1使用HashMap缓存计算结果.

《精力管理》读书笔记-1

- 黎明 - 战隼的学习探索
这本书是我前几天阅读的,这是当时的阅读记录:. #每天一本书#,70天,2011年2月25日,阅读书籍《精力管理》这本书的理念不错,但内容水分很大. 但这个理论正好给自己的时间管理观点和规划做个补充,评价3.5分. 时间管理应该根据自己的精力进行安排和调整,周期性地补充精力,来平衡精力消耗. 需要对你的精力进行海战略性的规划和应用,并把它当成一种习惯.

分享读书笔记 Data Mining Concepts and Techniques

- redhobor - BlogJava-首页技术区
Data Mining涵盖的内容非常多,学着学着就走进乱石阵,看不到大的picture了,Data Mining Concepts and Techniques是本经典的好书,虽然有些细节并不详尽,(如果详尽就变成圣经了)可以用它来把data mining的知识点结成一张网. 它包括数据的预处理,frequent patterns,decision tree, netural network, regression, clustering, time series等等很多方面.

读书笔记:少有人走的路

- zhoujg - 博客园-周金根
       记得好像是五六年前在公司投稿后得到一本书,这本书叫做《少有人走的路》. 当时看了一下,简单翻阅之后发现看不下去了,于是一直搁置着. 后来有同事知道我有这本书,她们想我借阅,并且说是听别人介绍才知道这本书的. 我也不知道她们后来得了之后有什么感受,反正还给我之后我还是放着. 这本书于是就静静的在我这个搁置了好几年.

云计算读书笔记(二)

- Gabriel - 博客园-首页原创精华区
google云计算服务包括:google文件系统GFS,分布式计算编程模形MapReduce,分布式锁服务Chubby,分布式结构化数据表Bigtable,分布式存储系统Megastore以及分布式监控系统Dapper等. GFS提供了海量数据的存储和访问能力. 分为三类角色,client(客户端),Master(主服务器)和Chunk Server(数据块服务器).

《思维导图》读书笔记

- Spectrophobia. - 读书笔记
今天分享的图书《思维导图》英国著名心理学家东尼·博赞在研究大脑的力量和潜能过程中,发现伟大的艺术家达·芬奇在他的笔记中使用了许多图画、代号和连线. 他意识到,这正是达芬奇拥有超级头脑的秘密所在. 在此基础上,博赞于19世纪60年代发明了思维导图这一风靡世界的思维工具. 这本书中过于夸大思维导图的作用而且废话过多,没有必须细读.

读书笔记 - How Google Test Software

- - CSDN博客研发管理推荐文章
(《谷歌如何测试软件》)的确为神秘谷歌公司揭开一层面纱,讲到了谷歌的代码文化和测试文化,讲到了角色划分,职责划分,测试种类划分,讲到优秀的不同角色的人应该具有什么样子的,讲到测试的创新和工具,还有大量的人物访谈. 这里的笔记主要包含:个人感兴趣的,值得备忘的,需要后续关注的东西记录.

《百问知识管理》读书笔记

- - 海涛的成长碎碎念
当时是为了买给妹子买 @秋叶 的大项目售前的那本书的,为了凑单免运费顺手把这本书也扔到了购物车里面,这也算是真爱了,支持大叔的同时还不忘支持下大叔的红颜知己,整本书大概花了两趟地铁的时间加上晚上睡觉前的一个多小时的时间看完的,不是很厚的一本很实用的工具手册. 公司部门在年中开会的时候提到了知识管理这块的一些东西,因为之前我一直在做个人知识管理的一些东西,业界除了一些企业知识管理的内容,所以部门知识管理这块就交给我在负责了,因为对企业知识管理大多了解都是理论上的,实践性的东西还真没怎么做过,还是有点发虚的,读完这本书算是松了口气.

《精益创业》读书笔记

- - CSDN博客推荐文章
        创业的过程是否可以总结、规范、提炼出共性和成功的方法. 《精益创业》无疑是这样的一本书,书中提到的很多创业观点其实平时我也领悟过,但是能以书面、可描述的语言总结出来,这是作者的厉害之处.         精益创业 (Lean Startup) 总结起来就是用3个动词驱动3个名词的轮回迭代过程:IPD -> BML ,即: .