寻宝处理器 《大话处理器》新书出炉(序一与网友评论)

标签: 行业动感 | 发表时间:2011-08-29 23:13 | 作者:muxiqingyang009 Ken
出处:http://www.tektalk.org

序一  寻宝处理器的引人入胜之旅

         当出版社的编辑介绍万木杨的这本书给我时,我对书名《大话处理器》是有一定担心的,其一:处理器和计算机的发展几十年来风起云涌,其间有天才的创新、看似偶然的分叉和囿于商业市场考量的成功与失败,一部技术发展史绝不比波谲云诡的社会史逊色。一部“大话”处理器的书会不会流于一部围绕处理器发展种种轶事的大话技术史?读书时固然会津津乐道,兴趣斐然,然而掩卷沉思后,会不会仍然无法对处理器的体系结构有更清晰的认识?其二:处理器的发展是和软件、操作系统的发展互为作用的,其中很多技术点和概念都值得深入讨论。采用“大话”的方式能否既保证技术书籍叙述的准确性,又不至于陷入对某些概念旁征博引的“Rat hole”式的罗列,而变得像很多剪贴式编著的IT书籍一样?

         但其后数次断续读稿时沉浸其中的体验打消了我的顾虑。我几次阅读书稿都是在出差途中(如飞机上),一个很深的体验是一旦开始阅读就不愿终止,一直读到不得不将书稿收起走路为止。另一个体验是,从任何一个间断点,都可以把本书当作入口,去找寻别的书籍进一步深入学习其中的一些关键技术,就好像函数调用一般,这是我所期望的带领读者进入处理器世界的导游书籍,因此非常愿意向广大的读者推荐这本书。

         在技术书籍的阅读中,我偏爱爱因斯坦阐释的方法——“在所阅读的书中,找出可以把自己引向深入的东西,把其他的一切统统抛掉。”这就是抛掉使大脑负担过重和把自己诱离要点的一切。

         万木杨的这本书,在选材上围绕处理器的核心技术,从计算机发展的形态、历史展开叙述,在简略介绍了处理器的周边设备后,迅速深入处理器的抽象模型,以计算机软件生态系统中最重要的指令集体系结构ISA切入到探索处理器的微架构,对处理器微架构的一些核心技术,如流水线、乱序执行、指令级并行、线程级并行、缓存结构和算法、缓存一致性等概念,言简意赅地做了原理阐释。而了解这些核心概念,是理解其后第六章优化代码效率的基础。窃以为这些章节是本书的“hardcore”,很值得一读。

         在本书的写作风格上,作者运用了很多崭新的网络元素和鲜活的比拟来厘清概念,比如用《我的兄弟叫顺溜》中的顺溜装配子弹的例子来开展指令流水线的讨论,既不流于表面、为举例而举例,又一以贯之地将每个案例充分展开、把问题说透,这样的例子在本书中比比皆是,也是我推荐该书的原因之一。这体现了“抛掉使大脑负担过重”的原则,以及作者对所叙述的技术的深度把握。没有这种把握,是很难用好这种比拟的,反而容易变成“画虎不成反类犬”。

        由于长期从事性能优化工作,此前也出版了一本针对并行优化指南的书,因此对本书中阐述并行处理和编写高效代码的章节仍觉意犹未尽,这让我想起了两件事:

         其一,我在2001年左右从事针对多核DSP的手写汇编代码优化工作,就是本书里所总结的VLIW并行实现机制,当时一个很深的感触是,人类大脑的并行度很低,至少在汇编这个层级,能够持续对多个计算单元实现高效并行处理编程的上限恐怕就是四级并行了,人的大脑有所谓“一心不可二用”的限制,因此,此后在IA平台上,多核、多进程一直到大规模集群的并行开发的方向就很清楚了,就是必须依赖高级语言的开发工具,支持并行实现的编译器、数学库和线程,MPI进程追踪工具和类似Vtune这样的指令微架构行为的示波器,来解放人的大脑。另一方面就是开发新的并行编程模型和语言,进一步释放多核处理器的性能。

        其二,在一本论述并行超级计算机体系架构的英文专著上,我曾读到一段话,似可借来总结处理器性能发展的方向。即,要做快、做好一件事,基本上有三种方法。一是把事情本身缩短、少做事,这就是处理器流水线效率、分支预测命中率等等技术的发展,体现在软件上就是更好的算法和更短的代码关键路径。二是做得更快、更勤些,这就是处理器上更多的浮点计算单元、更高效的缓存、新的高效指令集直到AVX这样的高密度向量计算指令。三是让别人去做或者和别人一起做,这就是并行,多线程和多进程的并行工作。处理器的发展,从性能上看,基本上也可以归为上述三点,比照本书的结构,读者也可以做个归纳。

        未来的发展,我们看到了SOC的兴起,我们看到CPU和GPU的混合计算,我们也看到英特尔即将推出的、针对大规模并行应用、集成众核架构的协处理模式的处理器。正如丘吉尔所言,“你能看见多久的过去,就能看见多远的未来”。回顾本书中提到的那些引人入胜的处理器技术的来龙去脉,背后的技术原因或是市场竞争要素,奇妙之处在于,处理器的技术史是我们创造出来的,而身处其中之人却难以知晓,那就让我们“把其他的一切统统抛掉”,一起踏上本书寻宝处理器的引人入胜之旅!是为序。

 何万青 博士

英特尔数据中心产品部 高性能计算/工作站架构师

当当网预售链接

c114网友评论

楼主很强很油菜!——robotbob

顶起,很直观,很具体,楼主快点。——gdxky

LZ这样的高人应该推荐到高校做教授,那将是民族之幸哦。写的理论透彻、根本,文字通俗简练,语言风趣形象,好! ——shore70

希望中国多点像楼主那样的人才!——davidchan110

楼主真强悍,讲解通俗易懂,顶一下!——汉江之畔

真的讲的好,让我这个处理器的门外汉也产生了兴趣!——tian_mengguang

要是做总的软件架构工作,你一定能成为大师级的。——我爱生活

楼主,我虽然不是学数字信号处理出身,但是你的讲解太伟大了。我真的手不释卷啊!快点刷新吧。——中飞人1234

越牛的人讲的东西越通俗易懂。——时光机器007

写得真好!通俗易懂,比较形象化。——ksyjk

属于深入学习的人才能写出这种文字,现在太需要这样的人才了,更希望看到的朋友也别顾着只叫好,大家以大侠为榜样,在各自的领域中都能做到深入浅出,与己与人都是一笔财富!——yucheng_xiao

呵呵,佩服楼主的专业知识是如此的给力啊!——xiao麦子

写的不错,通俗易懂,楼主威武啊!——caodianxin2011

楼主太有创意了,这样的帖子太强了!——lsmx01

相关 [处理器 大话 处理器] 推荐:

寻宝处理器 《大话处理器》新书出炉(序一与网友评论)

- Ken - 弯曲评论
序一  寻宝处理器的引人入胜之旅.          当出版社的编辑介绍万木杨的这本书给我时,我对书名《大话处理器》是有一定担心的,其一:处理器和计算机的发展几十年来风起云涌,其间有天才的创新、看似偶然的分叉和囿于商业市场考量的成功与失败,一部技术发展史绝不比波谲云诡的社会史逊色. 一部“大话”处理器的书会不会流于一部围绕处理器发展种种轶事的大话技术史.

ARM发布Cortex-A7处理器

- tinda - Solidot
手机先生 写道 "ARM公司宣布了新的Cortex A7处理器,声称是迄今最节能的处理器,与Cortex A8处理器相比,性能提升但功耗只有后者的1/5. ARM表示,2013-2014年期间,新款Cortex A7将用于100美元以下的入门级智能手机,其性能表现相当于目前市售500美元级别高端智能手机.

ARM宣布了64位处理器ARMv8

- Woooon - Solidot
ARM宣布了64位处理器ARMv8,最后一种主流处理器架构终于跨入了64位时代. 同时惠普宣布将推出ARM服务器. ARMv8包含AArch64和AArch32两种主要执行状态:AArch64引入了新的64位指令集,AArch32兼容现有的ARMv7架构. 《连线》的一篇评论认为,ARM的64位扩展纯粹是增加可寻址存储器大小,并没有同时提高自身性能,而增加寄存器大小会对耗电产生负面影响.

HBASE 协处理器入门(转载)

- - 数据库 - ITeye博客
如果要统对hbase中的数据,进行某种统计,比如统计某个字段最大值,统计满足某种条件的记录数,统计各种记录特点,并按照记录特点分类(类似于sql的group by)~. 常规的做法就是把hbase中整个表的数据scan出来,或者稍微环保一点,加一个filter,进行一些初步的过滤(对于rowcounter来说,就加了FirstKeyOnlyFilter),但是这么做来说还是会有很大的副作用,比如占用大量的网络带宽(当标级别到达千万级别,亿级别之后)尤为明显,RPC的量也是不容小觑的.

晶体管3D化,英特尔重新发明微处理器

- Ant - Solidot
芯片巨人宣布,即将推出的22nm处理器将采用全新的技术设计晶体管. 英特尔重点介绍了下一代22nm处理器的新特性——三闸极晶体管技术. 晶体管主要是充当电流开关,以极快的速度用电信号控制流出的电流. 传统“平面”晶体管有三大组件:源极(Source)、栅极(Gate)和漏极(Drain). 你可以把源极和漏极想象成标准电流插座的两个插孔,当在插孔之间连上一根导线,形成一个封闭回路,电流就能流动.

完美运行SNES模拟器需要3GHz处理器

- 嘉德豉油公司 - Solidot
模拟器玩家都所体会,让模拟器“Just Work”并不是太困难的事情,然而让模拟器游戏能完美运行却仿佛登天,在模拟游戏中常常会遭遇各种大大小小故障,大多数都与模拟不完美有关,比如图像渲染或频数起伏巨大. 1990年代的SNES(超级任天堂)模拟器用25MHz的处理器即可运行,然而要完美却需要3GHz处理器.

Samsung Galaxy Tab 7.7 发布,配备 1.4GHz 处理器、Android 3.2、HSPA+

- Benny - Engadget 中国版
大家引颈以待的 Samsung Unpacked 发表会上,厂方终于都发表了名字早已曝光的 Galaxy Tab 7.7. 机如其名,Galaxy Tab 7.7 就是使用一块 7.7 寸屏幕(分辨率为 1280 x 800),但让人高兴的是材质使用了 SuperAMOLED Plus. 系统当然是最新的 Android 3.2 Honeycomb,也当然有 Samsung 自家的 TOUCHWiZ 4.0.

[多图]四核处理器 魅族MX将九月底发布

- Glen - cnBeta.COM
国产神机魅族M9 虽然一度炙手可热,但在众多国外手机巨头们推出的双核智能手机面前已显落伍,所以自然需要推出功能更强悍的升级版本来应对挑战. 日前,魅族老总 J.Wong在论坛爆料称,该公司将会在今年九月底推出新款智能手机魅族MX. 其中,16GB版本将会配备双核处理器,而32GB版本则会装载四核处理 器,准备在硬件配置上甩开对手几条大街.

AMD新处理器创世界CPU最快记录

- 柯嘉 - cnBeta.COM
AMD宣布,通过超频即将推出的8核AMD FX台式处理器,该公司已经打破吉尼斯世界纪录,实现频率最高的电脑处理器. AMD企业副总裁、客户集团总经理克里斯・克罗兰(Chris Cloran)表示:“AMD FX CPU的破纪录速度清楚证明了AMD最新推土机架构处理器所带来的性能.

AMD Bulldozer处理器打破世界超频记录

- 柯嘉 - Solidot
AMD在其奥斯汀总部举办一个活动,演示其即将推出的桌面处理器FX Bulldozer超频性能. AMD FX创下了新的CPU超频吉尼斯世界纪录:8429.38MHz. 超频爱好者和AMD工程师使用早期版的AMD FX处理器,在高端空气冷却和水冷却系统下超频到5GHz,在相变冷却系统下超频到6GHz,在液氮和液氦冷却装置下超频到8GHz左右.