为什么动态类型语言相对比较慢?

标签: 动态类型 语言 相对 | 发表时间:2012-03-23 17:50 | 作者:
出处:http://www.iteye.com
静态类型语言中,在声明变量时已经指定了数据类型和表示方法。动态类型语言是在运行期间检查数据的类型,不得不保持描述变量值的实际类型标记,程序在每次操作变量时,需要执行数据依赖分支。

间接分支(Indirect branch)数据局部性(data locality)对于运行时的性能是致命的。

这就是动态语言的 JIT编译器基准测试要强调near-C的内循环速度,以及避免大的数据结构和数据处理问题的原因。

我也希望像Python这样的动态类型语言可以变快。我试过用Python来进行传统的服务器编程——“系统语言”领域——但是效果真的不好,我现在考虑用Java重写一个服务器。

因此,我花时间思考如何真正 静态地编译Python。毕竟,那是 我梦寐以求的编程语言!但当我思考如何将动态类型代码与静态编译Python结合起来时,我遇到了数据变慢的问题:

在动态语言中,通常所有数组中的元素(或其他数据结构)类型各不相同,所以有不同的表示值。因此,这些值都必须被单独存放为堆,而不是顺序地存为数组。这意味着如果对不相邻的内存执行数据依赖分支,则对缓存有更高的要求。

也有一些聪明的技巧,使用变量中的特殊bit,将一些原生类型(像整型)打包成一个类型,类似于指针,但这要求寄存器在操作过程中进行跟踪,会增加开销。

还有一些方法,比如使用JIT编译热路径(hot path)时,如果你直接插入没有标类型的值,而不是在堆里分别标记类型, 那么与JIT编译过的代码的互操作性会降低,如果其他代码改变了数组中的一个值的类型,就会出现非常严重的后果。

我一直在思考, 在Python语言中,什么是静态的,什么不是。 通过 SSTA(统计静态分析)和 逃逸分析可以判断,大量正常的程序是静态的。 Paul Biggar给了我信心证实我的猜测是正确的,我的Python代码90%都是静态的。

有人会问,那另外的10%呢?通常情况下,我可以让所有的都是静态的,或者想象它被参数类型的限制范围特殊化了。除了Python语言的标准模式,其他模式都由Web服务器分配给基于HTTP方法(如果收到GET请求就称为“get”方法)的Web处理器,这也需要程序员依照switch语句(如elifs的长链)来进行修改。

Robert Harper对“从单一类型静态语言方面,动态语言是如何实现的”这个问题作出了 很好的解释,下面这句话是我希望他能进一步进行解释的:
引用
我深知“编译器可以优化它”,至少在某些情况下。

我确信他说的“某些情况”是指遇到non-escaping的情况,因为和后面的执行代码进行交互时,你应该要能够确定escape的类型。

一些动态调用是无污染的——编译器可以从代码检查中发现一些变量(或方法)是动态的,但动态的代码不表示其他变量也是动态的,因为不同类型的变量、方法、成员的存在或缺失都被限制成了可识别的类型(或null)。

但通常编译器是无法从代码检查中发现这些情况的,如果无法追踪到执行的情况,就无法知道代码如何依赖以及如何改变其他静态变量的值。因此,工作中断,所有变量再次变为动态的。

我一直在努力寻找把 Monkey Patch(不改变初始源代码来扩展和修改动态语言运行代码的方法)、 Set(属性或索引器元素赋值的“访问器”方法)、 SetAttr(SetAttr 语句可以为一个文件设置属性信息)等解决办法移植到我虚构的Python编译器里,因为类型标记严重地降低了运行性能。

快速的数据结构对于内存访问模式和缓存位置是非常重要的,还可以减少分支和对这些分支的标记工作。

Jonathan Shapiro的文章 Programming Language Challenges in Systems Codes非常棒,我很赞同文中的观点。

英文原文: Why Dynamic Programming Languages Are Slow

感谢 sherry617 投递这篇资讯

已有 1 人发表留言,猛击->> 这里<<-参与讨论


ITeye推荐



相关 [动态类型 语言 相对] 推荐:

为什么动态类型语言相对比较慢?

- - ITeye资讯频道
静态类型语言中,在声明变量时已经指定了数据类型和表示方法. 动态类型语言是在运行期间检查数据的类型,不得不保持描述变量值的实际类型标记,程序在每次操作变量时,需要执行数据依赖分支. 而 间接分支(Indirect branch)和 数据局部性(data locality)对于运行时的性能是致命的. 这就是动态语言的 JIT编译器基准测试要强调near-C的内循环速度,以及避免大的数据结构和数据处理问题的原因.

语言壁垒

- kylexlau - Chun Tian (binghe)
虽然经常更新微博,但确实又有些日子没写常规博客了. 10 月开始前有必要再写一篇,整理一下近期的各种思路,以良好的精神面貌迎接今年的最后一个季度. 首先发布一个已经不太新的消息:Practical Common Lisp 的中文版《实用 Common Lisp 编程》几经周折终于付印了,下月即可正式出版;读者们甚至已经可以在当当网上预订了.

UnQL:NoSQL查询语言

- 卡飞菲 - Solidot
CouchDB作者Damien Katz与SQLite作者Richard Hipp正在为NoSQL文档数据库开发一种高级查询语言UnQL(发音同Uncle,是UNstructured Query Language的缩写). Katz表示,他们坚信为了推广NoSQL需要一种通用的查询语言,类似当年推广关系型数据库应运而生的SQL语言.

Go 语言初步

- wei - 云风的 BLOG
所谓认真玩,就是拿 Go 写点程序,前后大约两千行吧. 据说 Go 的最佳开发平台是 Mac OS ,我没有. Windows 版还没全部搞定,但是也可以用了. 如果你用 google 搜索,很容易去到一个叫 go-windows 的开源项目上. 如果你用这个,很多库都没有,而且语法也是老的. 我在 Windows 下甚至不能正确链接自己写的多个 package.

C语言之父

- Dylen - 子说
同事说c语言之父去世了,另一个同事大吃一惊,问:谭浩强死了. 不知丹尼斯·里奇(Dennis Ritchie)情何以堪.

如何学好C语言

- 夕角 - 酷壳 - CoolShell.cn
有人在酷壳的留言版上询问下面的问题. 我也遇到了和提问的老外一样的问题. 能给像遇到这样烦恼的程序员一点建议嘛. 我相信,这可能是很多朋友的问题,我以前也有这样的感觉,编程编到一定的时候,发现能力到了瓶颈,既不深,也不扎实,半吊子. 比如:你长期地使用Java和.NET ,这些有虚拟机的语言对于开发便利是便利,但是对于程序员来说可能并不太好,原因有两个:.

笨办法学C语言

- Hexi - Solidot
继《笨办法学Python》之后,Zed Shaw开始动手写《笨办法学C语言》. 和《笨办法学Python》一样,这本C语言入门书也将采用习题方式引导读者学习. 在序言中,他引用了笛卡尔《第一哲学沉思录》中的一段话去描述C语言:“直到现在,凡是我当作最真实、最可靠而接受过来的东西,我都是从感官或通过感官得来的.

C语言编译器 Cilk

- Le - 开源中国社区最新软件
Cilk多线程编程技术最早由MIT开 发,是一个基于Gcc编译器的开源项目. 后来开发者创建了一个创业公司,推出改进的私有版本,整合到Windows下的多种编译器中. 之后它被英特尔公司 收购,整合进英特尔的编译器中. 现在,它再次成为一个开源项目,成为Gcc 4.7下的一个分支. Cilk Plus允许C和C++程序员能高效利用多核处理器的并行处理能力.

Java7新语言特性

- zffl - Import
Java7发布有一段时间了,这几天升级了一下JDK,结果发现Eclipse3.7还没有支持JDK7. 这个需要稍微解释一下,可能有人不知道,Eclipse使用自己的Java编译器而不是JDK自带的javac. Eclipse自己的编译器就是ecj(Eclipse Compiler for Java),一般的Linux发行版都有eclipse-ecj这样的包.

C语言的现状

- pipitu - Tony Bai
Dobb's Journal 官网上的一篇由Brian W. Kernighan和Dennis M. Ritchie共同撰写的名为"The State of C "的文章. 这里谨将此篇译文献给不久前刚刚离我们而去的C语言之父 - Dennis M. Ritchie ,愿一代计算机科学巨匠一路走好.