再谈JavaScript的数据类型问题

标签: javascript 数据类型 问题 | 发表时间:2011-07-26 07:41 | 作者:aimingoo 茄
出处:http://blog.csdn.net/aimingoo

 JavaScript的数据类型问题已经讨论过很多次了,但许多人还有许多书仍然沿用着错误的、混乱的一些观点,所以就再细讲一回。

提及这个讨论的原因在于argb同学在我的MSN博客(现在变成了wordproess,在这里)上的一段回复,又更早的起源则是两年前关于《JavaScript征途》一书的大讨论:

从“装B被雷劈讲起

——这个事就让它过去了过去了吧。在讨论中我提及到该书对JavaScript类型系统介绍的混乱,而argb翻出了这篇历史文章,指我的混乱更混乱。于是我列了以下几个问题给他:

=============

我想很难很快速地解释你的问题。那么,接着你的思路,我就问几个问题好了:
1、函数是不是类型?是什么类型?
2、为什么说JavaScript中的函数是“第一型”的?
3、undefined如何“包装成object”?即使你所说的是笔误,那么对于“一切都是对象”的JavaScript,undefined是什么?
4、true与Boolean(true)在类型上有什么不同?

最后强调一下你的用词问题:Undefined是类型,undefined是值,’undefined’是类型的名称。此外,应留意JavaScript中存在着值类型与引用类型。

=============

随后argb的回复让我觉得一切已经混乱到不得不讲的地步。因为此前也没有讨论过《JavaScript征途》中的类型系统问题,于是这干脆就补个功课。下面认认真真地谈谈,也顺便回复了argb同学。

再次感谢argb。若非如此,我这篇功课还要欠很久。有读者与朋友们的关心,总是好的。答疑释解,于人于已,皆成美事。

 

再谈JavaScript的数据类型问题

=============

首先我们谈两点体会。其一,JavaScript不是纯粹的面向对象语言,它是混合语言,所以所谓“一切面向对象”既是宣传用语,也是一种语言处理技巧。仅从“面向对象”来理解这个语言的类型,会犯很多错误。其二,ECMAScript的描述总是很准确而又迟滞于这门语言的发展。所以要理解一些现象,既要从JavaScript的历史中去找,也要考虑到JavaScript现在的发展。ECMAScirpt是一个标准的、规范化的参考,但不是全部。

接下来说说类型。JavaScript既是过程式语言,也是面向对象的语言。这一定程度上,也表现为:它事实上有两套类型系统。第一套类型系统是用typeof来识别,这是这个语言的基本类型系统,只有六种类型,即undefined、number、boolean、string、object与function。我一般也称之为基础类型系统。之所以称为“基础”,是因为第二套类型系统是以它为基础,从object这一种类型中发展起来的,即对象类型系统。

对象类型系统用instanceof来识别,它相当于其它高级语言中的is操作/运算。面向对象的多态主要通过as和is来表达,对于JavaScript来说,由于是弱类型的(没有强制类型检查),所以不需要as。

对象类型系统与基础类型系统存在映射关系,例如基础类型的string影射到对象系统中的String。但这只是影射,所以本质上来说string类型不是String类型。两者本质上不同。具体来说,undefined,string、number和boolean是“值类型”;object与function是“引用类型”。由于String、Number与Boolean在基础类型中都属于object类型,是Object()的子类,因此是引用类型。Function()也是引用类型。所有引用类型都可以看着Object()的子类,所以任意函数也是Object()的子类。例如"<匿名函数> instanceof Object"返回true。

undefined是值类型,它没有对应的对象类型——我们通常可以称之为Undefined类型,但它没有对应的构造器。undefined只有一个值,即undefined。准确地说,undefined表明声明(或产生)了但没有值的变量。而Null也是一个类型,null是它的惟一值(按照语言规则,null也是一个关键字)。Null类型是对象类型,亦即是引用类型。所以Null与Undefined本质的不同,是它们分属在不同的类型系统中,解释着不同类型系统中的“无”的概念。一般来说,DOM中的某个属性或成员如果无值,应该使用null;而JavaScript运算过程中如果出现无值,应该使用undefined。

上面强调要从“两套类型系统”的角度来理解上述类型。而这两个类型系统在JavaScript中是可以混用的,实现这一特性的技术被称为“类包装”。这是JavaScript对Java的主要借鉴,也是后来的.NET对Java的主要借鉴之一——类包装也被称为“装箱”(以及“拆箱”)。JavaScript中的类包装过程出现然属性存取中,即“.运算符”或“[]运算符”。当这两个运算符发现左操作数x是一个“值类型”数据时,将隐式地调用Object(x)过程将它转为对象,因此
'abc'.length
这个运算实际上就等效于
Object('abc').length

 

最后,我们回到原始的问题上来。所以我说:
====
JavaScript 里面有6种基本类型,对象是其中一种,各种对象是“对象(object)”这一种类型中的子类(类型)。
====
是没有什么错误的。而朱先生在他的书中说:
====
- JavaScript 语言只有 3 种最原始的数据类型:数值型、字符串型和布尔型
- JavaScript 还定义了几个特殊的数据类型,如空类型(null)和未定义类型(undefined)。
- 基本数据类型按值传送,而复杂数据类型按引用传送。
====
这几个观点都不太靠谱。其一,这三种是原始的数据类型没错,但并不是“只有3种”,这个稍后一点我再说。其二,空类型与未定义类型这两种说法都是错的,应该是Null类型和Undefined类型——小写的,是它们的值;首字母大写才是它们的类型。其三,undefined也是按值传递的,然而在朱先生的分类里头,就不知道如何归属。他起码提到了:原始数据类型,特殊数据类型,值(传递的)类型,引用(传递的)类型。这样复杂的分类,会更容易让读者混淆。


最后说一下“原始的数据类型”。这个用词在ECMAScript里面有,称为"primitive types",但这个概念主要是从“primitive values"里面引申出来的,而非单独作为一个类型分类的依据——ECMAScript中只提到过一次primitive type,并且也没有称之为“types”。ECMAScript用“primitive values"来说明一些类型的原始值,例如Boolean  Types具有原始值true/false。但这并没有说明Boolean对象类型与值类型之间的差异或关系,例如不能表明true与Boolean(true)之间有什么不同。

ECMAScript中使用“primitive values",并陈述了这些原始值的定义,主要是ECMAScript要兼顾JavaScript语言的实现方案。在ECMAScript中相当大的一部分是在描述一个语言的实现,许多地方需要将一个对象转换成“primitive values",或使用“primitive values"这样的名词来讲述它的实际实现——但我必须强调,这与类型系统的定义与规划没什么关系。例如ECMA讲述“属性(property)”这一概念时,原文是:
“Properties are containers that hold other objects, primitive values, or functions. A primitive value is a member of one of the following built-in types: Undefined, Null, Boolean, Number, and String; an object is a member of the remaining built-in type Object; and a function is a callable object. A function that is associated with an object via a property is a method.”

翻译过来就是:
属性可以包括其它对象、原始值或函数。一个原始值(primitive value)是以下内建类型的一个成员(即一个值,value):Undefined, Null, Boolean, Number, 以及String;一个对象(object)是其它内建对象类型的一个成员(实例,instance),函数(function)是一个可调用的对象。如果一个函数作为一个对象的属性,则我们称为方法(method)。

上面的描述与“类型系统如何划分”有什么关系吗?没有。关键在于上列5种原始值,都是可以跨语言来声明或使用的。然而,要更细节地叙述这一点,需要完整地讨论ECMAScript如何声明与实现语言的全过程。

所以如果将“primitive value"作为类型系统来讨论,就会相当地令人混乱了。这也是我一开始提出那几个问题的原因。

 

最后,强调一点。function是类型。所以你提到:
====
函数不是类型,函数是函数,是类型(type)为object的一个分类(class)
====
大概是所有混乱的总和了。关于第一型(first-class data types)的问题就不再讲了,以前已讲得太多。大家自己翻吧。

作者:aimingoo 发表于2011-7-26 15:41:29 原文链接
阅读:6431 评论:25 查看评论

相关 [javascript 数据类型 问题] 推荐:

再谈JavaScript的数据类型问题

- 茄 - aimingoo的专栏
 JavaScript的数据类型问题已经讨论过很多次了,但许多人还有许多书仍然沿用着错误的、混乱的一些观点,所以就再细讲一回. 提及这个讨论的原因在于argb同学在我的MSN博客(现在变成了wordproess,在这里)上的一段回复,又更早的起源则是两年前关于《JavaScript征途》一书的大讨论:.

关于MySQL数据库的数据类型发生隐形转换的问题咨询

- - mysqlops
1.MySQL对于int类型索引使用问题,如:tb中有主键id,普通索引tid,在执行SQL:select * from tb where id = 2 order by id 时,. extra为空,这里的id值没带引号,如果带上引号extra也为空. 2.当 select * from tb where tid = 2 order by tid,tid为普通索引,这时tid的值带引号和不带引号就会有区别,带引号时extra会提示额外的排序,不带引号时extra为空,这是怎么一回事.

Redis 数据类型

- - ITeye博客
该文章是对Redis官方文档的翻译. 字符串是Redis值的最基础的类型. Redis字符串是二进制安全的,这意味着一个Redis字符串可以包含任何种类的数据,例如一个JPEG图像或者一个序列化的Ruby对象. 一个字符串值最多可以保存512M字节的内容. 你可以使用Redis的字符串做一些有趣的事情,例如你可以:.

详图实证:再谈JavaScript的语源问题

- blankyao - aimingoo的专栏
  【本文发表于《程序员》2011.03期】. 有两个错误的观点,其一是“JavaScript在语源上继承自Cmm”. 这个错误的观点主要的来自于以下途径(部分):. 2002年10月7日的《Wired Magazine(连线杂志)》的一份名为“Mother Tongues”的图;. O’Reilly公布的“The History of Programming Languages图;.

招聘 JavaScript 程序员时应该问什么问题

- rex - 一名开发
有使用过服务端 JavaScript 框架吗?. ECMAScript 和 JavaScript 的区别是什么?. 有用过 JavaScript 代码校验工具吗?. 有读过或推荐的 JavaScirpt 书籍吗?. 会为你的 JavaScript 代码写单元测试吗?. 为什么基本上所有对象都有 toString 方法?.

JAVASCRIPT 浏览器兼容性问题及解决方案列表

- - ITeye博客
原文链接 http://www.javaarch.net/jiagoushi/611.htm. 如果需要传递参数,可以使用frame或者iframe. 兼容所有: 在声明变量时,一律加上 var ,以避免歧义,这样在 IE 中亦可正常运行. 此外,最好不要取与 HTML 对象 id 相同的变量名,以减少错误.

Javascript 面试中经常被问到的三个问题!

- - SegmentFault 最新的文章
本文不是讨论最新的 JavaScript 库、常见的开发实践或任何新的 ES6 函数. 相反,在讨论 JavaScript 时,面试中通常会提到三件事. 我自己也被问到这些问题,我的朋友们告诉我他们也被问到这些问题. 然,这些并不是你在面试之前应该学习的唯一三件事 - 你可以通过 多种 方式更好地为即将到来的面试做准备 - 但面试官可能会问到下面是三个问题,来判断你对 JavaScript 语言的理解和 DOM 的掌握程度.

JPA基本数据类型映射

- - 编程语言 - ITeye博客
                // initialValue = 0, allocationSize = 1)   Oracle中序列方式生成主键.                 //Oracle序列方式生成/主键.                 @GeneratedValue(strategy = GenerationType.IDENTITY)   //MySQL,SQLSErver自增长方式.

Redis 数据类型及应用场景

- - SegmentFault 最新的文章
所有数据存储在内存中,高速读写. 提供丰富多样的数据类型:string、 hash、 set、 sorted set、bitmap、hyperloglog. 提供了 AOF 和 RDB 两种数据的持久化保存方式,保证了 Redis 重启后数据不丢失. Redis 的所有操作都是原子性的,还支持对几个操作合并后的原子性操作,支持事务.

SQL 数据类型和 Java 数据类型间的映射关系

- - ITeye博客
由于 SQL 数据类型和 Java 数据类型是不同的,因此需要某种机制在使用 Java 类型的应用程序和使用 SQL 类型的数据库之间来读写数据. 为此,JDBC 提供了 getXXX 和 setXXX 方法集、方法 registerOutParameter 和类 Types. 本章汇集了影响各种类和接口的数据类型的有关信息,并列出所有的对应关系表(这些表显示了 SQL 类型和 Java 类型之间的映射关系)以便于参考.