初识NodeJS,一个基于GoogleV8引擎的Javascript运行环境
一、NodeJS简介
思考
首先我们来思考一个问题:我们都知道几乎所有现代主流浏览器都全面支持了ECMAScript 5.1版标准,而JavaScript的标准是 ECMAScript。那么我们就容易认为JavaScript是一种浏览器端的解释型编程脚本。那么脱离了浏览器,JavaScript还能够解释运行吗? 答案是肯定的,也就是说脱离了浏览器,在特定环境下JavaScript还是能运行的。JavaScript向来以Web网页的脚本语言而著称,但现在也可以 用在许多非浏览器环境,例如 node.js或者 Apache CouchDB。本文就是基于NodeJS来进行探讨。
NodeJS是什么?
根据百度百科解释,Node.js是一套用来编写高性能网络服务器的JavaScript工具包。Node.js是一个可以快速构建网络服务及应用的平台, 该平台的构建是基于Chrome's JavaScript runtime,也就是说,实际上它是对GoogleV8引擎(应用于Google Chrome浏览器)进行了封装。V8引 擎执行Javascript的速度非常快,性能非常好。
NodeJS并不是提供简单的封装,然后提供API调用,如果是这样的话那么它就不会有现在这么火了。Node对一些特殊用例进行了优化,提供了替代的API,使得V8在非浏览器环境下运行得更好。例如,在服务器环境中,处理二进制数据通常是必不可少的,但Javascript对此支持不足,因此,V8.Node增加了Buffer类,方便并且高效地 处理二进制数据。因此,Node不仅仅简单的使用了V8,还对其进行了优化,使其在各环境下更加给力。
Node.js的优点
1、基于V8虚拟机,可构建高性能服务器
V8引擎本身使用了一些最新的编译技术。这使得用Javascript这类脚本语言编写出来的代码与用C这类高级语言写出来的代码性能相差无几,却节省了开发成本。对性能的苛求是Node的一个关键因素。 Javascript是一个事件驱动语言,Node利用了这个优点,编写出可扩展性高的服务器。Node采用了一个称为“事件循环(event loop)”的架构,使得编写可扩展性高的服务器变得既容易又安全。提高服务器性能的技巧有多种多样。Node选择了一种既能提高性能,又能减低开发复杂度的架构。这是一个非常重要的特性。并发编程通常很复杂且布满地雷。Node绕过了这些,但仍提供很好的性能。
2、单线程
Node.js可以在不新增额外线程的情况下,依然可以对任务进行并行处理 —— Node.js是单线程的。它通过事件轮询(event loop)来实现并行操作,对此,我们应该要充分利用这一点 —— 尽可能的避免阻塞操作,取而代之,多使用非阻塞操作。
3、可利用Javascript进行后台开发
虽然让Javascript运行于服务器端不是Node的独特之处,但却是其一强大功能。不得不承认,浏览器环境限制了我们选择编程语言的自由。任何服务器与日益复杂的浏览器客户端应用程序间共享代码的愿望只能通过Javascript来实现。虽然还存在其他一些支持Javascript在服务器端 运行的平台,但因为上述特性,Node发展迅猛,成为事实上的平台。
4、非阻塞IO
Node采用一系列“非阻塞”库来支持事件循环的方式。本质上就是为文件系统、数据库之类的资源提供接口。向文件系统发送一个请求时,无需等待硬盘(寻址并检索文件),硬盘准备好的时候非阻塞接口会通知Node。该模型以可扩展的方式简化了对慢资源的访问, 直观,易懂。尤其是对于熟悉onmouseover、onclick等DOM事件的用户,更有一种似曾相识的感觉。
5、RESTFUL API
二、为何接触NodeJS,我们的问题以及解决方案
本人现在在IBM公司实习,参与公司云办公系统的项目研发,本人所在项目组主要负责在线电子表格的开发工作。项目前端开发是基于DOJO框架,后台主要基于JAVA。项目功能性开发已经基本完成,但是在实际测试阶段发现在编辑超过一定阈值的大数据的情况下系统开销比较大,运行效率无法满足要求。
在经过大量跟踪测试及分析后,基于系统的整体架构以及解决该性能问题,我们有两套解决方案:1、由于现在系统词法解析采用的是开源语法分析器ANTLR,而ANTLR在效率上还略有不足,因此我们决定基于ANTLR来进行二次开发,寻求一些改进;2、建立前端服务器,和后台服务器进行分离。前端与后台共同维护一致的数据模型,前端服务器主要解决运算方面的请求并将计算结果及时反馈用户,然后将改变发送到后台服务器,由后台服务器进行持久化存盘、消息分发等一些操作。
由于前端是基于DOJO框架进行的开发,为了最大限度的重用前阶段实现的功能代码来我们考虑基于NodeJS来搭建前端服务器,并充分利用NodeJS的一些特性来实现系统性能的提高。
三、为何选择NodeJS
我想不仅仅是Node.js,当我们要引入任何一种新技术前都必须要搞清楚几个问题:
- 我们遇到了什么问题?
- 这项新技术解决什么问题,是否契合我们遇到的问题?
- 我们遇到问题的多种解决方案中,当前这项新技术的优势体现在哪儿?
- 使用新技术,带来哪些新问题,严重么,我们能否解决掉?
Server端阻塞是当前系统遇到的最大问题。在整个数据查询的过程中,当前程序进程往往只是在等待结果的返回,这就造成了进程的阻塞。对于高并发、计算任务较大以及I/O密集行的网络应用中,一方面进程很长时间处于等待状态,另一方面为了应付新的请求不断的增加新的进程。这样的浪费会导致系统支持QPS远远小于后端数据服务能够支撑的QPS,成为了系统的瓶颈。Node一向是这样来标榜自己的:“ 在node中除了代码,所有一切都是并行执行的”。这句话的意思是说,Node.js可以在不新增额外线程的情况下,依然可以对任务进行并行处理 。Node.js是单线程的,它通过事件轮询(event loop)来实现并行操作,对此,我们应该要充分利用这一点 ,尽可能的避免阻塞操作,取而代之,多使用非阻塞操作。我们搭建前端服务器主要用于处理前端大量的公司计算并将计算结果及时呈现给用户,所以能够避免很多I/O阻塞操作,这样就能充分利用NodeJS的优点同时也能够满足我们的需求。另外,我们前端基于的DOJO框架是基于JS的,而NodeJS在处理JavaScript的优势在前面已有介绍,这里不再赘述。
JS适合解决阻塞问题
解决阻塞可以引入事件处理机制解决这个问题,在查询请求发起之前注册数据加载事件的响应函数,请求发出之后立即将进程交出,而当数据返回后再触发这个事件并在预定好的事件响应函数中继续处理数据。而JavaScript,相对于其他语言,至少有两个关键特性决定它特别适合完成这个任务。
(一) JavaScript是一种函数式编程语言,函数编程语言最重要的数学基础是λ演算(lambda calculus) ,即函数对象可以作为其他函数对象的输入(参数)和输出(返回值)。这个特性使得为事件指定回调函数变得很容易。特别是JavaScript还支持匿名函数,通过匿名函数的辅助,我们很容易实现回调。(二)JavaScript的另外一个重要语言特性:闭包(Closures)。该特性可以使异步回调的运行上下文保持,即"状态保持"。
四、使用NodeJS带来的问题以及解决方案
阻塞式编程浪费了大量进程资源只是在等待,导致大量内存和cpu的浪费。在这方面Node.js好很多,但也正是因为一些闭包等JavaScript内建机制也会导致资源的浪费。看下面的代码:
Js代码:
1 function main(){
2 var id = "1";
3 var str = "..."; //这里局部变量str存储一个2M的字符串
4 db.query("selcect name from persons where id=" + id,function(name){
5 output("person id:" + id + ", name:" + name);//n秒后数据返回后执行回调
6 });
7 }
8 main();
至少整个数据查询过程中,变量str所使用的2M内存并不会被释放,而str保持下去可能并没有意义。前面已经解释过闭包的原理,闭包并没有智能到只包起来今后可能被访问到的对象。
五、后记
本文主要参考 http://www.kuqin.com/webpagedesign/20110812/105100.html了的博文分享,结合公司具体项目遇到的问题进行分析,充分运用NodeJS的特性来尝试解决问题。作者本人由于项目需要刚刚开始学习NodeJS相关知识,后续会在自己学习的同时继续总结一些经验成果进行分享。