[转]【Daemontools--supervise】 系统进程监控管理器

标签: | 发表时间:2013-05-08 15:47 | 作者:zeo112140
出处:http://blog.csdn.net/zeo112140

一、工具supervise

Daemontools是一个包含了很多管理Unix服务的工具的软件包。其中最核心的工具是supervise,它的功能是监控一个指定的服务,当该服务进程消亡,则重新启动该进程。而要添加让supervise监控的服务非常容易,只需要添加一个被监控的服务的目录,在该目录中添加启动服务器的名字为run的脚本文件即可。
其中svscan工具是为指定的工作目录(缺省是/service/目录)下的所有子目录中的每一个子目录都启动一个supervise进程,最多可以启动多达1000个supervise进程(也就是工作目录下可以有多达1000个子目录)。其中每个子目录下都会有一个名为run的用来启动对应服务的脚本程序。Supervise会监控该服务,在服务消亡时使用run脚本来自动启动该服务。若svscan的工作目录下的子目录的sticky位被置位,则svscan将为该子目录启动两个supervise进程,一个监控子目录中的run对应的服务,另外一个监控子目录下的log子目录的记录服务,两者之间通过管道来相互联系。
Svscan每5秒钟检测一次子目录,若出现新的目录则为该目录启动supervise,若某个老的子目录对应的supervise退出,则重新启动它。
该软件包的所有工具的详细信息请参考在线文档。daemontools最经典的搭配是和lighttpd一起使用

二、安装

  /pacakage目录(你可以创建任意目录,这里使用package只是为了保持与英文作者的一致):  
  mkdir -p /package
  chmod 1755 /package
  cd /package

  下载daemontools-0.76.tar.gz到/package目录,解压该包。

http://cr.yp.to/daemontools/daemontools-0.76.tar.gz  


  tar xvzf daemontools-0.76.tar.gz
  cd admin/daemontools-0.76

  编译并安装daemontools程序
  
  package/install

【注意】:如果在安装过程中出现安装失败的提示,是因为daemontools 需要一个补丁daemontools-0.76.errno.patch,这个补丁在qmail包中有。或者修改daemontools 源代码来修补这个bug

(修改方法:在src下的conf-cc文件的第一行最后添加如下代码即可 -include /usr/include/errno.h

# vi src/conf-cc

在最后加上 -include /usr/include/errno.h

如果安装成功,你可以用下面命令确认:

# ps -ef | grep svscan
# man svscan

此时你查看一下inittab文件:
# cat /etc/inittab

会发现原来daemontools是使用init的方式来保护自己的:

SV:123456:respawn:/command/svscanboot

通过strace命令你能看到系统每隔五秒会核对一下服务:
# strace -p `pidof svscan`


四、使用supervise程序进行程序管理监控

  supervise的执行命令是supervise Path ,其中Path 是指定路径,可以是相对路径,也可以是绝对路径。在Path路径下,必须有一个run的脚本,supervise调用的就是这个脚本,并监控管理该脚本中运行的程序。

  supervise的一个重要的功能就是可以检测出run脚本中执行的程序是否正常工作,若发现其已经死掉,supervise将会重新执行run脚本,重新启动指定程序。这对于很多服务端程序来说是十分必要的,没有人愿意在深夜2点的时候从被窝里爬出来重新启动服务器。

  下面是一个简单使用supervise的例子。

五、1)例子1

  假定已经安装好daemontools,建立一个test目录,进入该目录
  
  mkdir /temp1
  cd /temp1

  在该目录下写一个简单测试程序test.c:  

  编译test.c输出为test。  
  gcc -o test test1.c

  编写一个脚本run,来执行test程序,以便supervise进行调用。 

  

#!/bin/sh  

echo "start test!"  

./test

  退到上级目录,执行 supervise temp1看看效果:
  
  cd ..
  supervise temp1

  执行killall -9 test,杀死test进程,你会发现supervise会重新启动test进程。当然如果程序core dump,supervise同样会重新启动程序。

C代码  复制代码  收藏代码
  1. #include
  2. #include   
  3. int main(){
  4. int ix = 0; 
  5. for(;; ix++){  
  6. printf("%d\n", ix);
  7. sleep(1); 
  8. } 
  9. return 0; 
  10. }

注意:当停止再次启动supervise监控某目录时,会提示:

supervise: fatal: unable to acquire /service/test/supervise/lock: temporary failure

这时删除目录下的supervise重新监控即可。

2)例子2 (java)

命令: mkdir /service/test

cd /service/test

ll

vi demo.java

Java代码  复制代码  收藏代码
  1. class demo{
  2. public static void main(String[] args) throws Exception{
  3. for(int i=0;;i++){
  4. System.out.println("i="+i);
  5. Thread.sleep(1000);
  6. }
  7. }
  8. }

javac -d . demo.java

vi run

Xml代码  复制代码  收藏代码
  1. #!/bin/sh
  2. echo -e "start test";
  3. exec java demo

chmod +x run

执行监控目录 :supervise /service/test

[终端打印出来标号]

再开启一个终端,查看正在执行这个命令的进程id,执行 ps -A

找到 java这个进程的id号,

执行 killall -9 java

看前一个终端,是不是打印又从新开始了,呵呵。这说明中断之后supervise又启动这个进程了

3)例子3

mkdir /tmp/test

cd /tmp/test

vi demo.java

[代码同例子2]

javac -d . demo.java

vi run

Java代码  复制代码  收藏代码
  1. #!/bin/sh
  2. echo -e "start test2";
  3. exec java -classpath /tmp/test demo

chmod +x run

ln -s /tmp/test /service/test

ll /service

supervise /service/test

发现开始打印了,这时在另一个终端执行 killall -9 java ,则发现这个终端的打印又从新开始了,也就是杀掉进程之后立即又从新执行run了

4)实例4 监控tomcat启动

假如tomcat 在redhat的 /var/tomcat6

在/service目录下新建一个run文件,内容如下:

Java代码  复制代码  收藏代码
  1. #!/bin/sh
  2. TOMCAT_HOME=/var/tomcat6
  3. exec ${TOMCAT_HOME}/bin/catalina.sh run

执行supervise /service

则发现tomcat启动了。

测试: 新打开一个终端,ps -ef |grep tomcat

找到tomcat的id,执行 kill -9 [tid]

杀掉了tomcat但在之前的终端窗口上却显示重新启动了tomcat。

【注】:好像用tomcat的./shutdown.sh命令不能使监控重启,出现异常,端口占用,可能是还没等tomcat关闭监控就执行了启动命令。

参考资料:1)官网: http://cr.yp.to/daemontools.html

作者:zeo112140 发表于2013-5-8 15:47:38 原文链接
阅读:12 评论:0 查看评论

相关 [daemontools supervise 系统] 推荐:

[转]【Daemontools--supervise】 系统进程监控管理器

- - 小鸥的博客
Daemontools是一个包含了很多管理Unix服务的工具的软件包. 其中最核心的工具是supervise,它的功能是监控一个指定的服务,当该服务进程消亡,则重新启动该进程. 而要添加让supervise监控的服务非常容易,只需要添加一个被监控的服务的目录,在该目录中添加启动服务器的名字为run的脚本文件即可.

壳系统

- Vernsu - It Talks-魏武挥的blog
经常有人被我问到“你用什么浏览器”时的答案是:傲游啦360啦,但事实上,这些都不是真正的浏览器,从技术角度讲,充其量只是在IE浏览器上加一个壳罢了. 在国外,壳浏览器是以“皮肤”的形式存在,纯属为了美化浏览器而用. 但在中国,壳浏览器成了一门生意. 奇虎的主要收入来源并非来自那个由于一场商战而赫赫有名的安全卫士,而是来自于360浏览器(它有两个版本,分别以IE和Chrome为内核).

秒杀系统

- - 开源软件 - ITeye博客
秒杀系统架构分析与实战. (反馈非常好的文章,推荐). (1)查询商品;(2)创建订单;(3)扣减库存;(4)更新订单;(5)付款;(6)卖家发货. (1)低廉价格;(2)大幅推广;(3)瞬时售空;(4)一般是定时上架;(5)时间短、瞬时并发量高;. 假设某网站秒杀活动只推出一件商品,预计会吸引1万人参加活动,也就说最大并发请求数是10000,秒杀系统需要面对的技术挑战有:.

Ext文件系统

- Haides - 博客园-首页原创精华区
  虽然从Ext2到Ext4,找数据的方式发生了变化,但是,磁盘的布局还是非常相似的. 其实这个东西也不需要变化,因为现在也没什么特别巧妙的方式,而且磁盘的吞吐量、效率的瓶颈也不在这里. 当然,这里排除那些根据自身文件特点设计的数据库,毕竟还是为了支持通用文件.   Boot在第一个块,放的应该是引导程序,超级块就放在了第二个块上,如果不是可以在mount的时候通过参数sb来设置.

HBase 系统架构

- - 博客园_首页
HBase是Apache Hadoop的数据库,能够对大型数据提供随机、实时的读写访问. HBase的目标是存储并处理大型的数据. HBase是一个开源的,分布式的,多版本的,面向列的存储模型. 5 可在廉价PC Server搭建大规模结构化存储集群. HBase是Google BigTable的开源实现,其相互对应如下:.

Linux系统监控

- - CSDN博客系统运维推荐文章
查看所有的进程和端口使用情况:. 查看nginx并发(连接数)进程数:. 查看当网络连接状态中,已建立连接的数量:. 查看系统tcp连接中各个状态的连接数. 输出每个ip的连接数,以及总的各个状态的连接数. df -hl 查看磁盘使用情况 . df -hl 查看磁盘剩余空间. df -h 查看每个根路径的分区大小.

mysql 权限系统

- - 数据库 - ITeye博客
mysql 权限系统控制一个用户是否能进行连接,以及连接后能够针对那些对象进行什么操作. mysql权限控制包含两个阶段. 2:检查用户是否具有所执行动作的权限. 本文实例,运行于 MySQL 5.0 及以上版本. MySQL 赋予用户权限命令的简单格式可概括为:. 一、grant 普通数据用户,查询、插入、更新、删除 数据库中所有表数据的权利.

银行核心系统-贷款系统【信贷系统】

- - ITeye博客
一、         贷款业务. 贷款按期限分为短期、中期与长期贷款,短期贷款是指期限在1年以内的贷款,中期贷款是指期限在1年(含1年)至3年(含3年)之间的贷款,长期贷款是指期限超过3年的贷款. 贷款的种类目前有个人助学贷款和个人住房贷款:. l     个人助学贷款:须提供两位担保人,无须质押物,贷款额度不超过人民币10万元.

理解Linux系统负荷

- Adam - 阮一峰的网络日志
如果你的电脑很慢,你或许想查看一下,它的工作量是否太大了. 在Linux系统中,我们一般使用uptime命令查看(w命令和top命令也行). (另外,它们在苹果公司的Mac电脑上也适用. 你在终端窗口键入uptime,系统会返回一行信息. 这行信息的后半部分,显示"load average",它的意思是"系统的平均负荷",里面有三个数字,我们可以从中判断系统负荷是大还是小.

iPhone通知系统改进

- armgod - 月光博客
  不管是对比 Android 还是 WebOS ,iOS 的通知系统都只能用低能来形容,也是最让用户不满意的地方之一. 简单列举一些iOS的通知系统不足的地方. 你必须记得是哪个程序通知的你,不记得的话就只能在满屏的 app 中找到上一条或者上几条通知,实在是一件痛苦的事情. 不管你现在做什么都会被打断,只要来了通知就弹出,并且置顶获取焦点,比如你正在玩切水果,刚要破记录了,来一个短信,游戏暂停,短信置顶,节奏都被打乱了.