Linux下谁在切换我们的进程

标签: Linux开发 systemtap 进程切换 | 发表时间:2010-10-09 15:46 | 作者:褚霸 hikerlive
出处:http://rdc.taobao.com/blog/cs

我们在做Linux服务器的时候经常会需要知道谁在做进程切换,什么原因需要做进程切换。 因为进程切换的代价很高,我给出一个LMbench测试出来的数字:
Context switching – times in microseconds – smaller is better
————————————————————————-
Host OS 2p/0K 2p/16K 2p/64K 8p/16K 8p/64K 16p/16K 16p/64K
ctxsw ctxsw ctxsw ctxsw ctxsw ctxsw ctxsw
——— ————- —— —— —— —— —— ——- ——-
my174.cm4 Linux 2.6.18- 6.1100 7.0200 6.1100 8.7400 7.7200 8.96000 9.62000

在我的很高端的服务器上,进程切换的开销在8us左右, 这个相对于高性能的服务器是不可接受的, 所以我们要在一个时间片内尽可能的多做事情,而不是把时间浪费在无谓的切换上。

好奇害死猫,我们来调查下谁在切换我们的进程:

[root@my174 admin]# dstat 1
—-total-cpu-usage—- -dsk/total- -net/total- —paging– —system–
usr sys idl wai hiq siq| read writ| recv send| in out | int csw
0 0 100 0 0 0| 0 0 | 796B 1488B| 0 0 |1004 128
0 0 100 0 0 0| 0 0 | 280B 728B| 0 0 |1005 114
0 0 100 0 0 0| 0 0 | 280B 728B| 0 0 |1005 128
0 0 100 0 0 0| 0 0 | 280B 728B| 0 0 |1005 114
0 0 100 0 0 0| 0 320k| 280B 728B| 0 0 |1008 143

我们可以看到 csw的数目是 120/S, 但是dstat或者vmstat类似的工具并没有告诉我们谁在干坏事。好吧!我们自己动手行吧。
祭出我们可爱的systemtap!

[root@my174 admin]# cat >cswmon.stp
#! /usr/bin/env stap
#
#

global csw_count
global idle_count

probe scheduler.cpu_off {
csw_count[task_prev, task_next]++
idle_count+=idle
}

function fmt_task(task_prev, task_next)
{
return sprintf(“%s(%d)->%s(%d)”,
task_execname(task_prev),
task_pid(task_prev),
task_execname(task_next),
task_pid(task_next))
}

function print_cswtop () {
printf (“%45s %10s\n”, “Context switch”, “COUNT”)
foreach ([task_prev, task_next] in csw_count- limit 20) {
printf(“%45s %10d\n”, fmt_task(task_prev, task_next), csw_count[task_prev, task_next])
}
printf(“%45s %10d\n”, “idle”, idle_count)

delete csw_count
delete idle_count
}

probe timer.s($1) {
print_cswtop ()
printf(“————————————————————–\n”)
}
CTRL+D

这个脚本会每隔设定的时间打印出TOP 20切换最多的进程和他的pid, 我们来看下结果把:

[root@my174 admin]# stap cswmon.stp 5
Context switch COUNT
swapper(0)->systemtap/11(908) 500
systemtap/11(908)->swapper(0) 498
swapper(0)->fct1-worker(2492) 50
fct1-worker(2492)->swapper(0) 50
swapper(0)->fct0-worker(2191) 50
fct0-worker(2191)->swapper(0) 50
swapper(0)->bond0(3432) 50
bond0(3432)->swapper(0) 50
stapio(879)->swapper(0) 26
swapper(0)->stapio(879) 25
stapio(879)->swapper(0) 19
swapper(0)->stapio(879) 17
swapper(0)->watchdog/9(31) 5
watchdog/9(31)->swapper(0) 5
swapper(0)->mysqld(18346) 5
mysqld(18346)->swapper(0) 5
swapper(0)->watchdog/13(43) 5
watchdog/13(43)->swapper(0) 5
swapper(0)->watchdog/14(46) 5
watchdog/14(46)->swapper(0) 5
idle 859
————————————————————–

我们可以看到进程从哪里切换到哪里,并且发生了多少次, 最后一行,我打印出来idle的次数,也就是说这时候系统没啥事情做,就切换到idle(0)这个进程去休息去了。

通过上面的调查,我们会很清楚的了解到我们系统的开销发生在那里,方便我们定位问题。
玩的开心!

相关 [linux 切换 进程] 推荐:

Linux下谁在切换我们的进程

- hikerlive - 淘宝核心系统团队博客
我们在做Linux服务器的时候经常会需要知道谁在做进程切换,什么原因需要做进程切换. 因为进程切换的代价很高,我给出一个LMbench测试出来的数字:. 在我的很高端的服务器上,进程切换的开销在8us左右, 这个相对于高性能的服务器是不可接受的, 所以我们要在一个时间片内尽可能的多做事情,而不是把时间浪费在无谓的切换上.

Linux进程关系

- - 博客园_首页
作者:Vamei 出处:http://www.cnblogs.com/vamei 欢迎转载,也请保留这段声明. Linux的进程相互之间有一定的关系. 比如说,在 Linux进程基础中,我们看到,每个进程都有父进程,而所有的进程以init进程为根,形成一个树状结构. 我们在这里讲解进程组和会话,以便以更加丰富的方式了管理进程.

动态切换 Linux 使用的 CPU 数量

- 李帅 - Wow! Ubuntu
由于要测试一些代码,其运行结果会受到多核并行的影响,所以希望能够调整使用的 CPU 数量. 网络上之前看到的方法是在内核的启动参数上添加一个 maxcpus,但是如果这样的话每切换一次都要重启一次,是在太麻烦了. 想想 Linux 应该是很强大的,所以可以动态修改 CPU 数量才对. 无意中看到 Linux 代码的 Documentation 文件夹下有个文件叫做 cpu-hotplug.txt,于是就看了一下,发现可以在 /sys/devices/system/cpu 看到代表各 CPU 的文件夹按照 cpuX 的命名方式,如 cpu0、cpu1、cpu2 等.

Linux中如何杀掉僵尸进程

- Fornote - C++博客-首页原创精华区
  1) 检查当前僵尸进程信息.   执行上面获得的语句即可, 使用信号量9, 僵尸进程数会大大减少..   3) 过一会儿检查当前僵尸进程信息.   发现僵尸进程数减少了一些, 但还有不少啊..   4) 再次获得杀僵尸进程语句.   执行上面获得的语句即可, 这次使用信号量18杀其父进程, 僵尸进程应该会全部消失..

用 NetHogs 监控 Linux 每个进程的网络情况

- - vpsee.com
有时候我们客户会发现服务器或 VPS 网络慢,进一步发现大量带宽被占用,一些客户到这里为止就不知道怎么办了. 能不能有简单办法找出哪个程序(或者进程)占用了流量呢. Linux 下提供了很多监控流量的小工具,比如 iftop, iptraf, ifstat, darkstat, bwm-ng, vnstat 等,今天介绍的 NetHogs 正是我们需要的工具,nethogs 可以监控每个进程的网络带宽占用情况,为我们进一步分析问题提供了帮助.

Linux中Kill进程的N种方法(转)

- - The Big Data Way,平凡但不乏味
long long ago,曾有一个想法,就是完全脱离windows,使用linux生活、工作. 以前迫于各种专业工具不支持linux,只能无奈的使用xp. 最近工作内 容是android移植+单片机开发,android就不说了,必须用linux开发. 单片机也找到一些linux的工具,于是乎有不少时间是在 linux上进行开发工作.

Linux下java进程CPU占用率高-分析方法

- - Linux - 操作系统 - ITeye博客
今天登陆同事的一台gateway 开始以为hive环境登陆不了了,仔细一看看了下是因为机器很卡,我每次等几秒没登陆就ctrl+c了,看了下是有个java进程cpu:340.4%  mem:14.6%. 一般解决方法是通过top命令找出消耗资源高的线程id,利用strace命令查看该线程所有系统调用.

六种方法全面解释Linux下进程间通信

- - 膘叔
 因为最近在写点东西遇到了这方面的问题. 所以关注了一下,这段内容是摘抄来的. 因为以前用PHP的时候,一般就是shm_attach/msg_get_queue/ 管道等. 有些东西不是特别熟,所以记录下来做笔记 . Linux下进程间通信大致有以下几种:(来自:http://golang.usr.cc/blog-1403-3071.html).

linux进程间通信方式及比较

- - CSDN博客推荐文章
   1.管道(pipe)及有名管道(named pipe):.      管道可用于具有亲缘关系进程间的通信,有名管道除了具有管道所具有的功能外,它还允许无亲缘关系进程间的通信. 2.信号(signal):.      信号是在软件层次上对中断机制的一种模拟,它是比较复杂的通信方式,用于通知进程有某事件发生,一个进程收到一个信号与处理器收到一个中断请求效果上可以说是一致得.

Linux 查看进程消耗内存情况总结

- - ImportNew
在Linux中,有很多命令或工具查看内存使用情况,今天我们来看看如何查看进程消耗、占用的内存情况,Linux的内存管理和相关概念要比Windows复杂一些. 在此之前,我们需要了解一下Linux系统下面有关内存的专用名词和专业术语概念: . 物理内存:就是系统硬件提供的内存大小,是真正的内存,一般叫做内存条.