最近有人問,我的系統(tǒng)swap快被耗盡了,可是卻不知道哪些程序占用了swap,到處發(fā)帖問什么命令可以查看。其實(shí)linux系統(tǒng)目前并沒有這樣的命令(或許是有,但我孤陋寡聞不清楚),但是我們可以通過(guò)編寫腳本來(lái)自己找出占用swap的程序。 那么怎樣編寫這個(gè)腳本呢,首先、我們需要知道去哪查看進(jìn)程占用資源的情況。每個(gè)進(jìn)程都會(huì)在/proc下面生成一個(gè)以進(jìn)程號(hào)為名字的目錄,里面的各個(gè)文件就是其在內(nèi)存中的映像。
其中smaps這個(gè)文件,便記載了每個(gè)進(jìn)程每個(gè)數(shù)據(jù)段占用內(nèi)存的情況。
如下是某占用swap的進(jìn)程的smaps文件截圖(部分):
Swap: 后面的數(shù)字,就是該數(shù)據(jù)段占用的swap大小,我們只要把這個(gè)文件里所有出現(xiàn)的swap加起來(lái),就是這個(gè)進(jìn)程所占用的swap大小了。
OK,下面開始寫代碼:
點(diǎn)擊(此處)折疊或打開 #!/bin/bash echo -e "PID\t\tSwap\t\tProc_Name" # 拿出/proc目錄下所有以數(shù)字為名的目錄(進(jìn)程名是數(shù)字才是進(jìn)程,其他如sys,net等存放的是其他信息) for pid in `ls -l /proc | grep ^d | awk ''{ print $9 }''| grep -v [^0-9]` do # 讓進(jìn)程釋放swap的方法只有一個(gè):就是重啟該進(jìn)程?;蛘叩绕渥詣?dòng)釋放。 # 如果進(jìn)程會(huì)自動(dòng)釋放,那么我們就不會(huì)寫腳本來(lái)找他了,找他都是因?yàn)樗麤]有自動(dòng)釋放。 # 所以我們要列出占用swap并需要重啟的進(jìn)程,但是init這個(gè)進(jìn)程是系統(tǒng)里所有進(jìn)程的祖先進(jìn)程 # 重啟init進(jìn)程意味著重啟系統(tǒng),這是萬(wàn)萬(wàn)不可以的,所以就不必檢測(cè)他了,以免對(duì)系統(tǒng)造成影響。 if [ $pid -eq 1 ];then continue;fi # Do not check init process # 判斷改進(jìn)程是否占用了swap grep -q "Swap" /proc/$pid/smaps 2>/dev/null if [ $? -eq 0 ];then # 如果占用了swap # 占用swap的總大小(單位:KB) swap=$(grep Swap /proc/$pid/smaps | gawk ''{ sum+=$2;} END{ print sum }'') # 進(jìn)程名 proc_name=$(ps aux | grep -w "$pid" | grep -v grep | awk ''{ for(i=11;i<=NF;i++){ printf("%s ",$i); }}'') if [ $swap -gt 0 ];then # 如果占用了swap則輸出其信息 echo -e "$pid\t${swap}\t$proc_name" fi fi done | sort -k2 -n | gawk -F''\t'' ''{ # 按占用swap的大小排序,再用awk實(shí)現(xiàn)單位轉(zhuǎn)換。 # 如:將1024KB轉(zhuǎn)換成1M。將1048576KB轉(zhuǎn)換成1G,以提高可讀性。 pid[NR]=$1; size[NR]=$2; name[NR]=$3; } END{ for(id=1;id<=length(pid);id++) { if(size[id]<1024) printf("%-10s\t%15sKB\t%s\n",pid[id],size[id],name[id]); else if(size[id]<1048576) printf("%-10s\t%15.2fMB\t%s\n",pid[id],size[id]/1024,name[id]); else printf("%-10s\t%15.2fGB\t%s\n",pid[id],size[id]/1048576,name[id]); } }'' 本人在某臺(tái)已占用swap的服務(wù)器執(zhí)行的結(jié)果如下:
圖片有刪減(為方便閱讀)
腳本執(zhí)行結(jié)果一目了然,如果某程序占用了大量的swap,則重啟該進(jìn)程即可。否則時(shí)間長(zhǎng)了,很可能會(huì)因?yàn)閟wap耗盡而導(dǎo)致系統(tǒng)死機(jī)。
|
|
來(lái)自: 小豬窩969 > 《性能測(cè)試》