在UNIX5.0.5 系統(tǒng)中巧用sar 命令進(jìn)行系統(tǒng)維護(hù)
在使用Unix操作系統(tǒng)的過程中,我們常常會用到各種各樣的問題,比如系統(tǒng)運(yùn)行速度突然變慢,系統(tǒng)容易死機(jī)或者主機(jī)所帶的終端常出現(xiàn)死機(jī),這時我們常常猜測,是硬盤空間太小,還是內(nèi)存不足?I/O出現(xiàn)瓶頸,或者是系統(tǒng)的核心參數(shù)出了問題?這時,我們應(yīng)該考慮使用系統(tǒng)給我們提供的sar命令來對系統(tǒng)作一個了解,該命令是系統(tǒng)維護(hù)的重要工具,主要幫助我們掌握系統(tǒng)資源的使用情況,特別是內(nèi)存和CPU 的使用情況,是UNIX系統(tǒng)使用者應(yīng)該掌握的工具之一。 sar 命令行的常用格式:
sar [options] [-A] [-o file] t [n]
在命令行中,n 和t 兩個參數(shù)組合起來定義采樣間隔和次數(shù),t為采樣間隔,是必須有的參數(shù),n為采樣次數(shù),是可選的,默認(rèn)值是1,-o file表示將命令結(jié)果以二進(jìn)制格式存放在文件中,file 在此處不是關(guān)鍵字,是文件名。options 為命令行選項(xiàng),sar命令的選項(xiàng)很多,下面只列出常用選項(xiàng): -A:所有報(bào)告的總和。 -u:CPU利用率 -v:進(jìn)程、I節(jié)點(diǎn)、文件和鎖表狀態(tài)。 -d:硬盤使用報(bào)告。 -r:沒有使用的內(nèi)存頁面和硬盤塊。 -g:串口I/O的情況。 -b:緩沖區(qū)使用情況。 -a:文件讀寫情況。 -c:系統(tǒng)調(diào)用情況。 -R:進(jìn)程的活動情況。 -y:終端設(shè)備活動情況。 -w:系統(tǒng)交換活動。
下面將舉例說明。
例一:使用命令行 sar -u t n例如,每60秒采樣一次,連續(xù)采樣5次,觀察CPU 的使用情況,并將采樣結(jié)果以二進(jìn)制形式存入當(dāng)前目錄下的文件zhou中,需鍵入如下命令: # sar -u -o zhou 60 5 屏幕顯示: SCO_SV scosysv 3.2v5.0.5 i80386 10/01/2001 14:43:50 %usr %sys%wio%idle(-u) 14:44:50 0 1494 14:45:50 0 2493 14:46:50 0 2296 14:47:50 0 2593 14:48:50 0 2296 Average 0 2494 在顯示內(nèi)容包括:
%usr:CPU處在用戶模式下的時間百分比。 %sys:CPU處在系統(tǒng)模式下的時間百分比。 %wio:CPU等待輸入輸出完成時間的百分比。 %idle:CPU空閑時間百分比。
在所有的顯示中,我們應(yīng)主要注意%wio和%idle,%wio的值過高,表示硬盤存在I/O瓶頸,%idle值高,表示CPU較空閑,如果%idle值高但系統(tǒng)響應(yīng)慢時,有可能是CPU等待分配內(nèi)存,此時應(yīng)加大內(nèi)存容量。%idle值如果持續(xù)低于10,那么系統(tǒng)的CPU處理能力相對較低,表明系統(tǒng)中最需要解決的資源是CPU。
如果要查看二進(jìn)制文件zhou中的內(nèi)容,則需鍵入如下sar命令:
# sar -u -f zhou
可見,sar命令即可以實(shí)時采樣,又可以對以往的采樣結(jié)果進(jìn)行查詢。
例二:使用命行sar -v t n
例如,每30秒采樣一次,連續(xù)采樣5次,觀察核心表的狀態(tài),需鍵入如下命令: # sar -v 30 5 屏幕顯示: SCO_SV scosysv 3.2v5.0.5 i80386 10/01/2001 10:33:23 proc-sz ov inod-sz ov file-sz ov lock-sz (-v) 10:33:53 305/ 321 0 1337/2764 0 1561/1706 0 40/ 128 10:34:23 308/ 321 0 1340/2764 0 1587/1706 0 37/ 128 10:34:53 305/ 321 0 1332/2764 0 1565/1706 0 36/ 128 10:35:23 308/ 321 0 1338/2764 0 1592/1706 0 37/ 128 10:35:53 308/ 321 0 1335/2764 0 1591/1706 0 37/ 128 顯示內(nèi)容包括:
proc-sz:目前核心中正在使用或分配的進(jìn)程表的表項(xiàng)數(shù),由核心參數(shù)MAX-PROC控制。
inod-sz:目前核心中正在使用或分配的i節(jié)點(diǎn)表的表項(xiàng)數(shù),由核心參數(shù) MAX-INODE控制。
file-sz: 目前核心中正在使用或分配的文件表的表項(xiàng)數(shù),由核心參數(shù)MAX-FILE控制。
ov:溢出出現(xiàn)的次數(shù)。
Lock-sz:目前核心中正在使用或分配的記錄加鎖的表項(xiàng)數(shù),由核心參數(shù)MAX-FLCKREC控制。 顯示格式為
實(shí)際使用表項(xiàng)/可以使用的表項(xiàng)數(shù)
顯示內(nèi)容表示,核心使用完全正常,三個表沒有出現(xiàn)溢出現(xiàn)象,核心參數(shù)不需調(diào)整,如果出現(xiàn)溢出時,要調(diào)整相應(yīng)的核心參數(shù),將對應(yīng)的表項(xiàng)數(shù)加大。
例三:使用命行sar -d t n
例如,每30秒采樣一次,連續(xù)采樣5次,報(bào)告設(shè)備使用情況,需鍵入如下命令:
# sar -d 30 5
屏幕顯示:
SCO_SV scosysv 3.2v5.0.5 i80386 10/01/2001 11:06:43 device %busy avque r+w/sblks/savwait avserv (-d) 11:07:13 wd-0 1.47 2.75 4.67 14.73 5.50 3.14 11:07:43 wd-0 0.43 18.77 3.07 8.66 25.11 1.41 11:08:13 wd-0 0.77 2.78 2.77 7.26 4.94 2.77 11:08:43 wd-0 1.10 11.18 4.10 11.26 27.32 2.68 11:09:13 wd-0 1.97 21.78 5.86 34.06 69.66 3.35 Average wd-0 1.15 12.11 4.09 15.19 31.12 2.80
顯示內(nèi)容包括:
device: sar命令正在監(jiān)視的塊設(shè)備的名字。 %busy: 設(shè)備忙時,傳送請求所占時間的百分比。 avque: 隊(duì)列站滿時,未完成請求數(shù)量的平均值。 r+w/s: 每秒傳送到設(shè)備或從設(shè)備傳出的數(shù)據(jù)量。 blks/s: 每秒傳送的塊數(shù),每塊512字節(jié)。 avwait: 隊(duì)列占滿時傳送請求等待隊(duì)列空閑的平均時間。 avserv: 完成傳送請求所需平均時間(毫秒)。
在顯示的內(nèi)容中,wd-0是硬盤的名字,%busy的值比較小,說明用于處理傳送請求的有效時間太少,文件系統(tǒng)效率不高,一般來講,%busy值高些,avque值低些,文件系統(tǒng)的效率比較高,如果%busy和avque值相對比較高,說明硬盤傳輸速度太慢,需調(diào)整。 例四:使用命行sar -b t n
例如,每30秒采樣一次,連續(xù)采樣5次,報(bào)告緩沖區(qū)的使用情況,需鍵入如下命令:
# sar -b 30 5
屏幕顯示:
SCO_SV scosysv 3.2v5.0.5 i80386 10/01/2001 14:54:59 bread/s lread/s %rcache bwrit/s lwrit/s %wcache pread/s pwrit/s (-b) 14:55:29 0147100 52178 0 0 14:55:59 0186100 52579 0 0 14:56:29 4232 98 85886 0 0 14:56:59 0125100 52376 0 0 14:57:29 0 89100 41266 0 0 Average 1156 99 52880 0 0 顯示內(nèi)容包括:
bread/s: 每秒從硬盤讀入系統(tǒng)緩沖區(qū)buffer的物理塊數(shù)。 lread/s: 平均每秒從系統(tǒng)buffer讀出的邏輯塊數(shù)。 %rcache: 在buffer cache中進(jìn)行邏輯讀的百分比。 bwrit/s: 平均每秒從系統(tǒng)buffer向磁盤所寫的物理塊數(shù)。 lwrit/s: 平均每秒寫到系統(tǒng)buffer邏輯塊數(shù)。 %wcache: 在buffer cache中進(jìn)行邏輯讀的百分比。 pread/s: 平均每秒請求物理讀的次數(shù)。 pwrit/s: 平均每秒請求物理寫的次數(shù)。 在顯示的內(nèi)容中,最重要的是%cache和%wcache兩列,它們的值體現(xiàn)著buffer的使用效率,%rcache的值小于90或者%wcache的值低于65,應(yīng)適當(dāng)增加系統(tǒng)buffer的數(shù)量,buffer數(shù)量由核心參數(shù)NBUF控制,使%rcache達(dá)到90左右,%wcache達(dá)到80左右。但buffer參數(shù)值的多少影響I/O效率,增加buffer,應(yīng)在較大內(nèi)存的情況下,否則系統(tǒng)效率反而得不到提高。
例五:使用命行sar -g t n
例如,每30秒采樣一次,連續(xù)采樣5次,報(bào)告串口I/O的操作情況,需鍵入如下命令: # sar -g 30 5 屏幕顯示:
SCO_SV scosysv 3.2v5.0.5 i8038611/22/2001 17:07:03 ovsiohw/s ovsiodma/sovclist/s (-g) 17:07:33 0.00 0.00 0.00 17:08:03 0.00 0.00 0.00 17:08:33 0.00 0.00 0.00 17:09:03 0.00 0.00 0.00 17:09:33 0.00 0.00 0.00 Average 0.00 0.00 0.00 顯示內(nèi)容包括:
ovsiohw/s:每秒在串口I/O硬件出現(xiàn)的溢出。
ovsiodma/s:每秒在串口I/O的直接輸入輸出通道高速緩存出現(xiàn)的溢出。
ovclist/s :每秒字符隊(duì)列出現(xiàn)的溢出。
在顯示的內(nèi)容中,每一列的值都是零,表明在采樣時間內(nèi),系統(tǒng)中沒有發(fā)生串口I/O溢出現(xiàn)象。
sar命令的用法很多,有時判斷一個問題,需要幾個sar命令結(jié)合起來使用,比如,懷疑CPU存在瓶頸,可用sar -u 和sar -q來看,懷疑I/O存在瓶頸,可用sar -b、sar -u和sar-d來看,以上舉出的五例僅僅是其中的一部分,有興趣的朋友不妨一試。
