第10章 系统状态统计和查看

2018年1月6日13:12:57 发表评论 26

写在前面的话:本文是假设你已经有了进程、内存、cpu的理论基础而写的,文中涉及的各种状态只给出了简单说明而没有解释它们的意义,如果不懂这些理论性的东西,本文可能让你看的直接想右上角叉叉。关于这些理论,可以阅读我另一篇文章:http://www.cnblogs.com/f-ck-need-u/p/7058920.html

10.1 /proc的意义及说明

Linux中查看各种状态,其实质是查看内核中相关进程的数据结构中的项,通过工具将其格式化后输出出来。但是内核的数据是绝对不能随意查看或更改的,至少不能直接去修改。所以,在linux上出现了伪文件系统/proc,它是内核中各属性或状态向外提供访问和修改的接口。

在/proc下,记录了内核自己的数据信息,各进程独立的数据信息,统计信息等。绝大多数文件都是只读不可改的,即使对root也一样,但/proc/sys除外,为何如此稍后解释。

第10章 系统状态统计和查看

其中数字命名的目录对应的是各进程的pid号,其内的文件记录的都是该进程当前的数据信息,且都是只读的,例如记录命令信息的cmdline文件,进程使用哪颗cpu信息cpuset,进程占用内存的信息mem文件,进程IO信息io文件等其他各种信息文件。

非数字命名的目录各有用途,例如bus表示总线信息,driver表示驱动信息,fs表示文件系统特殊信息,net表示网络信息,tty表示跟物理终端有关的信息,最特殊的两个是/proc/self和/proc/sys。

先说/proc/self目录,它表示的是当前正在访问/proc目录的进程,因为/proc目录是内核数据向外记录的接口,所以当前访问/proc目录的进程表示的就是当前cpu正在执行的进程。如果执行cat /proc/self/cmdline,会发现其结果总是该命令本身,因为cat是手动敲入的命令,它是重要性进程,cpu会立即执行该命令。

再说/proc/sys这个目录,该目录是为管理员提供用来修改内核运行参数的,所以该目录中的文件对root都是可写的,例如管理数据包转发功能的/proc/sys/net/ipv4/ip_forward文件。使用sysctl命令修改内核运行参数,其本质也是修改/proc/sys目录中的文件。

10.2 查看进程信息

10.2.1 pstree命令

pstree命令将以树的形式显示进程信息,默认树的分支是收拢的,也不显示pid,要显示这些信息需要指定对应的选项。

例如:

第10章 系统状态统计和查看

10.2.2 ps命令

ps命令查看当前这一刻的进程信息,注意查看的是静态进程信息,要查看随时刷新的动态进程信息(如windows的进程管理器那样,每秒刷新一次),使用top或htop命令。

这个命令的man文档及其复杂,它同时支持3种类型的选项:GUN/BSD/UNIX,不同类型的选项其展示的信息格式不一样。有些加了"-"的是SysV风格 的选项,不加"-"的是BSD选项,加不加"-"它们的意义是不一样的,例如ps aux 和ps -aux是不同的。

其实只需掌握少数几个选项即可,关键的是要了解ps显示出的进程信息中每一列代表什么属性。

对于BSD风格的选项,只需知道一个用法ps aux足以,选项"a"表示列出依赖于终端的进程,选项"x"表示列出不依赖于终端的进程,所以两者结合就表示列出所有进程,选项"u"表示展现的进程信息是以用户为导向的,不用管它什么是以用户为导向,用ps aux就没错。

各列的意义:

  • %CPU:表示CPU占用百分比,注意,CPU的衡量方式是占用时间,所以百分比的计算方式是"进程占用cpu时间/cpu总时间",而不是cpu工作强度的状态。
  • %MEM:表示各进程所占物理内存百分比。
  • VSZ:表示各进程占用的虚拟内存,也就是其在线性地址空间中实际占用的内存。单位为kb。
  • RSS:表示各进程占用的实际物理内存。单位为Kb。
  • TTY:表示属于哪个终端的进程,"?"表示不依赖于终端的进程。
  • STAT:进程所处的状态。
    •     D:不可中断睡眠
    •     R:运行中或等待队列中的进程(running/runnable)
    •     S:可中断睡眠
    •     T:进程处于stopped状态
    •     Z:僵尸进程

    对于BSD风格的ps选项,进程的状态还会显示下面几个组合信息。

    •     <:高优先级进程
    •     N:低优先级进程
    •     L:该进程在内存中有被锁定的页
    •     s:表示该进程是session leader,即进程组的首进程。例如管道左边的进程,shell脚本中的shell进程
    •     l:表示该进程是一个线程
    •     +:表示是前段进程。前段进程一般来说都是依赖于终端的
  • START:表示进程是何时被创建的
  • TIME:表示各进程占用的CPU时间
  • COMMAND:表示进程的命令行。如果是内核线程,则使用方括号"[]"包围

注意到了没,ps aux没有显示出ppid。

另外常用的ps选项是ps -elf。其中"-e"表示输出全部进程信息,"-f"和"-l"分别表示全格式输出和长格式输出。全格式会输出cmd的全部参数。

各列的意义:

  • F:程序的标志位。0表示该程序只有普通权限,4表示具有root超级管理员权限,1表示该进程被创建的时候只进行了fork,没有进行exec
  • S:进程的状态位,注意ps选项加了"-"的是非BSD风格选项,不会有"s""<""N""+"等的状态标识位
  • C:CPU的百分比,注意衡量方式是时间
  • PRI:进程的优先级,值越小,优先级越高,越早被调度类选中运行
  • NI:进程的NICE值,值为-20到19,影响优先级的方式是PRI(new)=PRI(old)+NI,所以NI为负数的时候,越小将导致进程优先级越高。
  •     :但要注意,NICE值只能影响非实时进程。
  • ADDR:进程在物理内存中哪个地方。
  • SZ:进程占用的实际物理内存
  • WCHAN:若进程处于睡眠状态,将显示其对应内核线程的名称,若进程为R状态,则显示"-"

10.2.3 ps后grep问题

在ps后加上grep筛选目标进程时,总会发现grep自身进程也被显示出来。先解释下为何会如此。

通过管道将ps结果传递给grep时,管道协调了ps和grep两进程间通信,但管道的本质是进程间数据传递。管道左边的输出数据放入内存,由管道右边的进程读取。假如划分的内存不足以完全存放输出数据,则管道左边的进程将一直等待,直到管道右边取出内存中一部分的数据以让管道左边的进程继续输出,而管道右边的进程在管道左边的进程启动后也立刻启动了,但是它一直处于等待状态,等待接收管道传递来的数据(就像是平时执行命令时不给输入文件将会一直等待输入一样)。

也就是说,管道左右两端的进程是同时被创建的(不考虑父进程创建进程消耗的那点时间),但数据传输是有先后顺序的,左边先传,右边后收,所以可能会造成交叉的情况,左边还没执行完,就捕获到了右边的进程信息。在此处体现在ps还没有统计完进程信息时,grep进程就已经被ps抓到了。

要将grep自身进程排除在结果之外,方法有二:

第二种方法能成功是因为grep进程被ps捕获时的结果是"grep cron[d]",而使用cron[d]匹配时,它将只能匹配crond,所以"grep cron[d]"被筛选掉了。其实加上其他字符将更容易理解。

10.2.4 uptime命令

显示当前时间,已开机运行多少时间,当前有多少用户已登录系统,以及3个平均负载值。

所谓负载率(load),即特定时间长度内,cpu运行队列中的平均进程数(包括线程),一般平均每分钟每核的进程数小于3都认为正常,大于5时负载已经非常高。在UNIX系统中,运行队列包括cpu正在执行的进程和等待cpu的进程(即所谓的可运行runable)。在Linux系统中,还包括不可中断睡眠态(IO等待)的进程。运行队列中每出现一个进程,load就加1,进程每退出运行队列,Load就减1。如果是多核cpu,则还要除以核数。

详细信息见man uptime和https://en.wikipedia.org/wiki/Load_(computing)

例如,单核cpu上的负载值为"1.73 0.60 7.98"时,表示:

最近1分钟:1.73表示平均可运行的进程数,这一分钟要一直不断地执行这1.73个进程。0.73个进程等待该核cpu。

最近5分钟:平均进程数还不足1,表示该核cpu在过去5分钟空闲了40%的时间。

最近15分钟:7.98表示平均可运行的进程数,这15分钟要一直不断地执行这7.98个进程。

结合前5分钟的结果,说明前15-前10分钟时间间隔内,该核cpu的负载非常高。

如果是多核cpu,则还要将结果除以核数。例如4核时,某个最近一分钟的负载值为3.73,则意味着有3.73个进程在运行队列中,这些进程可被调度至4核中的任何一个核上运行。最近1分钟的负载值为1.6,表示这一分钟内每核cpu都空闲(1-1.6/4)=60%的时间。
所以,load的理想值是正好等于CPU的核数,小于核数的时候表示cpu有空闲,超出核数的时候表示有进程在等待cpu,即系统资源不足。

10.2.5 top、htop以及iftop命令

top命令查看动态进程状态,默认每5秒刷新一次。

top选项说明:

在top动态模式下,按下各种键可以进行不同操作。使用"h"或"?"可以查看相关键的说明。

  •   1     :(数字一)表示是否要在top的头部显示出多个cpu信息
  •   H     :表示是否要显示线程,默认不显示
  •   c,S   : c表示是否要展开进程的命令行,S表示显示的cpu时间是否是累积模式,cpu累积模式下已死去的子进程cpu时间会累积到父进程中
  •   x,y   :x高亮排序的列,y表示高亮running进程
  •   u     :仅显示指定用户的进程
  •   n or #:设置要显示最大的进程数量
  •   k     :杀进程
  •   q     :退出top
  •   P :以CPU 的使用资源排序显示
  •   M :以Memory 的使用资源排序显示
  •   N :以PID 来排序

以下是top的一次结果。

  • 第1行:和w命令的第一行一样,也和uptime命令的结果一样。此行各列分别表示"当前时间"、"已开机时长"、"当前在线用户"、"前1、5、15分钟平均负载率"。
  • 第2行:分别表示总进程数、running状态的进程数、睡眠状态的进程数、停止状态进程数、僵尸进程数。
  • 第3-6行:每颗cpu的状况。
  •      us = user mode
  •      sy = system mode
  •      ni = low priority user mode (nice)(用户空间中低优先级进程的cpu占用百分比)
  •      id = idle task
  •      wa = I/O waiting
  •      hi = servicing IRQs(不可中断睡眠,hard interruptible)
  •      si = servicing soft IRQs(可中断睡眠,soft interruptible)
  •      st = steal (time given to other DomU instances)(被偷走的cpu时间,一般被虚拟化软件偷走)
  • 第7-8行:从字面意思理解即可。
  • VIRT:虚拟内存总量
  • RES:实际内存总量
  • SHR:共享内存量
  • TIME:进程占用的cpu时间(若开启了时间累积模式,则此处显示的是累积时间)

top命令虽然非常强大,但是太老了。所以有了新生代的top命令htop。htop默认没有安装,需要手动安装。

htop可以使用鼠标完成点击选中。其他使用方法和top类似,使用h查看各按键意义即可。

第10章 系统状态统计和查看

iftop用于动态显示网络接口的数据流量。用法也很简单,按下h键即可获取帮助。

10.3 vmstat命令

注意vmstat的第一次统计是自开机起的平均值信息,从第二次开始的统计才是指定刷新时间间隔内的资源利用信息,若不指定刷新时间间隔,则默认只显示一次统计信息。

例如,只统计一次信息。

其中各列的意义如下:

Procs

  •    r: 等待队列中的进程数
  •    b: 不可中断睡眠的进程数

Memory

  •    swpd: 虚拟内存使用总量
  •    free: 空闲内存量
  •    buff: buffer占用的内存量(buffer用于缓冲写)
  •    cache: cache占用的内存量(cache用于缓存读,谐音"快取",即为了加快取数据的速度)

Swap

  •    si:从磁盘加载到swap分区的数据流量,单位为"kb/s"
  •    so: 从swap分区写到磁盘的数据流量,单位为"kb/s"

IO

  •    bi: 从块设备接受到数据的速率,单位为blocks/s
  •    bo: 发送数据到块设备的速率,单位为blocks/s

System

  •    in: 每秒中断数,包括时钟中断数量
  •    cs: 每秒上下文切换次数

CPU:统计的是cpu时间百分比,具体信息和top的cpu统计列一样

  •    us: Time spent running non-kernel code. (user time, including nice time)
  •    sy: Time spent running kernel code. (system time)
  •    id: Time spent idle. Prior to Linux 2.5.41, this includes IO-wait time.
  •    wa: Time spent waiting for IO. Prior to Linux 2.5.41, included in idle.
  •    st: Time stolen from a virtual machine. Prior to Linux 2.6.11, unknown.

还可以统计磁盘的IO信息。统计信息的结果很容易看懂,所以略过。

10.4 iostat命令

iostat主要统计磁盘或分区的整体使用情况。也可以输出cpu信息,甚至是NFS网络文件系统的信息。同vmstat/sar一样,第一次统计的都是自系统开机起的平均统计信息。

例如:

各列的意义都很清晰,从字面即可理解。

  • tps:每秒transfer速率(transfers per second),一次对物理设备的IO请求为一个transfer,但多个逻辑请求可能只组成一个transfer
  • Blk_read/s:每秒读取的block数量
  • Blk_wrtn/s:每秒写入的block总数
  • Blk_read:读取的总block数量
  • Blk_wrtn:写入的总block数量

10.5 sar命令

sar是一个非常强大的性能分析工具,它可以获取系统的cpu/等待队列/磁盘IO/内存/网络等性能指标。

功能多的必然结果是选项多,应用复杂,但只要知道一些常用的选项足以。

10.5.1 统计cpu使用情况

各列的意义就不再赘述了,在前面几个信息查看命令已经解释过多次了。

在上面的例子中,统计了所有cpu(0,1,2,3共4颗)每秒的状态信息,每秒还进行了一次汇总,即all,最后还对每颗cpu和汇总all计算了平均值。而我们真正需要关注的是最后的average部分的idle值,idle越小,说明cpu处于空闲时间越少,该颗或整体cpu使用率就越高。

或者直接对整体进行统计。如下:

10.5.2 统计内存使用情况

其中kbdirty表示内存中脏页的大小,即内存中还有多少应该刷新到磁盘的数据。

10.5.3 统计网络流量

第一种方法是查看/proc/net/dev文件。

关注列:receive和transmit分别表示收包和发包,关注每个网卡的bytes即可获得网卡的情况。写一个脚本计算每秒的差值即为网络流量。

或者使用sar -n命令统计网卡接口的数据。

各列的意义如下:

  • rxpck/s:每秒收到的包数量
  • txpck/s:每秒发送的包数量
  • rxkB/s:每秒收到的数据,单位为kb
  • txkB/s:每秒发送的数据,单位为kb
  • rxcmp/s:每秒收到的压缩后的包数量
  • txcmp/s:每秒发送的压缩后的包数量
  • rxmcst/s:每秒收到的多播包数量

10.5.4 查看队列情况

每列意义解释:

  • runq-sz:等待队列的长度,不包括正在运行的进程
  • plist-sz:任务列表中的进程数量,即总任务数
  • ldavg-N:过去1分钟、5分钟、15分钟内系统的平均哎
  • blocked:当前因为IO等待被阻塞的任务数量

10.5.5 统计磁盘IO情况

分别统计的是12:53:06到12:53:07和12:53:07到12:53:08这两秒的IO使用情况。

各列的意义如下:

  • tps:transfer per second,每秒的transfer速率,一次物理IO请求算一次transfer,但多次逻辑IO请求可能组合起来才算一次transfer。
  • rd_sec/s:每秒读取的扇区数,扇区大小为512字节。
  • wr_sec/s:每秒写入的扇区数。
  • avgrq-sz:请求写入设备的平均大小,单位为扇区。(The average size (in sectors) of the requests that were issued to the device)
  • avgqu-sz:请求写入设备的平均队列长度。(The average queue length of the requests that were issued to the device.)
  • await:写入设备的IO请求的平均(消耗)时间,单位微秒(The average time for I/O requests issued to the device to be served.)
  • svctm:不可信的列,该列未来将被移除,所以不用管
  • %util:最重要的一列,显示的是设备的带宽情况。该列若接近100%,说明磁盘速率饱和了。

10.6 free命令

free用于查看内存使用情况。CentOS 6和CentOS 7上显示格式不太一样。

以下以CentOS 7上的free结果说明各列的意义。

Mem和Swap分别表示物理内存和交换分区的使用情况。

  • total:总内存空间
  • used:已使用的内存空间。该值是total-free-buffers-cache的结果
  • free:未使用的内存空间
  • shared:/tmpfs总用的内存空间。对内核版本有要求,若版本不够,则显示为0。
  • buff/cache:buffers和cache的总占用空间
  • available:可用的内存空间。即程序启动时,将认为可用空间有这么多。可用的内存空间为free+buffers+cache。

所以available才是真正需要关注的可使用内存空间量。

使用-w可以将buffers/cache分开显示。

还可以动态统计内存信息,例如每秒统计一次,统计2次。

以下是CentOS 6上的free结果。

在此结果中,"-/+ buffers/cache"的free列才是真正可用的内存空间了,即CentOS 7上的available列。

一般来说,内存可用量的范围低于20%应该要引起注意了。

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: