Linux 状态命令之 top

简介

top 命令是 Linux 下常用的性能分析工具,能够实时显示系统中各个进程的资源占用状况,类似于 Windows 的任务管理器。top 是一个动态显示过程,即可以通过用户按键来不断刷新当前状态。如果在前台执行该命令,它将独占前台,直到用户终止该程序为止。

语法

1
2
3
4
5
6
7
8
9
10
11
top [-] [d] [p] [q] [c] [C] [S] [n]

参数:
d:指定每两次屏幕信息刷新之间的时间间隔。当然用户可以使用s交互命令来改变之。
p:通过指定监控进程ID来仅仅监控某个进程的状态。
q:该选项将使top没有任何延迟的进行刷新。如果调用程序有超级用户权限,那么top将以尽可能高的优先级运行。
S:指定累计模式。
s:使top命令在安全模式中运行。这将去除交互命令所带来的潜在危险。
i:使top不显示任何闲置或者僵死进程。
c:显示整个命令行而不只是显示命令名。
H:显示线程。

交互命令

top 常用交互命令

  1. 基础操作
    1. 1:显示CPU详细信息,每核显示一行。
    2. d/s:修改刷新频率,单位为秒。
    3. h:可显示帮助界面。
    4. n:指定进程列表显示行数,默认为满屏行数。
    5. b:高亮显示,一般为运行状态(runing)的进程才被加亮。
    6. q:退出top。
  2. 面板隐藏显示
    1. l:隐藏/显示第1行负载信息。
    2. t:隐藏/显示第2~3行CPU信息。
    3. m:隐藏/显示第4~5行内存信息。
    4. c:切换显示命令名称和完整命令行。显示完整的命令。
  3. 进程列表排序
    1. M:根据驻留内存大小进行排序。
    2. P:根据CPU使用百分比大小进行排序。
    3. T:根据时间/累计时间进行排序。
  4. 其他
    1. W:将当前设置写入~/.toprc文件中。这是写top配置文件的推荐方法。
    2. h或者?:显示帮助画面,给出一些简短的命令总结说明。
    3. k:终止一个进程。系统将提示用户输入需要终止的进程PID,以及需要发送给该进程什么样的信号。一般的终止进程可以使用15信号;如果不能正常结束那就使用信号9强制结束该进程。默认值是信号15。在安全模式中此命令被屏蔽。
    4. i:忽略闲置和僵死进程。这是一个开关式命令。
    5. r:重新安排一个进程的优先级别。系统提示用户输入需要改变的进程PID以及需要设置的进程优先级值。输入一个正值将使优先级降低,反之则可以使该进程拥有更高的优先权。默认值是10。
    6. S:切换到累计模式。
    7. s:改变两次刷新之间的延迟时间。系统将提示用户输入新的时间,单位为s。如果有小数,就换算成ms。输入0值则系统将不断刷新,默认值是5 s。需要注意的是如果设置太小的时间,很可能会引起不断刷新,从而根本来不及看清显示的情况,而且系统负载也会大大增加。

全部交互操作指令

在 top 命令中按 f 按可以查看显示的列信息,按对应字母来开启/关闭列,大写字母表示开启,小写字母表示关闭。带 * 号的是默认列。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
A: PID = (Process Id) 进程Id
E: USER = (User Name) 进程所有者的用户名
H: PR = (Priority) 优先级
I: NI = (Nice value) nice值。负值表示高优先级,正值表示低优先级
O: VIRT = (Virtual Image (kb)) 进程使用的虚拟内存总量,单位kb。VIRT=SWAP+RES
Q: RES = (Resident size (kb)) 进程使用的、未被换出的物理内存大小,单位kb。RES=CODE+DATA
T: SHR = (Shared Mem size (kb)) 共享内存大小,单位kb
W: S = (Process Status) 进程状态。D=不可中断的睡眠状态,R=运行,S=睡眠,T=跟踪/停止,Z=僵尸进程
K: %CPU = (CPU usage) 上次更新到现在的CPU时间占用百分比
N: %MEM = (Memory usage (RES)) 进程使用的物理内存百分比
M: TIME+ = (CPU Time, hundredths) 进程使用的CPU时间总计,单位1/100秒
b: PPID = (Parent Process Pid) 父进程Id
c: RUSER = (Real user name)
d: UID = (User Id) 进程所有者的用户id
f: GROUP = (Group Name) 进程所有者的组名
g: TTY = (Controlling Tty) 启动进程的终端名。不是从终端启动的进程则显示为 ?
j: P = (Last used cpu (SMP)) 最后使用的CPU,仅在多CPU环境下有意义
p: SWAP = (Swapped size (kb)) 进程使用的虚拟内存中,被换出的大小,单位kb
l: TIME = (CPU Time) 进程使用的CPU时间总计,单位秒
r: CODE = (Code size (kb)) 可执行代码占用的物理内存大小,单位kb
s: DATA = (Data+Stack size (kb)) 可执行代码以外的部分(数据段+栈)占用的物理内存大小,单位kb
u: nFLT = (Page Fault count) 页面错误次数
v: nDRT = (Dirty Pages count) 最后一次写入到现在,被修改过的页面数
y: WCHAN = (Sleeping in Function) 若该进程在睡眠,则显示睡眠中的系统函数名
z: Flags = (Task Flags <sched.h>) 任务标志,参考 sched.h
X: COMMAND = (Command name/line) 命令名/命令行

示例

top

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
[fenglepeng@centos]# top

top - 20:56:23 up 733 days, 1:48, 2 users, load average: 0.01, 0.04, 0.05
Tasks: 83 total, 1 running, 82 sleeping, 0 stopped, 0 zombie
%Cpu(s): 1.3 us, 1.0 sy, 0.0 ni, 97.7 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
KiB Mem : 1882008 total, 83488 free, 428488 used, 1370032 buff/cache
KiB Swap: 0 total, 0 free, 0 used. 1265516 avail Mem

PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
23352 root 20 0 680720 14664 2072 S 0.7 0.8 1244:54 barad_agent
31977 root 20 0 1022012 83316 16380 S 0.7 4.4 432:13.84 YDService
6 root 20 0 0 0 0 S 0.3 0.0 32:30.37 ksoftirqd/0
1 root 20 0 191084 3504 2060 S 0.0 0.2 251:35.89 systemd
2 root 20 0 0 0 0 S 0.0 0.0 0:26.11 kthreadd
4 root 0 -20 0 0 0 S 0.0 0.0 0:00.00 kworker/0:0H
7 root rt 0 0 0 0 S 0.0 0.0 0:00.00 migration/0
8 root 20 0 0 0 0 S 0.0 0.0 0:00.00 rcu_bh
9 root 20 0 0 0 0 S 0.0 0.0 72:41.61 rcu_sched
10 root 0 -20 0 0 0 S 0.0 0.0 0:00.00 lru-add-drain
11 root rt 0 0 0 0 S 0.0 0.0 3:54.35 watchdog/0
13 root 20 0 0 0 0 S 0.0 0.0 0:00.00 kdevtmpfs
14 root 0 -20 0 0 0 S 0.0 0.0 0:00.00 netns
15 root 20 0 0 0 0 S 0.0 0.0 0:16.65 khungtaskd
16 root 0 -20 0 0 0 S 0.0 0.0 0:00.02 writeback
17 root 0 -20 0 0 0 S 0.0 0.0 0:00.00 kintegrityd
18 root 0 -20 0 0 0 S 0.0 0.0 0:00.00 bioset
19 root 0 -20 0 0 0 S 0.0 0.0 0:00.00 bioset
20 root 0 -20 0 0 0 S 0.0 0.0 0:00.00 bioset
21 root 0 -20 0 0 0 S 0.0 0.0 0:00.00 kblockd

其中:

  • 第一行,Top 任务队列信息(系统运行状态及平均负载),与 uptime 命令结果相同。

    • 20:56:23:系统当前时间。
    • up 733 days, 1:48:系统开机到现在经过了多少时间。
    • 2 users:当前2用户在线。
    • load average: 0.01, 0.04, 0.05:系统 1 分钟、5 分钟、15 分钟的 CPU 负载信息。
      • 单核 CPU 情况下,0.00 表示没有任何负荷,1.00 表示刚好满负荷,超过 1 侧表示超负荷,理想值是 0.7-0.8。
  • 第二行,Tasks 进程相关信息。

    • 83 total:很好理解,就是当前有 83 个任务,也就是 83 个进程。
    • 1 running:1 个进程正在运行。
    • 82 sleeping:82 个进程睡眠。
    • 0 stopped:停止的进程数。
    • 0 zombie:僵死的进程数。
  • 第三行,Cpu(s):表示这一行显示 CPU 总体信息。

    • 1.3%us:用户态进程占用 CPU 时间百分比,不包含 renice 值为负的任务占用的 CPU 的时间。
    • 1.0%sy:内核占用 CPU 时间百分比。
    • 0.0%ni:改变过优先级的进程占用 CPU 的百分比。
    • 97.7%id:空闲 CPU 时间百分比。
    • 0.0%wa:等待输入输出 I/O 的 CPU 时间百分比。
      • 因为 CPU 速度比硬盘写入数度快,有等待数据写入的过程,如果这个值大说明硬盘写入速度比较慢,压力比较大。 也就是IO性能可能存在瓶颈,可以通过命令iostat来查看
    • 0.0%hi:CPU 硬中断时间百分比。
      • 一般硬件中断可以分析文件 /proc/interrupts/proc/irq/pid/smp_affinity、服务 irqbalance 是否配置、以及CPU的频率设置。
    • 0.0%si:CPU 软中断时间百分比。
      • 软中断一般和网络有关,如网卡到IP层的数据包收发,系统长时间写日志等都会产生软中断。 当网络出现拥塞,软件中断程序 ksoftirqd 肯定会出现瓶颈,可使用 ps aux | grep ksoftirqd 命令查看相关信息。
    • 0.0%st:Steal time 虚拟机被 hypervisor 偷去的 CPU 时间(如果当前处于一个 hypervisor 下的 vm,实际上 hypervisor 也是要消耗一部分CPU处理时间的)。
    • 注:这里显示数据是所有 cpu 的平均值,如果想看每一个 cpu 的处理情况,按 1 即可;再按 1,可折叠。
  • 第四行,Men:内存的意思。

    • 1882008 total:物理内存总量。
    • 83488 used:使用的物理内存量。
    • 428488 free:空闲的物理内存量。
    • 1370032 buff/cache:用作内核缓存的物理内存量。
      • buffers 和 cached 的作用是缩短 I/O 系统调用的时间,比如读写。cache 的值大,说明 cache 住的文件数多,若频繁的访问文件能被命中,则明显会比读取磁盘调用快,磁盘的 IO 必定会减少。若命中率低,要考虑 drop cache 并提升命中率
  • 第五行,Swap:交换空间。

    • 0 total:交换区总量。
    • 0 used:使用的交换区量。
    • 0 free:空闲的交换区量。
    • 0 cached:缓冲交换区总量。
  • 进程信息。

    • PID:进程的 ID,如果使用了 -H 选项,显示的是线程的 id。
    • USER:进程所有者。
    • PR:进程的优先级别,越小越优先被执行。
    • NI nice:值。
    • VIRT:进程占用的虚拟内存。
    • RES:进程占用的物理内存。
    • SHR:进程使用的共享内存。
    • S:进程的状态。S表示休眠,R表示正在运行,Z表示僵死状态,N表示该进程优先值为负数。
    • %CPU:进程占用CPU的使用率。
    • %MEM:进程使用的物理内存和总内存的百分比。
    • TIME+:该进程启动后占用的总的CPU时间,即占用CPU使用时间的累加值。
    • COMMAND:进程启动命令名称。

注:

  • 交互指令使用频率最高的是 P、T、M,因为通常使用 top,我们就想看看是哪些进程最耗 cpu 资源、占用的内存最多。
  • 通过 shift + >shift + < 可以向右或左改变排序列。
  • 只查看内存:可用 free 命令。
  • 只查看 uptime 信息(第一行):可用 uptime 命令。

查看线程

1
2
3
4
5
# 查看系统中的所有线程
top -H

# 查看某一进程对应的线程
top -Hp pid

top -Htop -Hp pid 命令执行的结果中也包含 PID,这个时候可以把 PID 理解为 线程的ID,原因如下:

Linux 内核并不支持真正意义上的线程,Linux 线程库是用与普通进程具有同样内核调度视图的轻量级进程来实现线程支持的。

这些轻量级进程拥有独立的进程id,在进程调度、信号处理、IO 等方面享有与普通进程一样的能力。

简单来说,就是同一个进程下的 N 个线程与 N 个共享了某些资源的进程是一样的。Linux 下的线程就是进程,公用通用的进程结果 task_struct。仅仅不同的是,同一进程下的线程共享某些资源而已。

可以使用 lsof 命令来验证,如下。

1
2
3
4
5
6
7
8
9
10
[fenglepeng@centos]# top -Hp 6330 -d 30
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
6330 mysql 20 0 1202824 216472 5600 S 0.0 11.5 0:02.08 mysqld
6334 mysql 20 0 1202824 216472 5600 S 0.0 11.5 9:20.37 mysqld


[fenglepeng@centos]# lsof |grep mysql| grep 6334
COMMAND PID TID USER FD TYPE DEVICE SIZE/OFF NODE NAME
mysqld 6330 6334 mysql cwd DIR 253,1 4096 1573757 /var/lib/mysql
mysqld 6330 6334 mysql rtd DIR 253,1 4096 2 /

Linux 状态命令之 top
https://flepeng.github.io/002-Linux-21-命令-Linux-状态命令之-top/
作者
Lepeng
发布于
2021年7月5日
许可协议