监控cpu命令
一个应用占用CPU很高,除了确实是计算密集型应用之外,通常原因都是出现了死循环。CPU负载过高解决问题过程:
使用【top】命令定位异常进程,可发现12836的CPU和内存占用率都非常高
备注: top 命令默认情况下,是每 3 秒刷新一次。也可以通过 top -d <刷新时间间隔> 来指定刷新频率,如top -d 0.1 或top -d 0.01 等。top 执行时,也可以按“s ”键,修改时间间隔。
使用【top -H -p 进程号】查看异常线程
使用【printf "%x\n" 线程号】将异常线程号转化为16进制
使用【jstack 进程号|grep 16进制异常线程号 -A90】来定位异常代码的位置(最后的-A90是日志行数,也可以输出为文本文件或使用其他数字)。可以看到异常代码的位置。
找到相应代码检查,发现确实有死循环存在。
排查CPU故障的常用命令:
top命令:Linux命令。可以查看实时的CPU使用情况。也可以查看最近一段时间的CPU使用情况。
PS命令:Linux命令。强大的进程状态监控命令。可以查看进程以及进程中线程的当前CPU使用情况。属于当前状态的采样数据。
jstack:Java提供的命令。可以查看某个进程的当前线程栈运行情况。根据这个命令的输出可以定位某个进程的所有线程的当前运行状态、运行代码,以及是否死锁等等。
pstack:Linux命令。可以查看某个进程的当前线程栈运行情况。
监控系统cpu
高清的概念是1080p,意思是分辨率达到1920x1080。
看上去很高,其实并没有多少,也就两百万像素。
但还有更便宜的低像素感光元件,有些商家就用低像素(30万~80万像素)元件组装摄像头,然后用软件插值来达到两百万像素,这叫虚标。
就算没有虚标,实打实的两百万像素摄像头,也不是各个都能拍摄清晰的视频。
视频除了分辨率,还有帧数要求,电脑上看的电影视频,帧数至少要24帧/秒,而市面上的所谓高清摄像头,往往只能达到10~15左右,画面看上去就是一卡一卡的,特别是拍摄对象如果有剧烈动作,画面变化太大的时候。
要处理高分辨率高帧数的视频流,需要摄像头里面的处理器(cpu)也要达到一定要求,便宜货显然是做不到的。
就算上面的全都没问题,还有一个传输问题。
监控摄像头大多是用同轴电缆传输数据,高清视频有带宽标准,同轴电缆是做不到的。
所以那种保安室的监控摄像头+硬盘录像机的设备,都不是真正的高清,最多也就720p的半高清。
实时监控当前cpu和内存情况的命令
硬件检测一般需要更专业一些的第三方工具,比如你要检测硬盘有没有物理坏道、显示器有没有坏点,这些都需要第三方的软件。windows自身提供的硬件检测类的命令极少。
1、只是想了解硬件的配置信息,可以使用鲁大师、everest等等。
2、检测CPU可以使用CPU-Z,这款工具比较全面,除了解CPU自身的硬件信息外,还可以检测主板、内存、SPD、显卡。
3、检测硬盘可以使用hdtunuepro,这是专业的硬盘检测工具。
4、显示器检测可以使用DisplayX,能检测显示器是否有坏点。
CPU监控软件
1、软媒系统雷达:
软媒魔方中的独立小工具,绿色软件,小巧美观。支持显示CPU、内存使用率,流量、硬盘读写和温度监控。
2、Fraps:
Fraps是一款游戏辅助+媒体录制软件,用它可以轻松了解机器在运行游戏时的帧数,从而了解机器的性能!另外它还具备在游戏中的截屏和录像功能。
3、TrafficMonitor:
是一款开源免费的 Windows 平台实时网速监控软件,可以在任务栏或桌面悬浮窗显示系统资源占用信息。支持显示实时网速、CPU 和内存利用率,并且支持更换皮肤、历史流量统计等功能。
4、游戏加加:
游戏加加是一款专门为游戏爱好者制作的系统信息监控软件,可以在桌面和游戏中显示系统监测信息。提供CPU和GPU的温度、频率、占用,风扇转速,显存、内存占用,FPS、网络速度等,可以根据自己的需求选择显示项目。
5、Open Hardware Monitor:
一款免费开源的电脑信息检测工具,绿色软件无需安装。可以监控电脑的温度、风扇转速、电压、负载和功耗等。既可以显示在独立的窗口,也支持桌面小工具和系统托盘。
linux 监控cpu
nmon analyser
这是一个表格,内置处理分析功能,通过Excel宏来实现的
操作步骤:
监控数据生成,通过nmon命令行来在服务器端生成
数据下载,通过ftp、scp等工具来完成
数据导入,通过Excel表格来实现
数据分析,宏会帮助你实现数据分析,生成数据报告
总体来说nmon是非常牛逼的,报告也很自然好看,至少比绝大多数人手工做的要好
是个值得推荐的工具。
性能分析
其实光有报告,还不能算分析,真正的分析是人脑完成的
比如:CPU占用高不高,是不是正常,IO是不是正常,网络带宽、内存占用、cache大小等。。。。。靠对操作系统和应用软件深入的理解才能真正分析出来是不是有优化空间,数据是否正常等
cpugpu监控
GPU占用很高说明显卡的性能得到充分的使用,只要温度在正常范围内就可以。如果GPU和CPU的温度过高会导致运行频率降低,玩游戏时就会卡。
GPU就是显卡处理芯片,APU是把GPU融进CPU里,不过intel显卡会用CPU辅助处理,而ATI显卡会独立处理数据。
玩游戏时可对GPU使用率进行监控。如果一直在99%还卡机,说明是显卡瓶颈。如果一直在浮动变化还卡,可能是游戏的优化问题。如果GPU使用率不满但CPU满载,那就是CPU瓶颈
实时监控cpu
概述
今天主要对mpstat、iostat、sar、vmstat命令做一下总结,这几个命令都是属于运维人员必须掌握的,所以,能不偷懒就不偷懒了。
1、mpstat
mpstat是Multiprocessor Statistics的缩写,是实时监控工具,报告与cpu的一些统计信息这些信息都存在/proc/stat文件中,在多CPU系统里,其不但能查看所有的CPU的平均状况的信息,而且能够有查看特定的cpu信息,mpstat最大的特点是:可以查看多核心的cpu中每个计算核心的统计数据;而且类似工具vmstat只能查看系统的整体cpu情况。
实例:查看多核cpu当前运行的状况,每两秒更新一次,一共更新5次
# mpstat 2 5
说明:
%user 在internal时间段里,用户态的CPU时间(%),不包含nice值为负进程 (usr/total)*100
%nice 在internal时间段里,nice值为负进程的CPU时间(%) (nice/total)*100
%sys 在internal时间段里,内核时间(%) (system/total)*100
%iowait 在internal时间段里,硬盘IO等待时间(%) (iowait/total)*100
%irq 在internal时间段里,硬中断时间(%) (irq/total)*100
%soft 在internal时间段里,软中断时间(%) (softirq/total)*100
%idle 在internal时间段里,CPU除去等待磁盘IO操作外的因为任何原因而空闲的时间闲置时间(%) (idle/total)*100
2、iostat
iostat用于输出CPU和磁盘I/O相关的统计信息.
语法:
iostat [ -c ] [ -d ] [ -h ] [ -N ] [ -k | -m ] [ -t ] [ -V ] [ -x ] [ -z ] [ device [...] | ALL ] [ -p [ device [,...] | ALL ] ] [ interval [ count ] ]
实例1:
--参数-d表示显示设备磁盘的使用状态;-k表示某些使用block为单位的列强制使用kilobytes为单位,2表示数据每隔2秒刷新一次 6表示一共刷新6次
# iostat -d -k 2 6
说明:
tps:该设备每秒的传输次数(Indicate the number of transfers per second that were issued to the device.)。
"一次传输"意思是"一次I/O请求"。多个逻辑请求可能会被合并为"一次I/O请求"。"一次传输"请求的大小是未知的。
kB_read/s:每秒从设备(drive expressed)读取的数据量;
kB_wrtn/s:每秒向设备(drive expressed)写入的数据量;
kB_read:读取的总数据量;
kB_wrtn:写入的总数量数据量;这些单位都为Kilobytes。
实例2:
--可以把K单位换成M
# iostat -d -m 2 6
实例3:
--使用iostat查看cpu统计信息使用-C参数
# iostat -c 2 6
实例4:-X参数
--iostat还有一个比较常用的-X参数,该选项将用于显示和io相关的扩展数据。
# iostat -d -x -k 1 6
3、sar
sar(System ActivityReporter系统活动情况报告)是目前Linux上最为全面的系统性能分析工具之一,可以从多方面对系统的活动进行报告,包括:文件的读写情况、系统调用的使用情况、磁盘I/O、CPU效率、内存使用状况、进程活动及IPC有关的活动等,sar命令有sysstat安装包安装。
语法:
sar [ options ] [ <interval> [ <count> ] ]
--Options are:
-A:所有报告的总和
-b:显示I/O和传递速率的统计信息
-B:显示换页状态
-d:输出每一块磁盘的使用信息
-e:设置显示报告的结束时间
-f:从制定的文件读取报告
-i:设置状态信息刷新的间隔时间
-P:报告每个CPU的状态
-R:显示内存状态
–u:输出cpu使用情况和统计信息
–v:显示索引节点、文件和其他内核表的状态
-w:显示交换分区的状态
-x:显示给定进程的装
-r:报告内存利用率的统计信息
实例1:
--每2秒采样一次,连续4次,观察cpu的使用情况,并将采样的结果以二进制形式存入当前目录下的文件sar中,如下:
# sar -u -o sar 2 4
实例2:
--从二进制中调取
# sar -u -f /root/sar
实例3:
--报告每个cpu的状态,1秒一次,一共4次
# sar -p 1 4
实例4:
--查看平均负载
#sar -q
实例5:
--查看内存使用情况
#sar -r
实例6:
--查看系统swap分区的统计信息
# sar -w
实例7:
--磁盘使用统计信息
# sar -d
默认监控:
sar 5 5 // CPU和IOWAIT统计状态
(1) sar -b 5 5 // IO传送速率
(2) sar -B 5 5 // 页交换速率
(3) sar -c 5 5 // 进程创建的速率
(4) sar -d 5 5 // 块设备的活跃信息
(5) sar -n DEV 5 5 // 网路设备的状态信息
(6) sar -n SOCK 5 5 // SOCK的使用情况
(7) sar -n ALL 5 5 // 所有的网络状态信息
(8) sar -P ALL 5 5 // 每颗CPU的使用状态信息和IOWAIT统计状态
(9) sar -q 5 5 // 队列的长度(等待运行的进程数)和负载的状态
(10) sar -r 5 5 // 内存和swap空间使用情况
(11) sar -R 5 5 // 内存的统计信息(内存页的分配和释放、系统每秒作为BUFFER使用内存页、每秒被cache到的内存页)
(12) sar -u 5 5 // CPU的使用情况和IOWAIT信息(同默认监控)
(13) sar -v 5 5 // inode, file and other kernel tablesd的状态信息
(14) sar -w 5 5 // 每秒上下文交换的数目
(15) sar -W 5 5 // SWAP交换的统计信息(监控状态同iostat 的si so)
(16) sar -x 2906 5 5 // 显示指定进程(2906)的统计信息,信息包括:进程造成的错误、用户级和系统级用户CPU的占用情况、运行在哪颗CPU上
(17) sar -y 5 5 // TTY设备的活动状态
(18) 将输出到文件(-o)和读取记录信息(-f)
4、vmstat
vmstat命令是最常见的Linux/Unix监控工具,可以展现给定时间间隔的服务器的状态值,包括服务器的CPU使用率,内存使用,虚拟内存交换情况,IO读写情况。这个命令是我查看Linux/Unix最喜爱的命令,一个是Linux/Unix都支持,二是相比top,我可以看到整个机器的CPU,内存,IO的使用情况,而不是单单看到各个进程的CPU使用率和内存使用率(使用场景不一样)。
实例1:
--第一个参数是采样的时间间隔数,单位是秒,第二个参数是采样的次数
--如果想在一段时间内一直监控可执行# vmstat 2
# vmstat 2 6
说明:
r 表示运行队列(就是说多少个进程真的分配到CPU),当这个值超过了CPU数目,就会出现CPU瓶颈了。这个也和top的负载有关系,一般负载超过了3就比较高,超过了5就高
,超过了10就不正常了,服务器的状态很危险。top的负载类似每秒的运行队列。如果运行队列过大,表示你的CPU很繁忙,一般会造成CPU使用率很高。
b 表示阻塞的进程
swpd 虚拟内存已使用的大小,如果大于0,表示你的机器物理内存不足了,如果不是程序内存泄露的原因,那么你该升级内存了或者把耗内存的任务迁移到其他机器。
free 空闲的物理内存的大小
buff Linux/Unix系统是用来存储,目录里面有什么内容,权限等的缓存
cache cache直接用来记忆我们打开的文件,给文件做缓冲
si 每秒从磁盘读入虚拟内存的大小,如果这个值大于0,表示物理内存不够用或者内存泄露了,要查找耗内存进程解决掉。
so 每秒虚拟内存写入磁盘的大小,如果这个值大于0,同上
bi 块设备每秒接收的块数量,这里的块设备是指系统上所有的磁盘和其他块设备,默认块大小是1024byte
bo 块设备每秒发送的块数量,例如我们读取文件,bo就要大于0。bi和bo一般都要接近0,不然就是IO过于频繁,需要调整。
in 每秒CPU的中断次数,包括时间中断
cs 每秒上下文切换次数
us 用户CPU时间
sy 系统CPU时间,如果太高,表示系统调用时间长,例如是IO操作频繁。
id 空闲 CPU时间
wt 等待IO CPU时间。
这种基础命令一定要会,建议大家熟记,后面会分享更多devops和DBA方面的内容,感兴趣的朋友可以关注下~
监控CPU命令 sar
精度ADC的最大采样率为200ksp,在其他引用设置中,精度ADC的采样率最高可达1msp22.2.4自动功率降低
高精度ADC模块是原生14位SAR模数转换,最高支持16位通过软件过采样精确度。 该模块实现了14位SAR内核,样本选择控制,以及多达32个独立的转换和控制缓冲区。 转换和控制缓冲区允许最多32个独立的模数转换器(ADC)样本进行转换和存储任何CPU干预。精密ADC功能包括:
•1-Msps最大转换速率,最大分辨率为14位
•单调14位转换器,无失码
•采样和保持,可编程采样周期由软件或定时器控制
cpu 监控
CPU占用率查看软件可以使用系统中自带的桌面小工具,这些工具软件可以很方便自己掌握系统的状态。
或者还可以使用系统中的任务管理器工具,打开系统,进入系统任务管理器工具,找到cpu,然后点击详情就可以查看系统里cpu占有率的一切信息了。
系统自带的任务管理器提供了详细的硬件监控和软件进程监控信息,此外它还可以用来手动查毒以及中止一些流氓软件的进程。