centos 检测磁盘 内存 健康 状态

硬盘 Or Raid


磁盘检测工具-smartmontools

1、smartctl -i :显示设备的身份信息,检查硬盘是否打开了SMART支持。

看到有:

SMART support is: Enabled 

说明硬盘支持SMART。

如果为Disabled,使用:

smartctl --smart=on --offlineauto=on --saveauto=on

启用SMART。

2、smartctl -H :查看硬盘的健康状况。(df -h 查看硬盘 如:/dev/sda )

=== START OF READ SMART DATA SECTION ===

SMART overall-health self-assessment test result: PASSED 

PASSED表示硬盘健康状态良好,如果为Failure那就要立刻更换硬盘。

3、smartctl -A :显示设备SMART厂商属性和值。

4、smartctl -l error :显示硬盘历史错误信息。

5、smartctl --test=TEST :硬盘自测。

TEST可取值:offline, short, long, conveyance, select,M-N, pending,N, afterselect,[on|off], scttempint,N[,p]

此时可以用smartctl -X中断后台测试。

6、smartctl -l selftest :显示硬盘测试信息。

7、smartctl -a :显示硬盘SMART的全部信息

8、smartctl --all /dev/sda 显示硬盘SMART的全部信息

raid 检测工具-megacli

命令使用:
MegaCli -LDInfo -Lall -aALL 查raid级别
MegaCli -AdpAllInfo -aALL 查raid卡信息
MegaCli -PDList -aALL 查看硬盘信息
MegaCli -AdpBbuCmd -aAll 查看电池信息
MegaCli -FwTermLog -Dsply -aALL 查看raid卡日志

MegaCli常用参数介绍
MegaCli -adpCount 【显示适配器个数】
MegaCli -AdpGetTime –aALL 【显示适配器时间】
MegaCli -AdpAllInfo -aAll 【显示所有适配器信息】
MegaCli -LDInfo -LALL -aAll 【显示所有逻辑磁盘组信息】
MegaCli -PDList -aAll 【显示所有的物理信息】
MegaCli -AdpBbuCmd -GetBbuStatus -aALL |grep ‘Charger Status’ 【查看充电状态】
MegaCli -AdpBbuCmd -GetBbuStatus -aALL【显示BBU状态信息】
MegaCli -AdpBbuCmd -GetBbuCapacityInfo -aALL【显示BBU容量信息】
MegaCli -AdpBbuCmd -GetBbuDesignInfo -aALL 【显示BBU设计参数】
MegaCli -AdpBbuCmd -GetBbuProperties -aALL 【显示当前BBU属性】
MegaCli -cfgdsply -aALL 【显示Raid卡型号,Raid设置,Disk相关信息】

判断磁盘是否有问题,非0就有问题

/usr/sbin/megacli -PDList -aALL|grep -i ‘Error Count’

内存


grep “[0-9]” /sys/devices/system/edac/mc/mc*/csrow*/ch*_ce_count
ch*_ce_count应该为对应的内存插槽,内容非0则存在问题.

1> count不为0表示有错误
2> mc代表第几个cpu,
3> csrow内存通道,
4> ch第几个内存