存档

文章标签 ‘dell’

DELL服务器R440 UEFI0079:One or more Uncorrectable Memory errors occurred in the previous boot.

2024年1月1日 没有评论

DELL服务器R440 内存错误导致服务器异常重启

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
# 显示错误:前液晶LED显示先后提示CPU和Memory错误 
UEFI0058:Uncorrectable memory error has occurred because a dual inline memory module (DIMM) is not functioning. 
UEFI0078:One or more Machine Check errors occurred in the previous boot. Check the System Event Log (SEL) to identifiy the source of the Machine Check error and resolve the issues. 
UEFI0079:One or more Uncorrectable Memory errors occurred in the previous boot. 
UEFI0081:Memory configuration has changed from the last time the system was started. 
 
# 示例:该问题主要出现在 R630 和 R730 中,但R440也会出现类似的问题。
MEM0701 警告 DIMM_xx 可纠正内存错误率过高。
MEM0702 严重 DIMM_xx 可纠正内存错误率过高。
 
# LC 日志示例:
2017-03-07 23:08:02 SYS1003 系统 CPU 重置。
2017-03-07 23:08:02 SYS1001 系统关闭。
2017-03-07 23:08:02 MEM0702 DIMM_xx 可纠正内存错误率过高。

问题原因:

内存错误异常而CPU的报错大多是由于内存报错导致的;
可纠正内存错误是一种单位错误,如果在写入或读取操作过程中错误地将 1 更改为0 或将 0 更改为 1,就会出现这一错误。识别出错的特定单位后,可以通过补充错误单位的方式纠正错误。
戴尔认证的 DIMM 将自动执行此纠正在极少数情况下,当 SEL 日志中记录一个可纠正内存错误后,服务器可能会重新启动。

问题解决方式(不保证每条都OK):

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
- 0.尝试释放一下静电先移除电源线,按着开机按钮大概30秒先释放一下静电,重新插入电源线后(请先等待一分钟再接通服务器电源测试)
- 1.根据IDRAC查看到的内存具体信息再对内存做交换槽位(重新拔插一下内存)、减少等操作(`注意:请按照DELL内存安装规则进行安装-与CPU个数有关`)。
- 2.为解决重新启动问题应将 BIOS 更新到最新版本。如果出于操作原因无法更新,应将 BIOS 设置为最低版本:
  R430 	2.4.2
  T430 	2.4.2
  R530 	2.4.2
  T630 	2.4.2
  R630 	2.4.3
  R730 	2.4.3
  R830 	1.4.2
  C4130 2.4.2
  C6320 2.4.2
  R440  3.2.1
所有模块化刀片服务器 	2.4.2
- 3.安装低版本的操作系统

参考连接:

1.(DELL服务器事件和错误消息参考指南-UEFI)[https://www.dell.com/support/manuals/cn/zh/cnbsd1/dell-opnmang-sw-v8.1/eemi_13g_v1.2-v1/uefi-event-messages?guid=guid-823669e3-2d7b-41b5-85f1-af7a6bc11acc&lang=en-us]
2.(R730内存故障处理)[https://www.dell.com/support/manuals/cn/zh/cnbsd1/poweredge-r730/r730_ompublication/%E7%B3%BB%E7%BB%9F%E5%86%85%E5%AD%98%E6%95%85%E9%9A%9C%E5%A4%84%E7%90%86?guid=guid-1dd8ce42-b3bc-40db-9e9b-e2d6ae94011b&lang=zh-cn]
3.https://www.dell.com/support/article/zh-cn/sln305799/dell-poweredge-13g-%E5%9C%A8-%E5%8F%AF%E7%BA%A0%E6%AD%A3%E5%86%85%E5%AD%98%E9%94%99%E8%AF%AF-%E4%B9%8B%E5%90%8E%E5%8F%AF%E8%83%BD%E9%87%8D%E6%96%B0%E5%90%AF%E5%8A%A8?lang=zh

The PERC1 battery is low.DELL R620服务器idrac显示电源错误修复办法。

2022年8月3日 没有评论

DELL R620的机器有好几年了。bios电池也快没电了。idrac老显示黄标。于是更换了个新的电池。以为搞定了。不想还是反复提示:
系统事件日志报:The PERC1 battery is low.
电池 显示黄标

上网查了一下,dell还是有提供解决办法的。具体办法需要下载效验工具文件。不过这个工具好像是对硬盘阵列用的。也不知道为什么能也用于校对电池。
我下的是LINUX下的。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
wget https://downloads.dell.com/FOLDER03559396M/1/perccli-1.17.10-1.noarch.rpm
rpm -ivh perccli-1.17.10-1.noarch.rpm
 
[root@localhost perccli]# cd /opt/MegaRAID/perccli //进入程序目录。默认perccli64是不能运行的。不是内部命令。
 
[root@localhost perccli]# ./perccli64 /c0/bbu show all >/root/a.txt //转存一下信息很长。
 
//我选发一部分发出来比较重要的提示信息给大家标出来。
 
BBU_Capacity_Info :
=================
 
------------------------------------------------------
Property Value
------------------------------------------------------
Relative State of Charge 0%
Absolute State of charge 0%
Remaining Capacity 0 mAh            //主要看这里这是显示0其实不对。新电池应该是满的 
Full Charge Capacity 396 mAh         //电池主容量以下运行校对命令后再运行show all后这两个地方应该会显示一致。
Run time to empty Battery is not being charged
Average time to empty 0 min
Average Time to full Battery is not being charged
Cycle Count 15
Max Error 0%
Remaining Capacity Alarm 0 mAh
Remining Time Alarm 0 minutes(s)
------------------------------------------------------
//运行以下校对命令校对电池容量。
[root@localhost perccli]# ./perccli64 /c0/bbu start learn
Controller = 0
Status = Success
Description = None
 
BBU_Set_Prop :
============
 
------------------------
BBU-Prop Description
------------------------
Start Learn Success
------------------------
//这样就完成了校对工作。
 
[root@localhost perccli]# ./perccli64 /c0/bbu show all >/root/b.txt //转存一下新的信息。可以看到如下比较重要的
 
BBU_Capacity_Info :
=================
 
------------------------------------------------------
Property Value
------------------------------------------------------
Relative State of Charge 100%
Absolute State of charge 0%
Remaining Capacity 396 mAh                    //这里正确的应该有显示不是0了。 
Full Charge Capacity 396 mAh
Run time to empty Battery is not being charged
Average time to empty 32 min
Average Time to full Battery is not being charged
Cycle Count 15
Max Error 0%
Remaining Capacity Alarm 0 mAh
Remining Time Alarm 0 minutes(s)
------------------------------------------------------

关机。拔掉所有的电源。然后过15分钟接上开机。然后再进idrac看一下电池显示。应该全绿标了。

分类: 解决方案 标签: ,