Windows系统蓝屏异常的最佳实践和跟进方案

我们在日常生活中使用电脑时在编辑一段代码、看一段视频或是玩一款休闲游戏的时候,往往会遇到电脑突然异常,冷不丁进入了蓝屏的状态,其实这是电脑紧急用来防止数据丢失的举措,相当于在提醒我们数据可能会有丢失的风险,那么不论是发生了什么总有它的前因后果,究竟是什么导致电脑会做出这样的措施来保存数据呢?我们一步步究其原理来分析一下。

如果有配置内存转储文件(crash dump)的收集,系统会自动生成蓝屏dump到指定的目录(默认文件为C:\Windows\memory.dmp)。

可能原因


有多种原因导致操作系统蓝屏,例如:

其一:因为误操作或者病毒引起的系统文件、注册表损坏

其二:驱动程序与操作系统兼容性引起的异常内存访问

其三:操作系统自身bug

其四:三方杀毒软件驱动异常

操作系统在蓝屏的情况下,会抛出对应的bugcheck code以及可能的导致蓝屏的模块来大概说明问题发生的原因。如下图:

%RAK部落%
RAK部落:电脑蓝屏处理

然而,对于用户而言,更重要的是如何处理Windows 蓝屏,请参考如下最佳实践以及跟进方案。

最佳实践


根据与微软官方的建议以及日常排查经验,为了防止系统蓝屏的发生以及可能引起的数据丢失,我们建议客户:

1、请在服务器上安装杀毒防护工具,定期杀毒,定期更新杀毒软件版本,防止病毒或者杀毒软件驱动与操作系统兼容性引起的蓝屏。

2、请定期运行Windows Update,确保微软最新安全更新已经安装。

3、请不要将重要数据放在系统盘,而是使用数据盘。

4、定期对系统盘、数据盘进行备份,以便问题情况下恢复数据。

请在修改系统注册表前备份注册表文件,避免修改系统文件

跟进方案


如果 Windows 服务器在使用过程中突然断开、无法远程,查看日志发现异常重启的情况,怀疑可能出现过系统蓝屏,请采用如下方法验证:

方法1:打开”事件查看器”,打开”系统日志”, 在问题发生时间点,如果看到有来源”volmgr”抛出的 ID 46事件,说明之前发生过蓝屏,但是由于没有配置 paging file 页面文件以及内存转储文件的配置,导致 dump 收集失败。

%RAK部落%
RAK部落:电脑蓝屏处理

错误    2016/3/25 0:42:55    volmgr    46    无
    故障转储初始化未成功

方法2:如果之前有正常配置过蓝屏收集,在系统日志中可以发现事件 ID 41的Kernel-Power的关键错误日志,提示系统从意外的关闭中回复以及事件ID 1001,来源为Bugcheck的日志提示系统出现崩溃。

%RAK部落%
RAK部落:电脑蓝屏处理

由于蓝屏日志的分析非常耗时,可能耗费一周或更多的时间。考虑到业务快速恢复,我们强烈建议客户在遇到蓝屏的情况,重启机器后,参考如上的最佳实践。尤其是根据我们的经验,一般病毒、三方杀毒软件和系统bug是最可能的原因,您可以在问题发生后,采用如下3条来避免潜在的已知问题。
<1> 卸载系统所有三方杀毒软件, 禁用杀毒软件的防护功能一般不会消除杀毒软件内核驱动的影响
<2> 安全模式下,使用微软Msert离线杀毒工具或者三方收费版本杀毒软件杀毒
<3> 运行Windows Update,安装所有更新

RAK部落小编一直以来都相信一句话,任何问题都有它的源头,有因必有果,在使用和熟悉电脑功能的过程中呢,我们遇到任何的问题都应该冷静下来仔细分析,找到问题的突破口,才能最短时间最大化的止损。

此文章来自固定链接:http://www.rakbuluo.com/p123

原文链接:,转发请注明来源!

发表评论

要发表评论,您必须先登录