2023年8月1日发(作者:)
XXXXXX系统
容灾应急预案
XXXX公司
XXXX年X月
系统名称
涉及部门
系统容灾应急预案
人员名称 人员所在单位
人员联系方式
涉及人员及联系方式及职责
预案处理要求
演练要求
预案流程说明
预案事件描述
1)
系统崩溃:描述系统崩溃状态,如后台服务崩溃,项目组紧急处理后无法恢复系统运行;
2)
数据丢失:描述系统数据丢失状态,如数据库服务出现故障,用户数据丢失,公司现有技术手段无法恢复;
3)
服务停顿:描述系统服务停顿状态,如系统由于不明原因导致大规模用户无法使用,服务停顿。
描述预案处理的要求如:
1)
停止系统后台服务,防止不知情用户继续投递数据。抓取并保存系统出错信息及日志文件,简单判断异常部位,通知相关厂商人员,保留现场,分析查找原因。
2)
停止服务和后台数据库服务,将剩余用户数据进行备份,抓取并保存系统出错信息及日志文件,通知相关厂商人员,保留现场。分析查找原因。
3)
联系网络管理人员、通知厂商人员,从网络和系统两个方面分析查找服务停顿原因。
提出系统演练要求,如:
1. 对在线系统不造成影响
2. 在主要系统管理员人员变更和服务器、操作系统、主页发布软件发生变更时要进行演练。
3. 演练前应填写工作单,并对系统做全备份。
4. 演练结束形成演练总结报告。
说明预案流程,如:
1.
事件报警与确认:值班工程师对数据库服务器、应用服务器的运行状况以及网络情况进行监测,及时发现服务器的异常和网络故障,一旦发现异常情况需及时通知相关人员进行原因的排查和故障的处理。
2.
启用备份系统:若发生原因无法迅速定位、系统无法在适当的时间内恢复正常的情况,应立即启用备份系统(详细的处理步骤见附件一)。
3.
对系统进行检查
检查网络连接:需要相关网络管理人员配合检查。
检查应用服务器性能指标:应用服务器为八台DELL PC服务器,检查的内容包括:weblogic第2页 进程是否正常、cpu使用率、内存使用率。
检查后台数据库服务器性能指标:数据库服务器为两台IBM小型机,检查内容包括:数据库服务器双机状态、cpu使用率、内存使用率。(详细查看命令见附件三)
检查负载均衡器状态:负载均衡器有两台。
导出系统日志
4.
重新启动系统
启动数据库服务器->启动应用服务器。
5.
安全审计及事故分析
通过系统日志、网络设备日志、数据库访问日志等,对事件进行审计,对损失进行评估,追查事件的发生原因。
6.
消除隐患、调整策略:
根据审计结果,修正设置。
7.
安全报告、归档:
提供事故分析报告,分析事故原因,修正预案处理流程并归档。
预案流程:
事件报警及确认
停止服务,通知相关人员到场、保留
启动备用系统
备用系统测试
成功否
是
恢复网络连接
安全审计及事故分析
消除安全隐患,安全策略调整
损失评估、责任追究
安全报告、归档
详细处理步骤及操作命令以附件形式提供:
手工或自动恢复
提供详细的处理步骤及操作命令,如:
附件一:启动备用系统
步骤一、正式环境数据库恢复
1.确定要恢复的时间点。
第3页 2.依照《系统安装配置手册》恢复正式系统数据库。
步骤二、正式环境应用系统恢复
1.确定要恢复的时间点。
2.依照《系统安装配置手册》恢复正式系统数据库。
步骤三、备用环境数据库恢复
第4页
2023年8月1日发(作者:)
XXXXXX系统
容灾应急预案
XXXX公司
XXXX年X月
系统名称
涉及部门
系统容灾应急预案
人员名称 人员所在单位
人员联系方式
涉及人员及联系方式及职责
预案处理要求
演练要求
预案流程说明
预案事件描述
1)
系统崩溃:描述系统崩溃状态,如后台服务崩溃,项目组紧急处理后无法恢复系统运行;
2)
数据丢失:描述系统数据丢失状态,如数据库服务出现故障,用户数据丢失,公司现有技术手段无法恢复;
3)
服务停顿:描述系统服务停顿状态,如系统由于不明原因导致大规模用户无法使用,服务停顿。
描述预案处理的要求如:
1)
停止系统后台服务,防止不知情用户继续投递数据。抓取并保存系统出错信息及日志文件,简单判断异常部位,通知相关厂商人员,保留现场,分析查找原因。
2)
停止服务和后台数据库服务,将剩余用户数据进行备份,抓取并保存系统出错信息及日志文件,通知相关厂商人员,保留现场。分析查找原因。
3)
联系网络管理人员、通知厂商人员,从网络和系统两个方面分析查找服务停顿原因。
提出系统演练要求,如:
1. 对在线系统不造成影响
2. 在主要系统管理员人员变更和服务器、操作系统、主页发布软件发生变更时要进行演练。
3. 演练前应填写工作单,并对系统做全备份。
4. 演练结束形成演练总结报告。
说明预案流程,如:
1.
事件报警与确认:值班工程师对数据库服务器、应用服务器的运行状况以及网络情况进行监测,及时发现服务器的异常和网络故障,一旦发现异常情况需及时通知相关人员进行原因的排查和故障的处理。
2.
启用备份系统:若发生原因无法迅速定位、系统无法在适当的时间内恢复正常的情况,应立即启用备份系统(详细的处理步骤见附件一)。
3.
对系统进行检查
检查网络连接:需要相关网络管理人员配合检查。
检查应用服务器性能指标:应用服务器为八台DELL PC服务器,检查的内容包括:weblogic第2页 进程是否正常、cpu使用率、内存使用率。
检查后台数据库服务器性能指标:数据库服务器为两台IBM小型机,检查内容包括:数据库服务器双机状态、cpu使用率、内存使用率。(详细查看命令见附件三)
检查负载均衡器状态:负载均衡器有两台。
导出系统日志
4.
重新启动系统
启动数据库服务器->启动应用服务器。
5.
安全审计及事故分析
通过系统日志、网络设备日志、数据库访问日志等,对事件进行审计,对损失进行评估,追查事件的发生原因。
6.
消除隐患、调整策略:
根据审计结果,修正设置。
7.
安全报告、归档:
提供事故分析报告,分析事故原因,修正预案处理流程并归档。
预案流程:
事件报警及确认
停止服务,通知相关人员到场、保留
启动备用系统
备用系统测试
成功否
是
恢复网络连接
安全审计及事故分析
消除安全隐患,安全策略调整
损失评估、责任追究
安全报告、归档
详细处理步骤及操作命令以附件形式提供:
手工或自动恢复
提供详细的处理步骤及操作命令,如:
附件一:启动备用系统
步骤一、正式环境数据库恢复
1.确定要恢复的时间点。
第3页 2.依照《系统安装配置手册》恢复正式系统数据库。
步骤二、正式环境应用系统恢复
1.确定要恢复的时间点。
2.依照《系统安装配置手册》恢复正式系统数据库。
步骤三、备用环境数据库恢复
第4页
发布评论