机房应急预案15篇
在学习、工作乃至生活中,难免会发生一些不在自己预料之中的事件,为了控制事故的发展势态,时常需要预先制定应急预案。应急预案应该怎么编制呢?以下是小编为大家整理的机房应急预案,欢迎大家借鉴与参考,希望对大家有所帮助。
机房应急预案1
为了应对各种突发和紧急事件,特制订以下方案。
一、突发和紧急事件指自然因素或其它原因引起(或可能引起)基站财产安全或较多基站中断的所有事件。
二、启动基站维护(紧急)组织实施方案的范围:梅雨季节地势低洼基站的防汛;雷电高峰期基站的动力抢修或抢险;大雪(暴雪)基站房屋及铁塔的维护及应急抢修工作;台风、地震前中后基站及铁塔的维护;传输或MSC(BSC)故障造成基站大面积故障,故障恢复后基站网络的测试。
三、启动基站维护(紧急)组织实施方案的条件:天气和各种地质灾害预报或由此可造成(或正在造成)基站的财产安全和网络稳定运行,网管统计发现大面积网络故障时必须立即启动基站维护(紧急)组织实施方案。
四、对于由自然因素可能引起的基站及分布系统站点的财产安全和网络稳定运行,得知地质或天气预报后,立即组织各代维项目部区和相关工程施工单位对所在地的站点进行预防性巡检,对于各种隐患要求各项目部现场及时上报给我公司灾害预防和处理应急领导小组和各地移动公司应急领导小组。
五、我公司应急领导小组成员和各代维项目部所有维护人员在重大灾害预防和抢险过程中的的移动电话必须24小时开机,必须无条件服从公司应急领导小组和代维项目经理统一安排,若某项目出现人员不足的情况下,公司临时从总部或异地抽调人员和车辆参加抢险;凡当地移动公司所辖站点不是我公司维的护站点出现重大险情后,我公司抗灾任务又不重时,各项目部要主动向移动请缨。
六、公司在每一次抗灾救险活动结束后
公司应急领导小组应对本次活动的成功经验和教训进行总结,对表现优秀的'团队或个人进行表彰,表现较差的团队或个人进行处罚
七、重大灾害预防和抢险的人员组织机构:
领导小组由总经理,副总经理,各部门经理及地区经理组成,总经理为总指挥,各代维项目部也应成立相应成立相应的抗灾救险领导小组。
八、抗灾救险人员安排:
公司总部和各代维项目部应包括以下小组
1、通信保障组:在发生险情时提供移动通信应急保障,负责实施应急通信的详细方案、应急中所需的备品、备件、测试仪表、工具、技术资料的保管及预防性维护保障工作。
2、物资调拨组:负责所有应急物资日常保管、定期检查、更新以及应急时的调拨和运送。
3、抢险救灾组:负责应急时的抢修和救灾方案的实施
九、值班制度
1、各代维项目部在启动抗灾救险预案后应实行24小时值班制度,设立固定值班地点和24小时值班热线。
2、全体应急人员保持24小时开机。
3、在接到上级关于进入应急状态的通知后,即由领导小组成员组成指挥中心。
十、体保障措施细则:
1、根据每年的雨情在进入梅雨季节后将基站及分布系统代维的工作重点转为重点机房、基站等重点防汛场所的巡视,故障处理。在遇到突发或紧急时间期间,加强对重点基站、低洼基站及传输机房的巡视,确保环境监控系统工作正常。重点基站及传输机房一周一次,低洼基站二周一次。台风期间每天对拉线塔进行巡检,并填写基站巡检表。
2、重点保障地点预置好防汛抢险物资。并给各维护小组配备部分随车抢险物资。如编织袋、铁锹、雨衣、雨靴、防火泥、防火包、手电等。对抽水泵,移动油机进行保养,确保其工作正常。对应急灯、应急手机定期充电。
3、出现连续暴雨或台风情况时,维护人员每天对重点站点及所有拉线塔进行巡视,填写基站巡检表。发现紧急情况立即通知我公司地区经理和移动代维管理人员,由代维管理人员上报移动部门领导,并赶赴现场确认,视情况确定是否安排专人(人员由综合部安排)进行24小时值守。
4、网管值班人员对环境监控设备出现的告警密切观察并记录,若确有异常情况发生,立即通知我代维人员赶赴现场检查。并追踪代维人员的处理情况和反馈结果,若发现代维人员未及时处理,我网管值班人员应立即向我公司和移动公司汇报。
5、进入汛期后由各项目部负责每天了解所在区域的水位情况,并通知网管值班人员,由网管值班人员通知我代维人员及移动代维管理人员,根据水位情况合理调度巡视队伍与车辆。
6、收到台风警报后,各项部项目经理立即组织代维人员对全区拉线塔进行巡检,发现异常发现紧急情况立即通知移动代维管理人员和我公司应急领导小组,视情况确定应急措施。
7、收到大雪或暴雪预报,组织维护人员对所辖基站中拉线塔基站、彩钢瓦基站进行重点巡检,当得到网管或其他人员通知所辖基站中有拉线塔基站、彩钢瓦基站出现故障或非正常情况,立即派抢修人员奔赴现场,并逐级上报。
机房应急预案2
一制定目的
为应对医院突发性大面积停电事故,迅速有序地组织和恢复供电,确保病人生命安全和减少财产损失,保证医院用电畅通,促进事故应急工作的制度化和规范化,依据国家相关法律法规,结合我院实际情况,制定本预案。
二适用范围
本预案所称“突发性大面积通电事故”(下称“大面积停电事故”)是指因严重自然灾害重要设施损坏或遭受破坏等原因造成突发性的全院大面积电力系统安全防线失效,电网发生大面积瓦解或崩溃的事故。
三应急原则
大面积停电事故处理工作贯彻“预防为主,常备不懈”的方针,遵循“统一领导,完善机制,明确责任,加强合作,快速发应,措施果断”的原则。
四组织机构
医院成立大面积停电事故应急领导小组,下设应急抢修队。
1、医院大面积停电事故应急领导小组组长:
总经理副组长:
院长成员:
人事行政部经理后勤主管电维修工职责:
(1)做好日常安全供电工作,落实安全生产责任制,防范大面积停电事故发生。
(2)发生大面积停电事故时,及时做好停电事故应急工作,尽快恢复供电。
(3)根据大面积停电事故严重程度,决定启动和终止应急预案。
(4)及时向上级报告事故情况并向社会公布。
(5)必要时请求外力支援。
(6)领导小组组长是履行本预案规定的第一责任人。成员单位应在领导小组的统一指挥下,各司其职,各负其责,通力合作,做好大面积停电事故时的社会综合应急工作。
2、应急抢修队队长:
后勤主管成员:
电维修工职责:
发生事故时,组织人员实施救援行动;向指挥小组汇报事故情况,必要时向供电部门发出求援请求,事后总结应电路还是低压电路。如果高压电路出现故障,医院电工立即导入备用电源,应及时与供电部门抢修班联系,尽快恢复,保证用电;如果医院抵押电路出现故障时,应快速查明原因,按照操作规定恢复电路。
(二)部门科室应急程序
1、各科室接到停电通知后,应该在允许情况下吧所有的`及其电源切断,待电路恢复正常后再投入使用。
2、接到停电通知后,立即做好停电准备。如有抢救患者使用备用电源。
3、突然停电后,立即寻找抢救患者及其运转的动力方法,维持抢救工作,并开启应急灯照明等。并应及时通知电工或总值班。
4、危重患者手术中使用呼吸机的患者平时应在机旁备有简易呼吸器,遇突然停电,医护人员立即将呼吸机脱开,使用简易呼吸器维持呼吸。使用电动吸氮的患者,用50ml注射器接吸氮管吸氮。
5、如双线均突然出现供电故障,院内发电机供电前,医护人员则应首先保证病人抢救;护士应沉着镇静,上呼吸机者采用手抱球法,上监护仪者采用人工测血压脉搏,电动吸氮者则采用50毫升注射器接吸氮管抽吸等,严密观察并请变化,其余工作人员则立即电话通知电工,人事行政部,并采用应急灯供照明。
6、加强巡视病房,安抚患者,同时注意防火防盗。
7、电梯遇到突然停电后,后勤人员要做好乘客思想工作,向外面打电话,用人工方法把所有乘客放出去。
六保障措施
1、电工日常应做好发电机的维护保养工作,保证发电机随时投入使用。
2、电工平时要掌握供电知识和操作规范,注意操作安全。
3、临床科室常规备有应急灯电筒等照明用物,定期检查,保持完好状态。
4、后勤部门要组织进行应急停电演练,每年1-2次,通过演练,使大家熟悉掌握突发停电的应急处置程序,确保病人安全。电路还是低压电路。如果高压电路出现故障,医院电工立即导入备用电源,应及时与供电部门抢修班联系,尽快恢复,保证用电;如果医院抵押电路出现故障时,应快速查明原因,按照操作规定恢复电路。
机房应急预案3
网络信息中心机房环境主要监控目标对象为:电力供应、火情、空调异常。监控对象表征为:UPS可监控数据(包括输入、输出、负载等)、烟雾、环境温湿度值。
环境监控报警根据影响范围不同定为不同级别,予以不同处置,应急处置流程如下:
一、 紧急告警
(一) 机房烟雾告警
1. 如消防系统已启动,立即通知相关区域同志撤离机房。
2. 如消防系统尚未启动,立刻调出该场地视频监控,确认是否有火情。一旦确认火情,立即疏散,并确认消防系统能正确启动。
3. 火警必须在第一时间电话通知中心主任、相关机房安全责任人、办公室主任和环境与设备工程师。
4. 按消防相关程序处置。
(二) UPS输入掉电告警
1. 立刻通知环境与设备工程师和相关机房负责人,环境与设备工程师即刻响应并处理,通知机房负责人电池放电情况。
2. 相关机房负责人待命响应,根据需要按预定程序逐级安全关闭各类系统或设备,并通知相关部门及人员。
3. 如影响中心关键业务,由机房负责人作出判断,并立即通知业务所属责任部门。
(三) 机房地湿告警
立刻通知相关机房负责人和环境与设备工程师,现场查看空调底下是否有水管爆裂漏水。
备注:漏水事故影响不可轻忽,某些情况下会引起灾难性事故,请务必关注。
(四) UPS输出故障
1. 立刻通知环境与设备工程师和相关机房负责人,环境与设备工程师即刻响应并处理,通知机房负责人影响范围。
2. 相关机房负责人立即响应,如影响中心关键业务,由机房负责人作出判断,并立即通知业务所属责任部门。
二、 重要告警
(一) 监控数据通信中断告警
发现监控数据通信中断告警,需要综合查看,首先排查是否网络原因,其次排查是否服务器原因。以下状况考虑环境因素:
如果同时有大面积的网络故障和服务器故障,很可能是UPS输出故障,立即通知环境与设备工程师、运行部负责人和系统部负责人。
如果是单纯的'数据数据通信中断,一般是监控设备死机,在工作时间通知环境与设备工程师处理。
1. 机房高温告警
立刻通知环境与设备工程师,如判断空调已失效,则需到现场处置。
备注:由于机柜上的温湿度仪因热通道和铁架的热传导作用使得感应温度偏高很多,只能做参考。因此,如夜间发现高温告警,可注意观察,如有持续异常升温则通知环境与设备工程师处理。
2. 冷冻水高温告警
发现冷冻水高温告警或空调进水高温告警,即刻通知环境与设备工程师处理。
3. 市电掉电告警
工作时间,立刻通知环境与设备工程师处理。非工作时间,如发生UPS输入掉电告警,按前述流程处置。
三、 一般告警
其他机房环境监控告警,考虑都是设备故障或者部分功能异常,影响面有限,在工作时间通知环境与设备工程师处理。
机房应急预案4
第一条 机房内禁止明火禁止吸烟,机房内的所有设备需要定期维护并做巡检记录、根据机房实际情况进行清扫工作。
第二条 机房网络设备维护由网络管理员进行,如发现机器故障应及时排除故障,在遇到硬件三包范围内的故障时,应及时联系供应公司上门或将机器送供应公司维修;
第三条 酒店员工必须严格遵守有关机房、设备及系统运行管理规定,不得在机房内从事与系统管理、运行维护、系统安装和调试等无关的工作;
第四条 做好防火、防雨、防湿、防盗工作,注意用电安全;机房内的环境要每周检查温度、湿度、电力系统、是否满足机房相关的标准要求。
第五条 机房内的交换机和服务器系酒店运营的关键设备,任何人不得自行配置或更改其系统参数。
第六条 要做好机房的安全工作,对服务器的各种帐户、密码严格保密。
第七条 应及时做好数据的备份工作,保证在系统发生故障时,数据能够快速、安全的恢复。所有备份数据不得更改,并要求做到本地和异地分别备份保存。
第八条 为了确保本酒店网络正常运行,每日对机房内的设备进行巡视,主要着重于服务器及网络设备运行正常与否。
1、对机房里的温度进行调节,如室内温度过高,调节空调对机房进行有效的通风。
2、查看交换机与防火墙及接入设备的.工作状态,如发生异常,对其进行及时有效的维护。
3、监测网络运行状况。
第九条 除本酒店网络管理员外,公司其他人员因工作需要进入机房的,需网络管理员陪同下进入机房。
第十条 严禁带外单位人员或无关人员进入机房,确因工作需要,如:系统故障诊断和处理,设备维修维护、系统或设备安装等进入机房,必须由网络管理员陪同进入,配合项目的实施。
第十一条 进入机房的设备应在进入机房前拆除外包装,以保证机房环境的清洁和安
第十二条 严禁携带易燃、易爆、易腐蚀等危险性物品进入机房。
第十三条 机房内提供的UPS电源只允许为主机、服务器、网络及存储等核心设备供电,严禁安插其他设备,增加UPS电源供电负荷。
第十四条 严禁擅自切断供电系统,确因工作需要断电时,首先应做好相应准备工作,经部门领导批准,然后给所有部门发放断电或断网通知,最后方可实施。
第十五条 机房内安装用电设备或有用电需求的项目时,必须经过专业人员或设备提供商的安装工程师进行现场勘查,经确认在满足或符合要求后工程才能实施。
机房应急预案5
计算机机房作为所有业务、应用系统的核心,一旦计算机机房发生突发事件,将对单位的数据等造成严重损失。为此,特制订机房突发事件应急预案。
一、机房突发事件定义
机房突发事件是指由特殊原因引发威胁机房安全并且不能通过日常维护手段解决的事件。比如,火灾、漏电、断电等非人为或者人为的事件,重大突发事件发生后,应立即组织现场救护或临时处置,控制事态发展,最大限度地减少损失和影响。
二、机构和职责
机房突发事件应急小组单位领导:
机房突发事件应急小组部门领导:
机房突发事件应急小组成员:
各责任人职责:
应急小组单位领导:负责单位层面及范围内的决策与领导。
应急小组部门领导:负责部门层面及范围内的决策与领导并组织实施突发事件预案。
应急小组成员:按岗位职责分工,听从指挥,服从安排全力以赴解决突发事件。
三、突发事件报警
应区分原因在第一时间报警。
自然灾害(火灾),拨打火警电话:119人为事件(非法盗取、攻击等)拨打匪警电话:110人员伤亡,拨打急救电话:120其他时间(断电等),拨打值班电话:
四、突发事件处理
突发事件发生后,应立即启动应急预案。
1、失火、漏水:
视事件的紧急程度,应急小组成员要在领导的指挥下,有组织、有顺序的'备份数据、关闭服务器的电源;组织人力转移设备。如果自动设备未能正常启动,应在组长安排下首先切断机房的水、电路,组织人力采用灭火器等灭火设备人工灭火,同时要在第一时间报警。
2、断电:
在城电断电的情况下,机房的备用电力将发挥作用,电力供应最长可持续4小时。由于机房空调没有备用电力,如确认是供电局断电,应立即联系发电机发电;如果不是供电局断电,而是由于办公楼电力线路故障引起的断电,应立即通知电工查找原因,尽快排出故障。如果无法尽快恢复供电,在电力延续期间,应尽快结束未执行完毕的任务,如无法完成需及时备份数据,同时应关闭所有非必须服务器,尽量不让机房温度过高,保证网络设备的正常运行,以便保障集中在单位的应用系统能正常使用。
五、恢复生产
突发事件结束后,有关人员应首先对现场进行清理,汇总损失情况并上报各级领导。紧急召开专项会议分析损失情况,制定数据恢复计划。设备损失的要及时更换设备,保证恢复计划的顺利进行。
恢复生产后,系统管理员应对各系统进行自查,上报书面报告,并由部门领导汇总后上报单位领导。
机房管理员在恢复生产后要及时检查各项维持系统,如UPS、灭火器、漏水、漏电探测器等是否正常运行,应及时更换受损的元器件,补充灭火器的填充物。
机房应急预案6
中心机房突发事件应急预案
第一条
机房突发事件包括网络设备或服务器故障、自然灾害(水、火、电等)造成的物理破坏、人为失误造成的安全事件等等。针对突发事件的预防措施如下:
1.建立安全、可靠、稳定运行的机房环境,防火、防盗、防雷电、防水、防静电、防尘;建立备份电源系统;加强所有人员防火、防盗等基本技能培训。
2.服务器采用可靠、稳定的硬件设备,落实数据备份机制,安装有效的防病毒软件,及时更新升级扫描引擎;加强对局域网内所有用户和信息系统管理员的安全技术培训。
第二条
机房漏水应急预案如下:
1.发生机房漏水时,第一目击者应立即通知机房管理人员。
2.若空调系统出现渗漏水,机房管理人员应立即安排停用故障空调,清除机房积水,并及时联系设备供应方处理,同时启动备用空调,必要情况下可临时用电扇对服务器进行降温。3.若为墙体或窗户渗漏水,机房管理人员应立即采取有效措施确保机房安全,同时安排通知办公室,及时清除积水,维修墙体或窗户,消除渗漏水隐患。
第三条
机房火灾应急预案如下:
1.完善机房环境,确保机房具备二氧化碳灭火器;禁止携带易燃易爆物品进入机房。2.机房管理人员应熟悉机房内部消防安全操作和规则,了解消防设备操作原理,掌握消防应急处理步骤、措施和要领,懂得灭火的方法,会扑救初起火灾,并定期组织灭火演习。3.一旦发生火灾,迅速切断机房电源,避免灾情的.扩散,并迅速拨打物业管理和119火警电话。
4.等待消防车到来期间,应组织物业保安或工作人员在保证安全的前提下灭火,应急领导小组应在第一时间内集中所有二氧化碳灭火器,抓住时机,尽可能的把火扑灭。
5.配合消防部门调查事故原因,对造成的损失和起火原因做好记录,以便进行灾后总结。
第四条
雷击事故应急预案如下:
1.遇雷暴天气,机房管理人员在下班后应及时关闭所有服务器,切断电源,暂停内部计算机网络工作。
2.雷暴天气结束后,机房管理人员应及时开通服务器,恢复内部计算机网络工作,对设备和数据进行检查。出现故障的,事发部门应将故障情况及时报告机房管理人员。
3.因雷击造成损失的,机房管理人员应会同相关部门进行核实、报损,并在调查工作结束后一日内书面报告领导。
第五条
设备防盗被盗或人为损害应急预案如下:
1.机房管理人员每日查看、清点设备并锁好机房大门。
2.机房管理人员每日检查录像监控服务器状态,确保监控画面正常,并检查每日录像正常性、完整性。
3.发生设备被盗或人为损害设备情况时,使用者或管理者应立即报告相关负责人,同时保护好现场。
4.机房维护人员接报后,通知保安及公安部门,一同核实审定现场情况,清点被盗物资或盘查人为损害情况,做好必要的影像记录和文字记录。
5.事发单位和当事人应积极配合公安部门进行调查,并将有关情况向机房管理人员汇报。
第六条
机房停电应急预案如下:
1.接到停电通知后,机房管理人员应及时通过办公系统、电话等发布相关信息,部署应对具体措施,要求用户在停电前停止业务、保存数据。
2.机房管理人员每日检查UPS电源的状态,确保在突发停电时,UPS电源能自动供应服务器正常工作半个小时,保证员工工作的数据及时保存。
第七条
通信网络故障应急预案如下:
1.发生通信线路中断、流量异常等故障后,员工应及时通知机房管理人员。
2.机房管理人员在接到报告后,迅速组织相关技术人员检测故障区域,并作相关故障处理,必要时通知通信网络运营商查清原因;逐步恢复故障区与服务器的网络联接,恢复通信网络,保证正常运转。
3.应急处理结束后,机房管理人员应在一日之内提交故障分析报告,以便备案。
第八条
服务器故障应急预案如下:
1.机房管理人员每日检查服务器状态,检查邮箱服务器状态,确保系统运行的完善。
2.机房管理人员定期备份服务器数据,并将备份资料刻录成光盘或拷贝到移动硬盘。
第九条
1.发生机房突发事件后,机房管理人员应采取有效措施开展先期处置,恢复信息网络正常状态。应急处置工作结束后,机房管理人员对事件发生原因、性质、影响、后果、责任及应急处置能力、恢复重建等问题进行全面调查评估,根据应急处置中暴露出的管理、协调和技术问题,改进和完善预案,实施针对性演练,总结经验教训,整改存在隐患,组织恢复正常工作秩序。
机房应急预案7
为建立有效防范和处理火灾事故的工作机制,防范消防安全事故的发生,力保消防安全事故发生时能够快速、高效、合理有序地处置,特制定本预案。一.机房火灾隐患分析 由于机房内电气设备多,线路复杂,大部分的火灾都是电气火灾,引发电气火灾的主要因素有:
1.电气线路短路、过载、接地电阻过大等引发火灾。 2.由于机房内的电脑、空调、UPS等设备长时间不间断运行或设备故障引发 火灾。 3.静电产生火灾。 4.雷电等强电入侵引发火灾。 二.处置程序 1.发现火情后,迅速切断电源,利用就近灭火器进行灭火,并按照特级事故 通报机制进行通报,向领导汇报火灾具体情况。
2.迅速组织相关人员携带消防器具赶赴现场灭火,并听从现场指挥人员指挥。
3.如火情较为严重,应立即与大厦消防中控取得联系,并与之协商处理办法 措施,必要时需要专业消防灭火的.,迅速拨打119。 4.迅速组织相关人员对重要数据设备进行转移,尽可能保证关键设备安全, 引导人员进行疏散。 三.扑救方法 1.电源或线路起火应首先切断电源,绝不能用水扑救。 2.扑救机房设备时,最好使用气体(如CO2)灭火器,干粉,泡沫灭火器会对设 备造成 腐蚀,使损失增大。 四.注意事项
1.一旦机房发生火灾,应遵循以下原则:首先保证人员安全;其次保证关键设 备安全;再保证一般设备安全。 2.火灾发生时,第一发现人查明起火原因,如因电源引起,应首先切断电源。
3.火灾发生后应遵循边救火,边报警的原则。 五.预防措施
1.设备整改:机房现有的电气设备和消防设备均有存在不合理之处,需要整改, 消除隐患。现有的配电开关为墙上的半埋式家用配电开关,应更换为专业的 独立空气配电箱,修改配电柜各类闸刀和开关的布局,使其具备独立切换 的功能。 现有的灭火器为干粉灭火器,且维护也已过期,干粉灭火器虽然 可以有效灭火,但是会对设备造成腐蚀,损坏设备,应更换为气体灭火器。
2.每天定时对机房重要电气设备和电子设备的温度进行了监控,能够及时地发 现并消除隐患。 3.应组织相关人员进行消防安全教育,学习消防知识,学会正确使用各种灭火器,有计划的进行相关的消防演习。
机房应急预案8
机房是我单位的重要场所,重要仪器、设备相对集中,一旦发生事故,会造成严重后果 。为此特制定本应急预案。
一、触电
(1) 一旦发生触电事故,应迅速安全切断电源,切忌直接接触触电者。
(2) 即刻拨打紧急电话120并通知相关领导,同时开展现场应急救护 。
二、火灾
1、报警程序:
即刻通知领导及相关部门,根据火情大小如需报警立即就近用电话或手机报告消防中心(电话119).。
2、组织实施:
机房管理员一旦发现火情后,应即刻切断电源,并使用灭火器扑救起火设备。
三、空调漏水
若空调系统出现渗漏水,应立即安排停用故障空调,清除机房积水,并及时联系设备供应方处理,同时临时用电扇进行降温。
四、设备发生被盗或人为损害事件
( 1)发生设备被盗或人为损害设备情况时,使用者或管理者应立即报告中心负责人,同时保护好现场。
( 2)中心负责人接报后,通知保卫处,一同核实审定现场情况,清点被盗物资或盘查人为损害情况,做好必要的'影像记录和文字记录。
( 3)当事人应当积极配合公安部门进行调查, 并将有关情况向领导汇报。
五、机房停电
(1)接到长时间停电通知后,应及时发布相关信息,部署应对具体措施。
(2)如遇临时停电,且停电时间在3小时之内,管理员要检查UPS是否正常工作,以确保机房设备的正常运行。。
六、网络故障
(1)发生通信线路中断、路由故障、流量异常等故障后,网络管理员应及时查清通信网络故障位置,隔离故障区域,组织相关技术人员检测故障区域,逐步恢复故障区与服务器的网络联接,恢复通信网络,保证正常运转。
(2) 事态或后果严重的,应及时报告领导并请求协助解决。
七、不良信息和病毒事件
(1)发现不良信息或网络病毒时,管理员应立即断开网线,终止不良信息或网络病毒传播,并报告。
(2)中心负责技术人员应采取隔离网络等措施,及时杀毒或清除不良信息,并追查不良信息来源。
(3)事态或后果严重的,应及时报告相关领导以及相关部门。
八、服务器软件系统故障
(1)发生服务器软件系统故障后,在确认安全的情况下,重新启动故障服务器系统;重启系统成功,则检查数据丢失情况,利用备份数据恢复;
(2)若重启失败,应立即安排备份服务器启用,并请求技术人员支援,作好技术处理。
九、注意事项:
第一、机房管理员要加强日常监控,及时处理、消除及上报安全隐患。
第二、备齐安全相关装备。
第三、及时做好备份。
机房应急预案9
1.主机和运维管理制度简介
超级计算机是功能最强、运算速度最快、存储容量最大的一类计算机。目前只有少数国家掌握研发技术,系统造价非常昂贵,多用于国家高科技领域和尖端技术研究,是国家科技发展水平和综合国力的重要标志。上海超级计算中心作为上海信息港主体工程之一,国家和上海市政府投资先后引进神威-I超级计算机、神威-64P集群计算机、曙光4000A超级计算机系统并投入商业化运行。
上海超级计算中心自20xx年正式开通至今,
这些高性能计算机系统已安全、稳定运行七年多时间,上机用户取得了丰硕的科研成果和社会效益。在这七年中,为保障这些高性能计算机系统安全、稳定、不间断地运行,技术支持部在中心引进第一台高性能计算机--神威-I超级计算机系统的同时,建立了机房应急预案、运行记录、设备运行参数等基础运维制度,在二期引进曙光4000A超级计算机系统过程中,不断完善原有运维制度,并针对该主机系统特点编写了大量操作方法和应急预案。
中心自20xx年获得ISO27001(BS7799)信息安全认证以来,技术支持部根据其要求规范了文档体系建设,形成了机房管理制度、应急预案、操作方法、运行情况记录的四大类运维文档。
正是这些运维管理制度的不断完善和有效执行,才确保了资产价值高、服务对象广、社会影响大的中心主机系统安全、稳定运行,保障重点项目、用户服务的连续性。
2.应急预案重要性
上海超级计算中心机房运维管理文档划分为机房管理制度、应急预案、操作方法、运行记录共四大类。
应急预案在应急系统中起着关键作用,它明确了在突发紧急情况发生之前、发生过程中以及刚刚结束之后,谁负责做什么、何时做,以及相应的策略和资源准备等。它是针对可能发生的重大事故,按照其影响和后果严重程度,在应急准备、响应、操作各个方面预先做出的详细安排,是开展及时、有序和有效事故应急工作的行动指南。因此,应急预案在这四类运维管理文档中处于最为重要的地位。
3.应急预案分类
应急预案按重要性和事件种类,可以划分为消
防预案、断电预案、空调预案、其他预案共4种,预案各文档之间彼此独立又互为关联,具有非常强的可操作性。制定预案的指导原则是尽一切可能,最大限度地确保向用户提供的服务不中断。在紧急事件发生的情况下,保证核心设备连续运行,避免存储数据丢失。在事件处置完成后,能快速恢复高性能计算服务。
3.1消防预案
消防预案是主机房最重要的应急预案。该类预案根据《上海超级计算中心灭火和应急疏散预案》的原则并结合主机房主机设备和消防设备的运行特性而制定。主要由《主机房消防应急预案》和《主机房气体喷淋消防系统启动撤离及处置应急预案》 2个文档组成。
消防应急预案:该预案着重规范了火警事件发生后,所有主机维护人员如何根据所属区域和现场情况,判断和选择正确的处理方法,同时配合中心物业人员处置,降低事件带来的影响。
对于设备发生烟雾,主机维护人员协同物业人员寻找烟雾点予以切断相关区域电源;当设备发生可以控制火情,协同物业人员灭火;当主机房发生火灾而无法控制,应采取施救方法等措施。
气体喷淋预案:该预案描述主机房气体喷淋系统启
动的响应和确认并具体规定了撤离机房路线、善后处置。
这两个预案中,消防应急预案作为消防预案
的主体,涉及到如何处理与消防有关情况的各个方面。气体喷淋预案是主机房发生重大火灾时应对的最终灭火手段和人员撤离引导方法。
3.2断电预案
断电预案的重要性仅次于消防预案。该类预
案根据中心供配电系统实际情况和各种断电影响范围下对主机运行的最小保障要求而制定的。主要由
《主机房断电应急预案》、《曙光4000A超级计算机系统紧急关机操作方法》、《曙光4000A超级计算机系统双路断电关机操作方法》等多个文档组成。
主机房断电应急预案:该预案用于断电情况
下,主机维护人员如何与中心物业部门联系控制主机房供电情况,并且负责对主机系统运行受断电影响程度做出正确判断。指导维护人员按影响程度,分别选用预案中对应的操作方法。本预案在所有断电预案中起指导思想作用。紧急关机操作方法:该预案制定了主机系统在紧急情况下,最快速度关机的操作步骤。主要用于发生烟雾、明火或消防、断电预案需在数分钟内关机断电的事件。
双路断电关机操作方法:该紧急操作预案主要用于在外界双路供电全部中断情况下的操作。
该预案的关机原则是:根据实际电力供应考虑操作步骤,宁慢勿快,在时间允许的情况下,最大程度保证存储节点、SAN和SCSI存储设备、工程用户的计算节点的运行,尽可能减少关闭范围,以确保能在恢复供电的情况下,主机尽快恢复正常运行状态,减少影响范围。
3.3空调预案
超级计算机系统在运行中消耗大量电能,在
提供高性能的计算能力同时产生大量的热量,必须采用专用空调系统,以保持主机系统适当的温、湿度、空气洁净度等运行环境需求。因此,专用空调系统与主机系统密切相关,空调预案是主机房必备的应急预案。
制定该预案的原因在于,断电情况下,空调与主机系统存在互相牵制的现状。主机和空调系统均为外界双路供电,主机系统配有UPS不间断电源系统,而空调系统无UPS支持。在双路停电情况下,主机系统可获得UPS电池组支持运行若干分钟,空调系统无UPS支持只能停机。由于在无空调冷却情况下,主机系统会在短时间内积聚大量热量导致超过运行警戒温度,主机系统在有可供电余量的情况下,仍将被迫关机。因此,确保空调中断情况下的主机运行环境是该预案的制定原则。
预案根据各台主机配备的空调系统特点制定,由《曙光机房空调系统故障应急预案》和《神威机房空调系统应急预案》2个文档组成,这里仅介绍曙光机房空调系统应急预案。
该预案的第一步:考虑增强主机系统散热效
果,采用打开主机机柜前后门,和机房周边木门,在通风道上布置有UPS支持的应急风扇,形成空气对流,带走热空气,从而增强主机系统散热效果,降低升温速度。
该预案的第二步:在采取上述措施并持续升温到一定温度之上的情况下,考虑紧急关闭部分或全部计算节点,减少热量生成,确保主机系统的核心存储和网络系统不受影响,确保空调系统修复后,主机系统能快速恢复运行。
3.4其他预案
除了固定的三类预案之外,技术支持部还根据主机系统实际运行中出现的各种意外情况,随时制定具有针对性的预案。
如《大楼顶棚坍塌应急操作方法》的制定,就
是由于20xx年1月连续发生雨雪等灾害性天气,中心大楼顶棚大量积雪且难融化,物业预计存在情况继续恶化,有发生顶棚坍塌事故的可能,一旦发生将影响一楼主机运行。
针对该突发的隐患,中心技术支持部制定应急操作方法,对维护巡查频度范围、漏水可能发生位置、如何处理受漏水影响的主机设备等操作步骤进行严格界定。即使在最后,中心大楼顶棚经受住灾害性天气的考验,该预案并未发挥作用,这正体现了应急预案的备而不用的特点。而且通过各种意外
情况的迅速分析、应对和实践操练,不断锻炼主机维护队伍,使之走向成熟。
4.在实际案例中,应急预案的作用
在主机系统年复一年的运行中,我们希望这些设备正常稳定运行,应急预案永远不会被使用,然而在实际运行中,总免不了因突发事件执行应急预案。
而每次突发事件是检验应急预案制定是否科学、有效的最好证明。
4.1双路断电,UPS正常运行案例
20xx年8月某天,因打雷导致供电一路跳闸自动换至另一路供电,曙光机房2台空调掉电。
主机维护人员立即按应急预案操作,电话通知物业人员恢复空调运行,恢复过程中所有空调相继出现高温报警,机柜液晶屏平均温度35度,开启全部曙光机柜前后门,打开神威-曙光玻璃门并调集应急电扇,于12:45恢复正常。
12:50再次出现双路供电中断,曙光空调因无
UPS支撑全部断电,启动断电应急预案,开启
5、6号木门,开启神威机房全部空调,布置电扇,将冷气导入曙光机房,热量从6号木门的外部通道排出,选择性杀除部分作业,至13:05供电恢复,曙光空调开始工作,13:20环境恢复正常。全机在此过程中,正常运行未停机,只损失了部分不重要的作业。
4.2单路断电,UPS失效案例
20xx年8月某天,因低压配电柜开关至UPS房间x-JM柜电缆发生相对地短路,造成UPS机组逆变器自身保护动作,关闭UPS机组,导致曙光主机系统失电。
全机掉电后,主机维护人员迅速按应急预案
手工关闭所有电源开关。1 0 : 3 0恢复供电,温湿度恢复正常后,全机加电,恢复过程中修复
storage00
1、00
5、010三个盘阵的9个用户文件系统,修复15个节点加电故障,除cnode00
9、anode029电源
环境模块故障,于当日15:10全机系统恢复正常。
由于处置及时,主机受影响范围很小,在恢复供电后数小时即成功开启全系统。
5.随时保持应急预案的适用性
主机长年累月的运行,故障和问题的发生,往往是必然的,也是客观、无法回避的'。因此,要求在维护工作中,预先考虑到可能的问题和故障,制定完善的应急预案。应急预案不可能包含所有的故障和问题,但应根据维护经验,尽可能地设想各种危机情况下的处置措施。做到预想到各种可能的问题。
而在形成应急预案后,更重要的是持续地在
运行中加以完善、测试和演练,尽可能模拟实际情况,做到即使只有1名维护人员在场,也能在真正发生危机时,以最短时间独立处置故障。
以目前中心的主机运维工作为例,三年内,仅断电预案就已根据实际运行情况的变化,制定并更新了5~6个版本,针对夏季突发断电也有专用预案。这样的措施,直接保障了20xx年8月突发断电事件中的主机连续运行。而20xx年8月的突发断电事件中,由于预案在之前刚根据实际情况进行过演练和修改,主机维护人员仅用半小时就完成所有应急操作动作,整机仅有个别设备故障,确保了主机设备未因突发断电而发生大范围损坏现象,恢复供电后直接完成开机。
实践证明,完善而适用的应急预案能保障向用户提供稳定的高性能计算服务。
6.结束语
完备而适用的应急预案能有效降低主机系统因意外事件发生带来的运行风险,对可能发生的意外来说,是一种事前防范措施。但对整个主机系统产品而言,是一种事后防范措施。如果主机系统生产厂商能把这些防范措施纳入整个系统设计过程中,使操作方法更加简便、更趋于人性化,这将帮助主机维护人员更为妥善处理意外事件,用户得到更为稳定的高性能计算服务。我们相信未来国产的高性能计算机能做到这一点,期待着这一天早日到来。
(为帮助了解,特在附录中节选部分双路断电关机预案内容)
附录:《曙光4000A超级计算机系统双路断电关机操作方法》(省略具体操作步骤)
曙光4000A超级计算机系统双路断电关机操作方法
注意:
1、本方法专用于主机房发生双路同时断电紧急操作使用。(包括单线断电切换失败)。
2、本方法作为《曙光-4000A超级计算机系统紧急关机操作方法》的附件。
1.断电确认及操作:
主机房内一旦发现断电,并接物业明确通知为双路断电,首先执行如下操作(即确保节点温度):
1.1打开机房门便于散热,
1.2机房通道上布置应急风扇加强冷热空气对流,夏季:应急风扇布置..;冬季:应急风扇布置..,使曙光
机房的温度尽量降低。
1.3打开所有机柜前、后门。
1.4密切注意机房节点平均温度(专指各机柜液晶面板所示之环境温度值)。
2.紧急关机条件确认:
在完成上述操作后,密切观察主机房环境。一旦有如下任何一个条件满足:
2.1自断电发生起,已达到xx分钟仍未恢复供电;
2.2采取上述紧急通风措施,节点温度持续上升,超过xx℃;
可认定为紧急断电事件,即刻按下列紧急关机操作方法进行操作。
3.紧急关机操作步骤:
注意事项:
3.1 ..
3.2关机操作的全过程中,注意随时保持和物业的通讯联系。除根据情况随时联络外,应严格保证每xx分钟与物
业联系一次,询问UPS可支撑时间及恢复供电可能。(分机、手机、对讲机等)
3.3应理解关机原则为:根据实际电力供应考虑操作步骤,宁慢勿快,在时间允许的情况下,最大程度保证x排节
点、存储节点、SAN和SCSI存储设备的运行,尽可能减少关闭范围,以确保恢复。
第一级操作:(首先执行)关闭主机系统外围设备..
第二级操作:(完成上述操作后,当再次发现UPS电池低于xx分钟或节点平均温度超过xx℃,任一条件满足,执行如下操作)
关闭非重要用户计算节点(ABC组)..
第三级操作:(完成上述操作后,当再次发现UPS电池低于xx分钟或节点平均温度超过xx℃,任一条件满足,执行如下操作)
关闭所有用户计算节点(D组)..
第四级操作:(完成上述操作后,当再次发现UPS电池低于xx分钟或节点平均温度超过xx℃,任一条件满足,执行如下操作)
关闭SAN存储设备和LSF数据库服务器..
第五级操作:(完成上述操作后,当再次发现UPS电池低于xx分钟或节点平均温度超过xx℃,任一条件满足,完成关机操作)
关闭SCSI磁盘阵列和所有存储节点..
特别关注:
1.如时间非常紧急,UPS电池低于xx分钟:
直接执行关机脚本:
此脚本可分别将计算节点、接入节点、存储节点进行关闭。
2.如时间极其紧急,UPS电池低于xx分钟,可按《曙光-4000A超级计算机系统紧急关机操作方法》,直接拉闸操作。
(上述二个方法仅用于突发情况,非极其必要情况下严禁使用,应使用前列方法操作)
3.如遇主机失电(如关机操作不及已掉电或突发自动掉电)应关闭所涉范围所有设备电闸开关。..
机房应急预案10
总则
1.1编制目的
为高效有序地做好机房火灾事故的应急处置工作,避免或最大程度地减轻火灾事故造成的损失,保障员工生命和企业财产安全,维护社会稳定。
1.2编制依据
《中华人民共和国安全生产法》 《江苏省消防条例》
1.3适用范围
适用于机房火灾事故的现场应急处置和应急救援工作。
2.事件特征
2.1事件类型及危险性分析
2.1.1电气线路短路、过载、接触电阻过大,静电,雷击等强电侵入,机房内电脑、空调等用电设备长时间通电过热、设备故障等原因均可能引起计算机房的火灾事故。
2.1.2机房火灾事故会造成计算机设备损坏、系统故障网络中断或瘫痪,影响网络的安全运行。
2.1.3火灾产生的`有毒烟雾污染机房的空气,造成人员中毒、窒息等人身伤亡事故。
3.应急组织及职责
3.1火灾应急指挥部
应急指挥部总指挥:
机房火灾应急抢险指挥:
成员:
3.2指挥部人员的职责
3.2.1指挥的职责:全面指挥突发事件应急救援工作。
3.2.2高低压专业职责:组织、协调本部门人员参加应急处置和救援工作,对发生险情机房切断电源。
3.2.3智能化专业职责:监控相关区域事故情况。
3.2.4空调专业职责:发现异常情况,及时切断空调、通风系统,做好运行方式的调整和故障设备的隔离。 4应急处置
4.1现场应急处置程序
4.1.1最早发现火情者应立即向值班长和机房负责人汇报,机房负责人到现场指挥灭火,
同时报告公司领导,启动本预案。
4.1.2机房负责人根据事故状态及危害程度做出相应的应急决定,指挥疏散现场无关人员,各应急救援队立即开展救援。
4.1.3事故扩大时,拨打119报警电话请求市消防队支援。报警内容:单位名称、地址、着火物质、火势大小、着火范围。把自己的电话号码和姓名告诉对方,以便联系。同时还要注意听清对方提出的问题,以便正确回答。打完电话后,要立即到交叉路口等候消防车的到来,以便引导消防车迅速赶到火灾现场。
4.2现场应急处置措施
4.2.1机房负责人组织人员迅速查明着火原因。
4.2.2发生火灾事故后,运行值班人员在人身安全不受危害的情况下要坚守本职岗位,确保设备运行。
4.2.3火灾初起阶段,值班人员要利用区域内常规灭火器(干粉或气体灭火器)进行扑救。控制初起火灾,防止火势蔓延。根据火势情况立即启动气体自动灭火装置。
4.2.4被困火场逃生时,应用湿毛巾捂住口鼻,背向烟火方向迅速离开。逃生通道被切断、短时间内无人救援时,应关紧迎火门窗,用湿毛巾、湿布堵塞门缝,用水淋透房门,防止烟火侵入。
4.2.5火灾发生时要采取有效措施扑灭身上的火焰,使伤员迅速脱离开致伤现场。当衣服着火时,应采用各种方法尽快地灭火,如水浸、水淋、就地卧倒翻滚等,千万不可直立奔跑或站立呼喊,以免助长燃烧,引起或加重呼吸道烧伤。灭火后伤员应立即将衣服脱去,如衣服和皮肤粘在一起,可在救护人员的帮助下把未粘的部分剪去,并对创面进行包扎。
4.2.6在火场,对于烧伤创面一般可不做特殊处理,尽量不要弄破水泡,不能涂龙胆紫一类有色的外用药,以免影响烧伤面深度的判断。为防止创面继续污染,避免加重感染和加深创面,对创面应立即用三角巾、大纱布块、清洁的衣眼和被单等,给予简单而确实的包扎。手足被烧伤时,应将各个指、趾分开包扎,以防粘连。
4.2.7消防队到达火场时,应立即与消防队负责人取得联系并交待失火设备现状和运行设备状况,然后协助消防队灭火,并提供技术支援。
4.2.8复情况,事故应急处理全部结束,才能恢复生产秩序。
4.3火灾事故报告流程
4.3.1出现火情后,值班人员除采取有效措施扑灭初期火情外应立即想机房负责人汇报;
4.3.2火势无法控制时由机房负责人决定报火警请求辖区消防队救援。并在在火灾事故发生后1小时内向所云汇报突发事件信息。速报内容主要包括事故发生的时间、地点、人员伤亡、设备损坏情况、可能的引发因素和发展趋势等。
4.3.3联系方式
消防队:119 医务急救:120
4.4注意事项
4.4.1应急处置时注意防止中毒、窒息、触电、烫伤。
4.4.2危险区设好警戒线,并挂好标示牌。无操作权限的人员不得乱动现场设备。
4.4.3佩戴个人防护器具时注意检查防护用品合格,且在有效检验期内;正确佩戴使用正压式呼吸器、隔热服、隔热手套、绝缘靴等安全防护用具。
4.4.4现场自救和互救时不熟悉现场情况和灭火方法的人员不得盲目进入危险区域,救人前先确认自己的能力和现场情况是否能够满足对他人施救的需要。
4.4.5应急救援结束后要全面检查,确认现场无火灾隐患和建筑物坍塌的隐患。
4.4.6加强自身防护,避免救火导致人身伤害。
4.5附则
4.5.1机房应急人员的联系方式。
机房应急预案11
沙沟中学实施营养午餐突发断水断电等意外事故处理应急预案水、电是实施营养午餐改善计划学校食堂正常供餐必备的最基本的条件,是食品安全工作的重要组成部分,也是保障师生正常生活的重要基础。断水断电等意外事故在学校时有发生,为进一步加强学校食堂水、电等设施的管理,保障学校断水断电等意外事故发生时能正常为学生提供图纸等的营养午餐,维护学校正常的教育教学秩序,特制定本预案
一、组织机构
(一)成立学校突发断水断电等意外事故应急成立领导小组。
组长:王鹏程
副组长:马紅治
马志锐
组员:马强
吕宗仁
王继祖
陆岩
马万喜
各班主任
指挥部的工作职责是:
(1)启动学校断水断电等意外事故处理应急预案。
(2)领导、组织、协调事故应急处理工作。
(3)负责事故处理事项的决策。
(4)负责上报与事故相关的重要信息。
(5)审批学校应急处理工作报告。
二、常规管理
(一)、学校组织相关人员定期和吧不定期深入学校对学校可能断水断电等意外事件的隐患,即使做查漏补缺,做到早发现、早报告、早治理,不能因为人为因素断水断电而停止正常营养午餐。
(二)、学校要与当地政府、水保站、农电站等相关部门保持联系,协调学校的.用水和用电工作。
(三)、用水紧张或缺水学校,要想办法做好学校用水的储蓄工作,并邀请相关部门对学校用水质量检测,确保水质量好,无安全隐患。
(四)、做好学校食堂用电设施的改造工程,指定专人经常对学校食堂用电设施进行检修,维护。
(五)、对却因客观原因二造成的断水断电等意外事故时应立即启动该预案。
三、建立报告机制
1、对学校发生临时断水断电等意外事故是学校不能对学生实施午餐时,学校从业人员向管理人员报告,管理人员向校长报告,校长协调有关人员检查检修,对于用电设施必须有专业人员进行检修,确保短时间内供水供电。
2、对学校发生长时断水断电等意外事故时,学校从业人员向管理人员报告,有管理人员检查检修,同时上报县意外事故应急处理协调领导小组。
四、事件处理
1、各级领导小组负责人接到报告后,及时组织相关人员赶赴学校开展事故处理工作
2、学校应及时对学生做好解释说明工作,同时采取科学合理的办法通过各种途径解决学生营养午餐
3、学校迅速与家长取得联系,通过告示等形式给家长做好解释工作,去的家长的谅解,保证广大师生及家长在事故发生和过程中的知情权,严防事态扩大给学校教育工作造成不良影响。
4、协调各方面力量做好学校稳定工作,保障学校正常的教育教学秩序
5、学校要及早购置手摇鼓风机等应急设备,在学校断电时能立即启用。
6、主动和有关部门联系,及时购买等价等值、卫生、营养、可口的熟食品,如牛奶、面包等,及时为学生供应午餐。
7、断水断电事故处理结束,要认真总结分析事故发生原因,提出改进意见,完成处置总结报告,报送县营养办。
五、责任追究
对断水断电突发公共事件的应急处置工作中实行领导责任制和责任追究。对有突出表现的个人予以鼓励和表彰;对负有直接责任个人依据有关法规和规定给予行政处分;;对处理不当,贻误时机,造成恶劣影响的直接责任人,要严肃追究责任。
六、本预案由学校突发断水断电等意外事故一见处理工作领导小组负责解释。
机房应急预案12
第一条 机房突发事件包括网络设备或服务器故障、自然灾害(水、火、电等)造成的物理破坏、人为失误造成的'安全事件等等。 针对突发事件的预防措施如下: 建立安全、可靠、稳定运行的机房环境,防火、防盗、防雷电、防水、防静电、防尘;建立备份电源系统;加强防火、防盗意识。
第二条 机房漏水应急预案如下:
一、发生机房漏水时,第一目击者应立即通知机房管理人员。
二、若空调系统出现渗漏水,机房管理人员应立即安排停用故障空调,清除机房积水,并及时联系设备供应方处理,必要情况下可临时用电扇对服务器进行降温。
三、若为墙体或窗户渗漏水,机房管理人员应立即采取有效措施确保机房安全,同时安排通知工程人员及时清除积水,维修墙体或窗户,消除渗漏水隐患。
第三条 机房火灾应急预案如下:
一、完善机房环境,确保机房放置灭火器;禁止携带易燃易爆物品进入机房。
二、机房管理人员应熟悉机房内部消防安全操作和规则,了解消防设备操作原理,掌握消防应急处理步骤、措施和要领,懂得灭火的方法,会扑救初起火源。
三、一旦发生火灾,迅速切断机房电源,避免灾情的扩散,并迅速和保安部联系必要时立即报火警。
第四条 机房停电应急预案如下:
一、接到停电通知后,应及时通过办公系统、电话等发布相关信息,部署应对具体措施,要求在停电前停止业务、保存数据。
二、机房管理人员每日检查UPS电源的状态,确保在突发停电时,UPS电源能自动供应服务器正常工作15分钟以上,保证员工工作的数据及时保存。
第五条 通信网络故障应急预案如下:
一、发生通信线路中断、流量异常等故障后,发现状况的员工或部门领导应及时通知网络管理员。 二、网络管理员了解情况后,迅速组织检测故障区域,并作相关故障处理,逐步恢复故障区与服务器的网络联接,恢复通信网络,保证正常运转。
第六条 服务器故障应急预案如下:
一、机房管理人员每日检查机房内各服务器状态。
二、定期备份数据服务器数据。并将备份资料拷贝到移动设备。服务器出现严重硬件故障时启用备用服务器以保障正常运转。
机房应急预案13
机房消防安全工作极为重要,一旦发生火灾,将直接影响大厦内设备正常运行,并对人身安全和经济财产造成巨大的损失。为防范消防安全事故发生,保证消防安全事故发生时能够快速、高效、合理有序地处置,特制定本预案。
一、电气火灾的主要因素
1、电气线路短路、过载、接地电阻过大等引发火灾。
2、由于机房内设备长时间不间断运行或设备故障引发火灾。
3、静电产生火灾。
4、雷电等强电入侵引发火灾。
二、处置程序
1、发现火情后,迅速切断电源,利用就近灭火器进行灭火,并按照特级事故通报机制进行通报,向领导汇报火灾具体情况。
2、迅速组织相关人员携带消防器具赶赴现场灭火,并听从现场指挥人员指挥。
3、如火情较为严重,应立即与大厦消防中控取得联系,并与之协商处理办法措施,必要时需要专业消防灭火的,迅速请示领导拨打119。
三、注意事项
1、一旦机房发生火灾,应遵循以下原则:首先保证人员安全;其次保证关键设备安全;再保证一般设备安全;救火过程中应边救火,边报警。
2、火灾发生时,第一发现人查明起火原因,如因电源引起,应首先切断电源。
四、预防措施
1、对机房内电气设备定期检查。发现存在问题的'设备及时维修,消除安全隐患。
2、每天定时对机房重要电气设备和电子设备的温度进行了监控,能够及时地发现并消除隐患。
3、应组织相关人员进行消防安全教育,学习消防知识,学会正确使用各种灭火器,有计划的进行相关的消防演习。
机房应急预案14
第一条 机房突发事件包括网络设备或服务器故障、自然灾害(水、火、电等)造成的物理破坏、人为失误造成的安全事件等等。 针对突发事件的预防措施如下: 建立安全、可靠、稳定运行的机房环境,防火、防盗、防雷电、防水、防静电、防尘;建立备份电源系统;加强防火、防盗意识。
第二条 机房漏水应急预案如下:
1、发生机房漏水时,第一目击者应立即通知机房管理人员。
2、若空调系统出现渗漏水,机房管理人员应立即安排停用故障空调,清除机房积水,并及时联系设备供应方处理,必要情况下可临时用电扇对服务器进行降温。
3、若为墙体或窗户渗漏水,机房管理人员应立即采取有效措施确保机房安全,同时安排通知工程人员及时清除积水,维修墙体或窗户,消除渗漏水隐患。
第三条 机房火灾应急预案如下:
1、完善机房环境,确保机房放置灭火器;禁止携带易燃易爆物品进入机房。
2、机房管理人员应熟悉机房内部消防安全操作和规则,了解消防设备操作原理,掌握消防应急处理步骤、措施和要领,懂得灭火的.方法,会扑救初起火源。
3、一旦发生火灾,迅速切断机房电源,避免灾情的扩散,并迅速和保安部联系必要时立即报火警。
第四条 机房停电应急预案如下:
1、接到停电通知后,应及时通过办公系统、电话等发布相关信息,部署应对具体措施,要求在停电前停止业务、保存数据。
2、机房管理人员每日检查UPS电源的状态,确保在突发停电时,UPS电源能自动供应服务器正常工作15分钟以上,保证员工工作的数据及时保存。
第五条 通信网络故障应急预案如下:
1、发生通信线路中断、流量异常等故障后,发现状况的员工或部门领导应及时通知网络管理员。 2、网络管理员了解情况后,迅速组织检测故障区域,并作相关故障处理,逐步恢复故障区与服务器的网络联接,恢复通信网络,保证正常运转。
第六条 服务器故障应急预案如下:
1、机房管理人员每日检查机房内各服务器状态。
2、定期备份数据服务器数据。并将备份资料拷贝到移动设备。服务器出现严重硬件故障时启用备用服务器以保障正常运转。
机房应急预案15
机房消防应急预案
为使信息机房发生火灾事故时,当班人员能镇静有序地处置事件,特制订本预案,请各成员认真学习,熟悉应急处置程序,提高全员的应急能力,一旦发生突发事件,尽最大努力保证员工人身安全和减少损失。
起火原因一般有明火管理不慎;电气设备管理、使用不当;纵火等原因。
预案一:当闻到烧焦气味时
当班人员发现信息机房内有冒烟现象或闻到烧焦气味时,可能是某处阴燃处于起火阶段或电源超负荷发热引起,容易引发火灾,当班人员要立即查明原因和地点,针对不同情况,采取迅速将火源扑灭或关闭电源总开关、隔离火源附近易燃物、关闭窗等措施,消除起火隐患,防止引了火灾。事后立即向安保部门报告,并做好现场保护工作和防止起火点复燃,不得随意离开现场和将事故隐瞒不报。预案二:当班时发现起火或冒出浓烟
由于起火源隐蔽或其他突发原因未能及时发现和消除起火隐患,酿成明火和冒出浓烟,燃烧面积不大,就是火灾的初起阶段,当班人员发现起火或冒出浓烟时,切忌惊惶失措,要沉着、果断,会同其他当班人员分工协作,迅速查明原因组织扑救,当火执已无法控制时处置办法:
一是指定专人立即拔打“119”火警电话报警和向上级保卫部门报告,并向本部门和周围的人及群众喊叫报警;二是组织本单位、部门在场的人员有序地投入扑救工作,充分利用消防栓、灭火器、水桶等器材灭火,不能消极等待消防队到来,而错过灭火良机,力求将火扑灭或控制火势蔓延,不能只顾个人安危而逃离火场
三是大声呼喊请求邻近单位及群众的支援。
四是在组织灭火同时,要立即组织人员疏散和转移物品中,特别昌易燃、易爆物品和易受到火舌威胁的.现金、重要凭证要及时转移到安全地点,并派人员守护,确保安全。
五是灭火后要注意保护现场,维护好秩序,以利于消防部门调查分析火灾原因。注意事项:
报警人员报警时要向消防部门讲清楚起火地点、单位、起火的种类和火势大小,报警后即到街道或十字路口迎接、引导消防车辆的到来;扑救人员在消防人员到来后,要立即向消防指挥人员讲清火场内存放有何种物资和贵重物品,火场内是否有爆炸、剧毒物品,并协助消防部门维护好现场秩序。自行扑救火灾时要留心观察火势和环境,防止被火围困、烟气中毒、坠物砸伤等,在确保自身安全的情况下扑救火灾。
【机房应急预案】相关文章:
机房应急预案03-27
机房应急预案05-20
机房火灾的应急预案09-22
[经典]机房火灾的应急预案08-29
机房火灾应急预案02-17
机房火灾应急预案08-05
关于机房火灾应急预案08-05
机房应急预案(15篇)03-27
公司机房消防应急预案01-07