文件编码:XXX-XXXX-009
网络可用性管理规范
发布/修订日期:2022 年 6 月 20 日
生 效 日 期: 2022 年 6 月 20 日
北京思度咨询科技有限公司文件修改记录
序
号文件代码修改章节文件更改通知单编号 修改日期修改人批准人第一章 总则
第一条 为规范北京思度咨询科技有限公司网络基础设施及网络层数据防泄
露设备的备份建设,实现网络的高可用性,从而保证数据传输过程的稳定性,制
定本规范。
第二条 本规范适用于指导北京思度咨询科技有限公司的软硬件网络可用性
管理工作。
第二章 职责权限
第三条 数据安全领导小组办公室
(一)负责组织制定北京思度咨询科技有限公司网络可用性的相关制度、规
范以及流程;
(二)根据北京思度咨询科技有限公司不同的业务环境所提出的各种网络性
能需求建立网络服务配置方案和宕机替代方案,协助保障服务中心 -终端安全管
理岗人员执行。
第四条 保障服务中心-终端安全管理岗,主要履行的职责包括但不限于:
(一)负责协助数据安全领导小组办公室制定网络可用性管理制度;
(二)组织开展网络可用性安全检查工作,确保北京思度咨询科技有限公司
网络可用性,及时发现存在的问题,并上报数据安全领导小组办公室。
第三章 网络可用性管理指标
第五条 术语及定义
(一)可用性指系统或组件在指定的条件和时间内,维持其规定功能的能力 ,
常以百分比标识并能综合反映设备的可靠性和可维修性。
(二)平均无故障时间( Mean Time Between Failures ,MTBF),即整个网
络的各组件(链路、节点)不间断无故障连续运行的平均时间。 MTBF越大,表明越
不容易出故障,可用性自然高。 MTBF反映的是网络的可靠性( reliability)。
(三)平均修复时间(Mean Time To Repair ,MTTR),即从故障发生到故
障消除所需要的平均时间。 MTTR越小,表 示故障时间越 短,可用性 也就越高。出
现故障后,要经过检查、识 别、定位、修复和 核查过程, 还可能出现技术 延迟和
第 1 页 共5 页
后勤延迟,MTTR不仅与设备的种 类和所在位置有关, 与是否使用网络管理系统及
该系统的响应速度和告警能力有关, 还与维修队伍的整体素质(包括体质、管理、
责任心、维修 支援能力等因素)有关。
(四)可用度(Availability):可用性的定 量描述。
(五)不可用度(Unavailability):与可用度相 对。
第六条 系统网络可用性管理指标
北京思度咨询科技有限公司系统平 台网络可用性需 遵循以下网络可用性指标
进行建设, 且应达到“具有故障自 动恢复能力”的可用性。
描述通俗叫法可用性级别年度宕机时间每天宕机时间
可用1个990%36.5天2.4小时
基本可用性 2个999%87.6小时14分钟
较高可用性3个999.9%8.76小时86秒
具有故障自 动
恢复能力的可
用性4个999.99%52.6分钟8.6秒
较高可用性5个999.999%5.25分钟0.86秒
第四章 网络可用性安全管理
第七条 保障服务中心-终端安全管理岗人员负责网络及其组件设备的日常
维护以及网络故障的 应急工作,全 面负责可能出现的各种 突发事件处置工作,并
协调解决网络故障 处置工作中的 重大问题。
第八条 网络故障发生 前,数据安全领导小组办公室协助保障服务中心 -终
端安全管理岗人员需 预先对网络故障 预警预报体系进行建设,编制网络故障防 治
规划。
第九条 保障服务中心-终端安全管理岗人员需 加强对网络及各组件的日常
监测及其日志保存工作,发现 险情时,需及时 向数据安全领导小组办公室报 告。
第十条 保障服务中心-终端安全管理岗人员 严格执行值班制度,建立 健全
网络故障 速报制度,以保障 最先发现网络故障并及时 处置次突发事件和突发性网
络故障信息可立即发布 预警。
第十一条 网络故障发生时,保障服务中心 -终端安全管理岗人员 应立即启
动应急预案,采取应急处置程序, 判定网络故障 级别,并立即 向数据安全领导小
第 2 页 共 5 页组办公室报 告。在网络故障 处置过程中, 应及时报告网络故障 处置工作的 进展情
况,直至故障修复。
第十二条 网络故障 消除后,由保障服务中心-终端安全管理岗人员 向数据
安全领导小组办公室 宣布网络故障 应急期结束,并予以公告,同时预案终止。
第五章 网络服务配置方案和宕机替代方案
第十三条 网络服务配置 原则
(一)层次化:分层次设计网络结构,严格定义各层 次的功能;
(二)模块化:根据区域划分拓扑结构;
(三)可扩展:根据业务发展需要,通过 简单复制模块单元来拓展网络;
(四)冗余设计:提供设备和链路的 冗余保护。
第十四条 提高网络可用性
(一)在网络规 划设计阶段,需要细致分析业务模型,确定基础网络 拓扑,
对影响网络可用性的关 键节点和链路 必须做充分的冗余设计,并根据网络 结构,
在各个层 次、各个节点 部署合适的高可用性技术;
(二)在组件或设备 选型时,除保证技术指标 外,也要有足够高的可靠性指
标;
(三)持续进行网络维 护和优化。利用高效的网络设备管理工 具持续监控、
分析、预测、优化,最大限度的规 避网络拥塞;
(四)在进行软硬件 版本升级或新设备,新业务上线时,需要 事先详细规划,
制定应急预案;
(五)高度关注网络安全问题。定期 对主机系统和网络系统 进行安全评估,
构建一个多层次的安全防 御和预警系统;
(六)做好业务系统和网络系统的协 调。积极分析业务模型,并适当的进行
调整,可以 让网络更通 畅。
第十五条 建立容错机制,通过容 错技术,外加冗余资源(包括硬件 冗余、
软件冗余和路由冗余)消除单点故障 使系统在单点故障中 仍能正常工作。
第十六条 提高网络可用性可 采用以下技术:
(一)避错措施
避错方法包括各种硬件、软件和管理 措施。
第 3 页 共5 页1)硬件避错方法是通过改 进硬件的制 造工艺和设计,防止错误的产生,包
括网络中 电气系统的避错、网络设备的 避错、服务器的避错和网络中传输 媒体的
避错等;
2)软件避错方法包括形式说明、过程管理、软件 测试和程序设 计技术选择
等,例如网络应用系统的 避错和成熟可靠的网络 操作系统的 使用等;
3)管理避错方法要求网络运行管理要 严格按照规范进行,包括制度建设、
任务分配、设备标识、规范文 档记录、各种软硬件日常维 护和网络安全管理标准
等,例如管理信息存储的避错、网络中网络 结构选择的避错和日常网络管理的 避
错等。
(二)快速检错
实现快速检错包括故障检 测和故障诊断两方面,故障检 测的作用是确定故障
是否存在,故障 诊断的作用是确定故障的 位置。一般快速检错是从故障现 象出发,
以网络诊断工具为手段获取诊断信息,确定网络故障点,查 找问题的根 源具体包
括:
1)自动检错而不是人工检 错可以更快提高检错的速度;
2)借助线路检测工具(如线缆测试仪、时间域反射计)可以加快线路故障
的检错速度;
3)利用网络管理系统 专门的管理进程不断地检测路由器的关键数据并及时
给出报警可以加快路由器故障的检 测速度;
4)通过工 具自动监视主机流量、扫描主机端口和服务来检测主机的异常,
可以加快主机故障的检 测速度;
5)利用网络测试仪可以自动定位网络故障 源,找出故障点并 显示其网络相
关信息,从而加快逻辑故障的检 测速度;
6)利用网络分 析工具进行快速检错,如协议分析程序Snigger,操作系统中
内置的一 些非常有用的软件网络 测试工具等。
(三)快速排错(恢复)
排错事在网络出现故障时, 逐一排除故障,恢复系统的可用性。网络故障 排
错的方法分为:
1)分层故障 排错法:它主要根据网络分层的 概念进行逐步分析的方法;
2)分块故障排错法:此方法从设备的配置文件 入手,将配置文件分为管理
部分、端口部分、路由协议部分、策略部分和接入部分,并对其逐一进行检查排
错;
3)分段故障排错法:此方法是把网络分段,逐段排除故障;
第 4 页 共 5 页4)替换法:替换法是检查硬件问题 最常用的方 法。如怀疑是网线问题时,
更换一根确定 完好的网线尝试。
第十七条:网络系统维 护期:通过 前面的避错、容错措施的建设,网络可用
性大大增强,同时网络出 错的概率也大大降低,此时主要是 针对日常网络系统的
监控、检错、排错,使用相关技术工 具,不断减少平均修复时间,从而实现网络
可用性的全维度 把控。
第六章 附则
第十八条:本规范由数据安全领导小组办公室负责制定、 解释和修改。
第十九条:对违反本规定的人员, 将按照北京思度咨询科技有限公司有关规
定进行处罚。
第二十条:本规范自发布 之日起执行。
第 5 页 共5 页
【原创】思度安全-DSMM-009 网络可用性管理规范V1.0
文档预览
中文文档
7 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共7页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 思安 于 2023-06-03 10:18:28上传分享