全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210466375.1 (22)申请日 2022.04.29 (71)申请人 苏州浪潮智能科技有限公司 地址 215100 江苏省苏州市吴中区吴中经 济开发区郭巷街道官浦路1号9幢 (72)发明人 王金喜 宋亭豫  (74)专利代理 机构 济南诚智商标专利事务所有 限公司 3710 5 专利代理师 李修杰 (51)Int.Cl. H04L 9/08(2006.01) H04L 9/32(2006.01) H04L 69/16(2022.01) (54)发明名称 一种维护Slurm HA 状态数据文件的方法、 系 统及终端 (57)摘要 本申请公开了一种维护Slurm  HA状态数据 文件的方法、 系统及终端, 该方法首先在Slurm调 度系统中部署Slurm  HA服务; 在Slurm主管理节 点和备管理节点之间建立SSH免密通信; 通过在 主管理节点部署l syncd服务, 将主管理节点状态 数据实时同步至备管理节点。 该系统包括: 部署 模块、 SSH免密模块和同步模块。 该终端包括处理 器以及存储器。 通过本申请, 只需要在主管理节 点占用较少的资源即可实现, 能够大大节省资 源, 有利于资源的节约和充分利用, 还有利于提 高slurm调度状态数据的可靠性。 权利要求书2页 说明书5页 附图2页 CN 114826584 A 2022.07.29 CN 114826584 A 1.一种维护Slurm  HA状态数据文件的方法, 其特征在于, 所述方法应用于Slurm主管理 节点故障的场景, 所述方法包括: 在Slurm调度系统中部署Slurm  HA服务; 在Slurm主管理节点和备 管理节点之间建立S SH免密通信; 通过在主管理节点部署lsyncd服 务, 将主管理节点状态数据实时同步至备 管理节点。 2.根据权利 要求1所述的一种维护Slurm  HA状态数据文件的方法, 其特征在于, 所述通 过在主管理节点部署lsyncd服 务, 将主管理节点状态数据实时同步至备 管理节点, 包括: 在主管理节点部署lsyncd服 务; 在配置文件中将主管理节点的IP地址、 状态数据目录作 为源, 将备管理节点的IP地址、 状态数据目录作为备; 根据配置文件运行lsyncd服 务, 并检查 lsyncd服 务是否正常运行; 如果否, 重新 修改配置文件, 直到lsyncd服 务正常运行。 3.根据权利 要求1所述的一种维护Slurm  HA状态数据文件的方法, 其特征在于, 通过在 主管理节点部署lsyncd服务, 将主管理节点状态数据 实时同步至备管理节点之后, 所述方 法还包括: 通过模拟主管理节点故障, 对所部署的Slurm  HA服务进行校验。 4.根据权利要求1 ‑3中任意一项所述的一种维护Slurm  HA状态数据文件 的方法, 其特 征在于, 通过在主管理节点部署lsync d服务, 将主管理节点状态数据实时同步至备管理节 点之后, 所述方法还 包括: 将lsyncd服 务设置为 开机自启模式。 5.一种维护Slurm  HA状态数据文件的系统, 其特征在于, 所述方法应用于Slurm主管理 节点故障的场景, 所述系统包括: 部署模块, 用于在Slurm调度系统中部署Slurm  HA服务; SSH免密模块, 用于在Slurm主管理节点和备 管理节点之间建立S SH免密通信; 同步模块, 用于在主管理节点部署lsyncd服务, 将主管理节点状态数据实时同步至备 管理节点。 6.根据权利 要求5所述的一种维护Slurm  HA状态数据文件的系统, 其特征在于, 所述同 步模块包括: lsyncd服 务部署单 元, 用于在主管理节点部署lsyncd服 务; 配置单元, 用于在配置文件中将主管理节点的IP地址、 状态数据目录作为源, 将备管理 节点的IP地址、 状态数据目录作为备; 运行与检测单元, 用于根据配置文件运行lsyncd服务, 并检查lsyncd服务是否正常运 行, 如果是, 流程结束, 如果否, 重新启动所述配置单元, 修改配置文件, 直到lsync d服务正 常运行。 7.根据权利 要求5所述的一种维护Slurm  HA状态数据文件的系统, 其特征在于, 所述系 统中还包括有: 校验模块, 用于通过模拟主管理节点故障, 对所部署的Slurm  HA服务进行校验。 8.根据权利要求5 ‑7中任意所述的一种维护Slurm  HA状态数据文件 的系统, 其特征在 于, 所述系统中还 包括有:权 利 要 求 书 1/2 页 2 CN 114826584 A 2启动设置模块, 用于将lsyncd服 务设置为 开机自启模式。 9.一种终端, 其特征在于, 所述终端包括: 处理器以及与所述处理器通信连接的存储 器, 其中, 所述存储器中存储有可被所述处理器执行的指令, 所述指令被所述处理器执行, 以使 所述处理器能够执 行权利要求1至4中任意 一项所述的维护Slurm  HA状态数据文件的方法。权 利 要 求 书 2/2 页 3 CN 114826584 A 3

.PDF文档 专利 一种维护Slurm HA状态数据文件的方法、系统及终端

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种维护Slurm HA状态数据文件的方法、系统及终端 第 1 页 专利 一种维护Slurm HA状态数据文件的方法、系统及终端 第 2 页 专利 一种维护Slurm HA状态数据文件的方法、系统及终端 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:17:10上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。