(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210764180.5 (22)申请日 2022.06.30 (71)申请人 苏州浪潮智能科技有限公司 地址 215100 江苏省苏州市吴中区吴中经 济开发区郭巷街道官浦路1号9幢 (72)发明人 潘燕燕  (74)专利代理 机构 济南诚智商标专利事务所有 限公司 3710 5 专利代理师 黄晓燕 (51)Int.Cl. G06F 16/2455(2019.01) G06F 16/23(2019.01) G06F 9/50(2006.01) G06Q 10/10(2012.01) (54)发明名称 一种计算资源的容错方法、 系统、 装置及计 算机存储介质 (57)摘要 本发明提供了一种计算资源的容错方法、 系 统、 装置及计算机存储介质, 容错方法包括响应 于用户的任务删除操作, 获取当前用户占用的资 源配额值Data2; 查询数据库中当前用户的资源 配额值Data1; 比较Data1和Data2, 若两者一致, 则执行删除任务, 释放任务占用的配额, 否则, 更 新数据库中的资源配额值Data2为用户的资源配 额值Data1, 执行删除任务, 释放任务占用的配 额。 本发明在接收到用户的任务删除操作时, 首 先对用户及其所在用户组内的实际配额进行采 集, 并与数据库中存储的资源配置值进行比较, 在出现不一致时, 将数据库内的数值修改为实际 配额值, 然后执行任务的删除操作, 保证删除任 务的顺利进行, 从而达 到释放资源的目的。 权利要求书1页 说明书4页 附图3页 CN 115098547 A 2022.09.23 CN 115098547 A 1.一种计算资源的容 错方法, 其特 征是, 所述容错方法包括以下步骤: 响应于用户的任务删除操作, 获取当前用户占用的资源配额 值Data2; 查询数据库中当前用户的资源配额 值Data1; 比较Data1和Data2, 若两者一致, 则执行删除任务, 释放任务占用的配额, 否则, 更新数 据库中的资源配额值Data2为用户的资源配额值Data1, 执行删除任务, 释放任务占用的配 额。 2.根据权利要求1所述计算资源的容错方法, 其特征是, 所述方法在接收到删除任务之 后, 执行删除操作之前还 包括步骤: 对用户所在用户组的资源进行 校验。 3.根据权利要求2所述计算资源的容错方法, 其特征是, 所述对用户所在用户组 的资源 进行校验的具体过程 为: 获取当前用户所在用户组的资源配额 值D3; 查询数据库中当前用户所在用户组的资源配额 值D4; 比较D3和D4, 若两者 不一致, 更新数据库中的资源配额D4 为用户组的资源配额 值D3。 4.根据权利要求3所述计算资源的容错方法, 其特征是, 所述用户组内包括多个用户, 所述资源配额 值D3为当前用户组内每 个用户下 所有任务占用的资源配额 值的和。 5.根据权利要求1所述计算资源的容错方法, 其特征是, 所述资源配额值Data2为当前 用户下所有任务占用的资源配额 值的和。 6.根据权利要求1所述计算资源的容错方法, 其特征是, 所述数据库内存储有任务表, 任务表中包括每 个用户的任务及每 个任务占用的资源配额 值。 7.一种计算资源的容 错系统, 其特 征是, 所述系统包括: 用户数据采集单元; 响应于用户的任务删除操作, 获取当前用户占用的资源配额值 Data2; 数据库数据获取 单元, 用于查询数据库中当前用户的资源配额 值Data1; 比较处理单元, 用于比较Data1和Data2, 若两者一致, 则执行删除任务, 释放任务占用 的配额, 否则, 更新数据库中的资源配额值Data2为用户的资源配额值Data1, 执行删除任 务, 释放任务占用的配额。 8.根据权利要求7所述计算资源的容错系统, 其特征是, 所述系统还包括资源校验单 元, 所述资源校验单 元用于对用户所在用户组的资源进行 校验。 9.一种计算资源的容错装置, 基于AI平台, 其特征是, 所述容错装置包括权利要求7或8 所述的容错系统, 所述容错装置基于AI平台部署若干用户和用户组, 所述用户在执行删除 操作时, 调用所述 容错系统。 10.一种计算机存储介质, 所述计算机存储介质中存储有计算机指令, 其特征是, 所述 计算机指令在权利要求7或8所述系统上运行时, 使所述系统执行如权利要求1 ‑6任一项所 述方法的步骤。权 利 要 求 书 1/1 页 2 CN 115098547 A 2一种计算资源的容 错方法、 系统、 装 置及计算机存 储介质 技术领域 [0001]本发明涉及资源容错技术领域, 尤其是一种计算资源的容错方法、 系统、 装置及计 算机存储介质。 背景技术 [0002]AI平台可以对项目用户、 用户组进行维护。 系统管理员可以在AI平台创建项目用 户, 用户可以在AI平 台进行开发、 脚本训练、 模型训练。 系统管理员可以在AI平 台创建用户 组, 用户组内可以关联用户, 关联用户组可以使用的资源组。 [0003]AI平台创建用户、 用户组, 为用户、 用户组分配可以使用的资源配额, 包括CPU、 加 速卡等资源的配额。 用户在AI平 台进行开发、 脚本训练、 模型训练时, 需要占用的CPU、 加 速 卡等资源, 这些资源的占用会统计在用户、 用户组的 已使用配额中, 用户、 用户组的可以支 配的配额减少 。 如果用户创建的任务占用完所有用户的可以使用的配额时, 用户不能再创 建新的任务。 当用户训练的脚本运行完 毕, 或者用户删除了未运行完 毕的任务时, 任务占用 的资源配额 就会释放, 用户、 用户组的可以支配的配额增 加。 [0004]在实际使用时, 存在数据集更新错误、 任务占用资源未及时刷新、 使用者错误更新 了数据库等问题, 这样会导致任务在运行完成, 释放配额后, 用户、 用户组的已用配额为负 值, 这样会导 致无法删除当前 未运行完成的任务, 资源无法释放。 发明内容 [0005]本发明提供了一种计算资源的容错方法、 系统、 装置及计算机存储介质, 用于解决 现有数据库对资源配置的更新错误导致无法删除当前未运行完成的任务, 造成资源无法释 放的问题。 [0006]为实现上述目的, 本发明采用下述 技术方案: [0007]本发明第一方面 提供了一种计算资源的容 错方法, 所述 容错方法包括以下步骤: [0008]响应于用户的任务删除操作, 获取当前用户占用的资源配额 值Data2; [0009]查询数据库中当前用户的资源配额 值Data1; [0010]比较Data1和Data2, 若两者一致, 则执行删除任务, 释 放任务占用的配额, 否则, 更 新数据库中的资源配额值Dat a2为用户的资源配额值Dat a1, 执行删除任务, 释放任务占用 的配额。 [0011]进一步地, 所述方法在接收到删除任务之后, 执 行删除操作之前还 包括步骤: [0012]对用户所在用户组的资源进行 校验。 [0013]进一步地, 所述对用户所在用户组的资源进行 校验的具体过程 为: [0014]获取当前用户所在用户组的资源配额 值D3; [0015]查询数据库中当前用户所在用户组的资源配额 值D4; [0016]比较D3和D4, 若两者不一致, 更新数据库中的资源配额D4为用户组的资源配额值 D3。说 明 书 1/4 页 3 CN 115098547 A 3

.PDF文档 专利 一种计算资源的容错方法、系统、装置及计算机存储介质

安全报告 > 其他 > 文档预览
中文文档 9 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种计算资源的容错方法、系统、装置及计算机存储介质 第 1 页 专利 一种计算资源的容错方法、系统、装置及计算机存储介质 第 2 页 专利 一种计算资源的容错方法、系统、装置及计算机存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 思考人生2024-02-07 20:38:17上传分享
给文档打分
您好可以输入 255 个字符
网站域名是多少( 答案:github5.com )
评论列表
  • 暂时还没有评论,期待您的金玉良言
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。