全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111662608.7 (22)申请日 2021.12.31 (71)申请人 华能烟台八角热电有限公司 地址 264000 山东省烟台市中国 (山 东) 自 由贸易试验区烟台片区烟台开 发区合 肥大街20号 申请人 华能信息技 术有限公司   华能山东发电有限公司 (72)发明人 申大伟 孙富华 唐培全 王志翔  马勇 薛晓彬 杜万波 徐婷婷  付宁 王超 辛奕超 薄文靖  王福晶 张浩 严明 齐峰  (74)专利代理 机构 北京睿博行远知识产权代理 有限公司 1 1297 专利代理师 李晓波(51)Int.Cl. G06F 16/242(2019.01) G06F 16/28(2019.01) G06K 9/62(2022.01) H03M 7/30(2006.01) (54)发明名称 一种数据存储方法、 系统、 计算机设备及存 储介质 (57)摘要 本发明适用于数据存储技术领域, 提供了一 种数据存储 方法、 系统、 计算机设备及存储介质, 包括以下步骤: 对上传数据的用户终端进行身份 识别, 将上传数据存储至存储模块中; 当存储模 块中未压缩 数据的存储量达到第一预设值时, 提 取出所有未压缩 数据的文件名, 根据文件名对未 压缩数据进行自动分组, 在每组数据中添加标 记; 对每一组的未压缩数据进行一次压缩形成一 次压缩数据, 对多份一次压缩数据进行二次压 缩。 本发明能够根据文件名对数据进行自动分 组, 使得每一组数据具有更多的共性, 并在每组 数据中添加标记, 标记能够反映出该组数据的共 性, 对每一组的未压缩数据进行一次压缩后, 将 具有相同标记的一次压缩数据进行再次压缩, 压 缩效率高。 权利要求书2页 说明书8页 附图4页 CN 114510496 A 2022.05.17 CN 114510496 A 1.一种数据存 储方法, 其特 征在于, 所述方法包括以下步骤: 对上传数据的用户终端进行身份识别, 根据识别得到的身份信 息将所述上传数据存储 至对应部门的存 储模块中; 当存储模块中未压缩数据的存储量达到第 一预设值 时, 提取出所有未压缩数据的文件 名, 根据文件名对未压缩数据进行自动分组, 在每组数据中添加标记; 对每一组 的未压缩数据进行一 次压缩形成一 次压缩数据, 根据 添加的标记对一次压缩 数据进行二次压缩。 2.根据权利要求1所述一种数据存储方法, 其特征在于, 所述当存储模块中未压缩数据 的存储量达到第一预设值时, 提取出所有未压缩数据的文件名, 根据文件名对未压缩数据 进行自动分组, 在每组数据中添加标记的步骤, 具体包括: 实时监控存储模块中未压缩数据的存储量, 当未压缩数据的存储量达到第一预设值 时, 自动提取 出所有未压缩数据的文件名; 对未压缩数据的文件名进行相似度计算, 将相似度达到第 二预设值的未压缩数据分为 一组; 对每组数据的所有 文件名进行分析 得到标记, 在每组数据上 添加所述标记。 3.根据权利要求2所述一种数据存储方法, 其特征在于, 所述对未压缩数据的文件名进 行相似度计算, 将相似度达 到第二预设值的未压缩数据分为 一组的步骤, 具体包括: 随机挑选一个文件名, 将所述文件名与剩余的所有文件名逐一进行相似度匹配得到若 干个相似度, 即每次有两个文件名之间进行相似度匹配, 将所有相似度达到第二预设值的 未压缩数据与挑选的文件名所对应的数据归类为 一组; 对相似度 未达到第 二预设值的未压缩数据 再次进行相似度计算, 将相似度达到第 二预 设值的未压缩数据分为 一组; 重复上述 步骤, 直至剩余的未压缩数据的份数为 一或者零。 4.根据权利要求3所述一种数据存储方法, 其特征在于, 所述两个文件名之间进行相似 度匹配的步骤, 具体包括: 分别提取 出两个文件名的字符得到第一字符信息的第二字符信息; 对比得到第一字符信息和第二字符信息中相同字符的数量; 计算得到相似度, 所述相似度=相同字符的数量*相同字符的数量/(第一字符信息中 字符的数量*第二字符信息中字符的数量)。 5.根据权利要求4所述一种数据存储方法, 其特征在于, 所述对每组数据的所有文件名 进行分析 得到标记, 在每组数据上 添加所述标记的步骤, 具体包括: 提取出一组数据的所有 文件名的字符, 文件名总数量 值; 对每个字符出现的次数进行计数 得到所述字符数量 值; 将字符数量值除以文件名总数量值得到参考值, 当所述参考值大于第三预设值时, 参 考值对应的字符即为标记, 在每组数据上 添加所述标记。 6.根据权利要求1所述一种数据存储方法, 其特征在于, 所述根据 添加的标记对一 次压 缩数据进行二次压缩的步骤, 具体包括: 每隔预定时间, 获取 所有一次压缩数据对应的标记; 当若干个一次压缩数据的标记相同时, 将若干个一次压缩数据归为 一组;权 利 要 求 书 1/2 页 2 CN 114510496 A 2对一组一次压缩数据进行二次压缩。 7.一种数据存 储系统, 其特 征在于, 所述系统包括: 分类存储模块, 用于对上传数据的用户终端进行身份识别, 根据识别得到的身份信息 将所述上传数据存 储至对应部门的存 储模块中; 未压缩数据分组模块, 当存储模块中未压缩数据的存储量达到第一预设值时, 提取出 所有未压缩数据的文件名, 根据文件名对未压缩数据进行自动分组, 在每组数据中添加标 记; 以及 数据压缩模块, 用于对每一组的未压缩数据进行一次压缩形成一次压缩数据, 根据添 加的标记对一次压缩数据进行二次压缩。 8.根据权利要求7所述一种数据存储系统, 其特征在于, 所述未压缩数据分组模块包 括: 存储量监控单元, 用于实时监控存储模块中未压缩数据的存储量, 当未压缩数据的存 储量达到第一预设值时, 自动提取 出所有未压缩数据的文件名; 相似度计算单元, 用于对未压缩数据的文件名进行相似度计算, 将相似度达到第二预 设值的未压缩数据分为 一组; 以及 标记添加单元, 用于对每组数据的所有文件名进行分析得到标记, 在每组数据上添加 所述标记。 9.一种计算机设备, 其特征在于, 包括显示屏、 存储器、 处理器以及计算机程序, 其中所 述存储器中存储有计算机程序, 所述计算机程序被所述处理器执行时, 使得所述处理器执 行权利要求1 ‑6任一项权利要求所述数据存 储方法的步骤。 10.一种可读存储介质, 其特征在于, 所述可读存储介质上存储有计算机程序, 所述计 算机程序被处理器执行时, 使得所述处理器执行权利要求1 ‑6任一项权利要求所述数据存 储方法的步骤。权 利 要 求 书 2/2 页 3 CN 114510496 A 3

.PDF文档 专利 一种数据存储方法、系统、计算机设备及存储介质

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种数据存储方法、系统、计算机设备及存储介质 第 1 页 专利 一种数据存储方法、系统、计算机设备及存储介质 第 2 页 专利 一种数据存储方法、系统、计算机设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 22:43:30上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。