(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210955201.1
(22)申请日 2022.08.10
(65)同一申请的已公布的文献号
申请公布号 CN 115033187 A
(43)申请公布日 2022.09.09
(73)专利权人 蓝深远望科技股份有限公司
地址 214000 江苏省无锡市滨湖区科教软
件园7号楼
(72)发明人 秦书进 宋朝钦 蒋燕岚 李斌
严磊
(74)专利代理 机构 北京神州信德知识产权代理
事务所(普通 合伙) 11814
专利代理师 朱俊杰
(51)Int.Cl.
G06F 3/06(2006.01)
G06F 11/14(2006.01)
G06F 16/23(2019.01)
G06F 16/25(2019.01)
G06F 21/60(2013.01)(56)对比文件
CN 103220293 A,2013.07.24
CN 114448732 A,202 2.05.06
CN 103106152 A,2013.0 5.15
CN 112948171 A,2021.0 6.11
CN 111158613 A,2020.0 5.15
CN 106886376 A,2017.0 6.23
CN 107315 547 A,2017.1 1.03
CN 111309254 A,2020.0 6.19
CN 110062356 A,2019.07.26
CN 108416 054 A,2018.08.17
CN 1043176 69 A,2015.01.28
CN 112783445 A,2021.0 5.11
CN 108536552 A,2018.09.14
CN 113157215 A,2021.07.23
CN 111475108 A,2020.07.31
WO 2010006127 A1,2010.01.14
US 2020073560 A1,2020.0 3.05
审查员 薛嘉成
(54)发明名称
一种基于大数据的分析 管理方法
(57)摘要
本发明公开了一种基于大数据的分析管理
方法, 其中所述方法包括: 采集数据; 确定 所述数
据的数据类型; 对数据进行整合统一; 基于整合
统一后的所述数据的内容, 为所述数据设置第一
属性标识; 当所述第一属性标识不同时, 采用不
同的存储 方式; 基于第一属性标识和所述数据的
访问历史信息, 更新所述数据设置的第二属性标
识或第三属性标识; 基于第三属性标识或第二属
性标识, 对所述数据进行更新存储。 本发明使得
不同的类型的数据具备不同的访问权限、 响应时
间和访问资源, 从而有效地对数据进行管理, 保
障了用户需求与信息安全的平衡性。
权利要求书2页 说明书8页 附图2页
CN 115033187 B
2022.11.08
CN 115033187 B
1.一种基于大 数据的分析 管理方法, 其特 征是, 包括以下步骤:
采集数据;
确定所述数据的数据类型;
基于所述数据的不同数据类型采用相应数据标准 化策略进行 标准化处理;
对标准化处理后的数据进行整合统一;
基于整合统一后的所述数据的内容, 为所述数据设置第一属性标识;
当所述第一属性标识表示所述数据为机密信 息时, 将所述数据采用第 一存储策略进行
集中存储;
当所述第一属性标识表示所述数据为普通信 息时, 将所述数据采用第 二存储策略进行
分布式存 储;
当所述数据为机密信息时, 基于所述数据的访 问历史信息, 更新所述数据设置的第二
属性标识;
当所述数据为普通数据时, 基于所述数据的访 问历史信息, 更新所述数据设置的第三
属性标识, 其中所述第三属性标识为该 数据的备份数;
当所述第二属性标识大于第一阈值时, 对所述数据采用安全芯片进行鉴权存 储;
基于所述第三属性标识, 对所述数据采用多备份边 缘分布式存 储;
其中, 所述基于所述第三属性标识, 对所述数据采用多备份边缘分布式存储, 具体包
括:
统计所述数据的访问频率, 计算所述数据的访问概 率;
获取所述数据的流行度值;
基于所述 流行度值和访问概 率, 获取所述数据的备份数;
基于所述数据备份数、 分布式多个服务器的相应剩余存储容量, 确定所述数据在各台
服务器中的分布。
2.如权利要求1所述基于大数据的分析管理方法, 其特征是, 其中所述数据类型包括:
结构化数据、 流数据、 图片文本数据、 非结构化数据。
3.如权利要求1所述基于大数据的分析管理方法, 其特征是, 其中所述整合统一包括将
标准化处理后的数据按用户需求进行格式转换, 得到格式转换后的数据。
4.如权利要求1所述基于大数据的分析管理方法, 其特征是, 其中所述第 一存储策略为
将所述数据存 储至中央核心服 务器, 仅能通过IP地址进行访问。
5.如权利要求1所述基于大数据的分析管理方法, 其特征是, 其中所述第 二存储策略为
利用元数据映射方式, 将整合统一后的数据映射到 HDFS分布式存 储系统中的逻辑空间。
6.如权利要求1所述基于大数据的分析管理方法, 其特征是, 其中所述当所述第 二属性
标识大于第一阈值时, 对所述数据采用安全芯片进行鉴权存 储, 包括:
建立客户端与安全芯片之间的通信连接;
从所述安全芯片中获取与中央核心服 务器对应的鉴权信息;
将所述鉴权信息发送至所述中央核心服务器; 其中, 所述鉴权信息用于所述中央核心
服务器对所述 客户端进行认证。
7.如权利要求6所述基于大数据的分析管理方法, 其特征是, 其中客户端将 从安全芯片
中获取的鉴权信息发送至中央核心服务器, 然后, 中央核心服务器根据客户端发送的鉴权权 利 要 求 书 1/2 页
2
CN 115033187 B
2信息对客户端进行认证, 如果认证通过, 客户端 可以访问中央核心服务器, 如果认证没有通
过, 则客户端不可以访问中央核心服 务器。
8.如权利要求1所述基于大数据的分析管理方法, 其特征是, 其中假定存在N台服务器,
所述数据的备份数为k, 所述数据的访问概率为p, 所述数据的流行度值为a, 第i台服务器的
剩余存储容量为Si, 则
k=a/p;
若k>N, 则将k设置为 N;
若k≤N, 则k=a/p;
当k≤N时, 则计算所有服务器在特定时间内的平均响应时间, 选择平均响应时间最短
的排名前k个服 务器, 在相应服 务器中存 储所述数据的一个备份。权 利 要 求 书 2/2 页
3
CN 115033187 B
3
专利 一种基于大数据的分析管理方法
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-07 12:40:11上传分享