(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210573648.2
(22)申请日 2022.05.25
(65)同一申请的已公布的文献号
申请公布号 CN 114662157 A
(43)申请公布日 2022.06.24
(73)专利权人 湖南工商大 学
地址 410205 湖南省长 沙市岳麓 大道569号
(72)发明人 魏建好 叶松涛 李小龙 李闯
吴鑫
(74)专利代理 机构 长沙轩荣专利代理有限公司
43235
专利代理师 汪金连
(51)Int.Cl.
G06F 21/62(2013.01)审查员 李婧雯
(54)发明名称
社交文本数据流的块压缩感知不可区分性
保护方法及装置
(57)摘要
本发明提供了一种社交文本数据流的块压
缩感知不可区分性保护方法及装置, 包括: 步骤
1, 对社交文本数据流进行采集和预处理, 构建一
个包含多属性的数值型矩阵; 步骤2, 采用多属性
社交数据流自适应分块压缩方法对多属性数值
型矩阵进行自适应分块和压缩处理; 步骤3, 构建
面向压缩属性块矩阵的HST动态索引树; 步骤4,
对压缩属性块矩阵进行本地化扰动隐私保护, 外
包扰动的社交文本数据流给服务器进行挖掘分
析; 实现社交文本数据流的本地隐私保护和数据
可用性之间的平衡。 此外, 本发明还提供了相应
的保护装置, 推动社交网络平台高质量安全应用
推广。
权利要求书2页 说明书9页 附图3页
CN 114662157 B
2022.08.26
CN 114662157 B
1.一种社交文本数据流的块压缩感知不可区分性保护方法, 其特 征在于, 包括:
步骤1, 对社交文本数据流进行采集和预处 理, 构建一个包 含多属性的数值型矩阵;
步骤2, 基于多属性社交数据流自适应分块压缩方法对多属性数值型矩阵进行自适应
分块和压缩处 理;
步骤3, 构建面向压缩属性 块矩阵的HST动态索引树;
步骤4, 计算压缩属性块矩阵在HST动态索引树中具有公共祖先的叶子节点的扰动概率
和
, 扰动概率需满足下式,
其中,
为任意两个压缩属性块矩阵
和
映射的叶子节点, 与所述节点
的具
有公共祖先的叶子节点集为
, 设定
为公共祖先距离, 给所述节点
中扰动的叶子节点
赋予权重
, 所述公共祖先叶子节点集
有
个叶子节点, 则 与节点
具有公共祖先的所有叶子节点的总权重为
,
,
为隐私预算, 社交用户
在本地根据属性块矩阵的扰动概率选择具有高可用性的扰动叶子节点, 并外包给社交服务
器执行挖掘分析。
2.根据权利要求1所述的社交文本数据流的块压缩感知不可区分性保护方法, 其特征
在于, 所述 步骤1包括:
采用n‑grams算法提取单个时间点的属性关键词, 并计算属性关键词权重, 产生该 时间
点的属性行向量,则整个社交文本型数据流转化为数值型矩阵, 构建一个包含多属 性的数
值型矩阵。
3.根据权利要求1所述的社交文本数据流的块压缩感知不可区分性保护方法, 其特征
在于, 所述 步骤2包括:
基于块压缩感知方法, 计算数值型矩阵的稀疏度均值偏差, 并动态调整阈值, 根据计算
出的稀疏度均值偏差进行自适应分块构造块测量矩阵, 基于块测量矩阵将高维的多属性数
值型矩阵压缩成低维的属性 块矩阵。
4.根据权利要求1所述的社交文本数据流的块压缩感知不可区分性保护方法, 其特征
在于, 所述 步骤3包括:
根据属性块矩阵之间的欧式距离对其进行聚类, 构建HST动态索引树结构, 基于所述
HST动态索引树, 在本地实现将个人 社交文本数据映射到 HST动态索引树的叶子节点中。
5.一种社交文本数据流的块压缩感知不可区分性保护装置, 其特征在于, 包括文本处
理模块、 数据流自适应分块压缩 模块、 HST动态索引模块以及基于PC 机搭建的社交服 务器;
所述文本处理模块, 用于对社交文本数据流进行采集和预处理, 构建一个包含多属性
的数值型矩阵;权 利 要 求 书 1/2 页
2
CN 114662157 B
2所述数据流自适应分块压缩模块, 基于多属性社交数据流自适应分块压缩方法对多属
性数值型矩阵进行自适应分块和压缩得到属性 块矩阵;
所述HST动态索引模块, 基于聚类算法, 根据欧式距离, 将历史的压缩属性块矩阵流进
行聚类, 构建HST动态索引树, 用于将个人的压缩属性块矩阵映射到HST动态索引树的叶子
节点中, 构建和更新本地索引;
社交用户通过个人移动设备对社交APP客户端产生的多属性社交文本数据流进行采
集, 通过所述文本处理模块、 数据流自适应分块压缩模块产生压缩属性块矩阵, 基于历史的
压缩属性块矩阵, 构造HST动态索引模块后, 基于所述HST动态索引模块的块压缩感知将压
缩属性块矩阵映射的叶子节点进 行扰动, 并外包扰动的叶子节点给社 交服务器进 行挖掘并
分析, 所述社交服 务器将挖掘分析 结果推荐给 社交用户。权 利 要 求 书 2/2 页
3
CN 114662157 B
3
专利 社交文本数据流的块压缩感知不可区分性保护方法及装置
安全报告 >
其他 >
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 思考人生 于 2024-02-07 20:39:03上传分享