(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210566453.5 (22)申请日 2022.05.25 (71)申请人 江苏师范大学 地址 221116 江苏省徐州市铜山 新区 (72)发明人 王娜娜  (51)Int.Cl. G06F 21/62(2013.01) G06N 7/00(2006.01) (54)发明名称 满足差分隐私的轨 迹发布方法 (57)摘要 本发明提出一种满足差分隐私的轨迹发布 方法, 该方法将原始轨迹表示为相邻网格的锚点 轨迹, 利用前缀树和马尔科夫过程为其构建模 型, 通过在前缀树和马尔科夫过程的转移矩阵中 添加拉普拉斯噪声以满足差分隐私, 然后从含噪 声的模型中生成待发布的轨迹数据。 一方面, 本 发明利用前缀树和马尔科夫过程为锚点轨迹建 模, 能保持更多的原始数据特征, 获得较高的数 据可用性; 另 一方面, 本发明为前缀树和马尔科 夫过程的转移矩 阵设计了添加拉普拉斯噪声的 方法, 满足差分隐私, 能够保护轨迹数据的隐私, 是一种保障轨迹数据的安全可靠发布和应用的 实用算法。 权利要求书3页 说明书5页 附图1页 CN 114925396 A 2022.08.19 CN 114925396 A 1.一种满足差分隐私的轨 迹发布方法, 其特 征在于: (1)生成锚点轨 迹; 将轨迹数据集所在空间范围划分为若干网格, 每个网格的中心点称为一个锚点, 将轨 迹数据映射 为相邻网格的锚点序列, 生成锚点轨 迹; 假设轨迹数据集D={Tri|i=0,1, …,|D|‑1}由|D|条轨迹组成, |D|表示该轨迹数据集D 的轨迹数目, 为轨迹数据集D的第i条轨迹, 其包含t个采样点, 为Tri的第j个采样点, 和 分别为采样点 的经度和 纬度; 将轨迹数据集D的每个轨迹的采样点均映射为锚点; 将锚点轨迹数据集记为 为轨迹Tri对应的锚点轨迹, |Dc|为锚点轨迹数据集Dc 的轨迹数目; 若轨迹 中相邻的锚点位于非相邻的网格 中, 则通过插值的方法, 使得锚点轨 迹 中相邻的锚点均为相邻网格的锚点; 向轨迹 末尾添加轨迹结束标志; 将锚点轨迹 记 为 为 的第j个元素(锚点或轨迹结束标志), 为轨迹 中元 素的个数; (2)构造前缀 树并添加噪声; 将步骤(1)中锚点轨迹数据集Dc的轨迹依据相同前缀进行分组, 构造前缀树PT, 并向其 添加拉普拉斯噪声, 以满足差分隐私; (3)构造马尔科 夫过程转移矩阵并添加噪声; 依据步骤(1)中锚点轨 迹数据集Dc, 构造马尔科 夫过程转移矩阵Q, 以满足差分隐私; (4)生成待发的布轨 迹数据; 利用步骤(2)构造的前缀树PT和步骤(3)构造的马尔科夫过程转移矩阵Q, 生成待发布 轨迹数据。 2.根据权利要求1所述的一种 满足差分隐私的轨迹发布方法, 其特征在于: 将轨迹数据 集D的每个轨迹的采样点映射 为锚点, 具体步骤如下: (1.1)将轨迹数据集D所在空间范围记为矩形R, 该矩形R左下顶点和右上顶点坐标分别 记为(left,b ottom)和(right,b ottom); 将矩形R划分为uh×uw个网格, uh为网格的行数, uw 为网格的列数; 将网格 集合记为Cell={celli,j|i=0,1, …,uh‑1,j=0,1, …,uw‑1},celli,j 为第i行第j列的网格; 将网格celli,j的锚点记为ci,j, 锚点集合记为AP={ci,j|i=0,1, …, uh‑1,j=0,1, …,uw‑1}; (1.2)假设轨迹采样点 位于网格cellrow,col,row=0,1, …,uh‑1,col=0, 1,…,uw‑1, 则row和col的计算方法如下: 锚点crow,col为轨迹采样点 映射的锚点。 3.根据权利要求1所述的一种满足差分隐私的轨迹发布方法, 其特征在于: 定义前缀 为: 假设S=p0p1…p|s|‑1为含有|S|个锚点的序列, pi(i=1,2, …,|S|‑1)为S的第i个锚点,S ′权 利 要 求 书 1/3 页 2 CN 114925396 A 2=p0′p1′ …p|s′|‑1′为含有|S ′|个锚点的序列, 当且仅当|S ′|≤|S|且 p′i=pi 时, S′为S的前缀。 4.根据权利要求1所述的一种 满足差分隐私的轨迹发布方法, 其特征在于: 定义前缀树 为: 将待生成的前缀树记 为PT=(V,E,Root), 其中, V为前缀树PT的结点集合, 每个结点都与 一个前缀相关联, 并保存着该前缀的计数; E为前缀树PT的边集合, 表 示结点间的连接 关系, Root为前缀树PT的虚拟根结点; 假设结点v为前缀树PT的一个结点, 将与其关联的前缀记 为 prefix(v,P T); 每个结点v∈V都保存一个二元组(tr(v),c(v)), 其中tr(v)表示锚点轨迹数 据集Dc前缀为pr efix(v,PT)的轨迹集合, 其数目为|tr(v)|; c(v)表示添加噪声后的|tr(v) |; 将PT的高度记为h, 虚拟根结点Ro ot位于PT的第0层, 最高层为第h ‑1层。 5.根据权利要求1所述的一种 满足差分隐私的轨迹发布方法, 其特征在于: 将锚点轨迹 数据集Dc的轨迹依据相同前缀进行分组, 构造前缀树PT, 并向其添加拉普拉斯噪声, 具体步 骤如下: (2.1)构建空前缀 树PT; (2.2)在前缀 树PT的第1层, 为锚点 集合AP的每 个锚点生成一个结点; (2.3)按照如下公式, 为第i(i =1,2,…,h‑1)层的每 个结点v∈V计算 其c(v), c(v)=|t r(v)|+Lap(1/ εp,i), 其中, δ为可调参数, εp(0<εp<1)为分配给前缀树PT构造过程的隐 私预算, εp,i为分配给前缀树PT第i层结点的隐私预算, Lap(1/εp,i)为服从拉普拉斯分布的 随机数, 该拉普拉斯分布的密度函数为 若c(v)>1, 则不为该结点v生成子结点; 否则, 依据其关联前缀prefix(v,PT)末尾锚点 的相邻网格的锚点和轨 迹结束标志, 为结点v生成子结点; (2.4)重复步骤(2.3)直至前缀 树PT达到最大高度h; (2.5)将c(Root)置为|D|, 按照从顶至下的顺序, 利用如下公式, 为前缀树PT第i(i=1, 2,…,h‑1)层的每 个结点v∈V更新 其c(v), 其中, par(v)为结点v的父 结点, children(par(v) )为par(v)的子结点 集合。 6.根据权利要求1所述的一种满足差分隐私的轨迹发布方法, 其特征在于: 将长度为m 的锚点序列称为m ‑gram; 锚点轨迹数据集Dc每个m‑gram均由相邻网格的锚点构成; 将锚点 轨迹数据集Dc不同m‑gram的数目记为Fr。 7.根据权利要求1所述的一种 满足差分隐私的轨迹发布方法, 其特征在于: 依据锚点轨 迹数据集Dc, 构造马尔科 夫过程转移矩阵Q, 具体步骤为: (3.1)初始化矩阵FM和 FM={FMk,j=0|k=0,1, …,Fr‑1,j=0,1, …,uh×uw}, 其中, FMk,j为矩阵FM第k行第j列的元素; 为矩阵 第k行第j列的元素; 矩阵FM每一行均与一个m ‑gram对应, 每一列均与一个锚点或 轨迹结束标志对应; 假设rk为矩阵FM第k行对应的m ‑gram, nj为矩阵FM第j列对 应的锚点或轨 迹结束标志, 则rknj为连接rk和nj得到的(m+1) ‑gram, 元素FMk,j用于存储rknj在锚点轨迹数权 利 要 求 书 2/3 页 3 CN 114925396 A 3

.PDF文档 专利 满足差分隐私的轨迹发布方法

安全报告 > 其他 > 文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 满足差分隐私的轨迹发布方法 第 1 页 专利 满足差分隐私的轨迹发布方法 第 2 页 专利 满足差分隐私的轨迹发布方法 第 3 页
下载文档到电脑,方便使用
本文档由 思考人生2024-02-07 20:39:02上传分享
给文档打分
您好可以输入 255 个字符
网站域名是多少( 答案:github5.com )
评论列表
  • 暂时还没有评论,期待您的金玉良言
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。