全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211247608.5 (22)申请日 2022.10.12 (71)申请人 中山大学 地址 510275 广东省广州市新港西路13 5号 (72)发明人 南雨宏 杨培福 黄佳颖 张玉亮  郑子彬  (74)专利代理 机构 北京集佳知识产权代理有限 公司 11227 专利代理师 李伟贤 (51)Int.Cl. G06F 21/62(2013.01) G06F 40/242(2020.01) G06F 40/295(2020.01) (54)发明名称 一种物联网设备敏感数据的识别方法、 装置 及电子设备 (57)摘要 本发明公开了一种物联网设备敏感数据的 识别方法、 装置及电子设备, 方法包括: 从物联网 设备的描述文本信息中提取多个物联网敏感数 据项并构建物联网敏感语义词典; 根据语义信息 从物联网应用程序的源代码中筛选出若干物联 网代码块, 物联网代码块与物联网设备在语义上 相关; 根据物联网敏感语义词典识别出各物联网 代码块中包含的若干物联网敏感数据点, 物联网 敏感数据点是与物联网设备语义相关的文本标 签; 从物联网应用程序的源代码中查找到与各物 联网敏感数据点对应的别名标签组, 将所有别名 标签和所有物联网敏感数据点关联的程序变量 作为物联网设备敏感数据。 本发 明能够支持大规 模、 自动化、 高效准确地识别出物联网设备所包 含的敏感数据。 权利要求书2页 说明书12页 附图2页 CN 115544567 A 2022.12.30 CN 115544567 A 1.一种物联网设备 敏感数据的识别方法, 其特 征在于, 包括: 从物联网设备的描述文本信 息中提取多个物联网敏感数据项, 根据所述多个物联网敏 感数据项构建物联网敏感语义词典; 根据语义信 息从物联网应用程序的源代码中筛选出若干物联网代码块, 所述物联网代 码块与所述物联网设备在语义上相关; 根据所述物联网敏感语义词典识别出各所述物联网代码块中包含的若干物联网敏感 数据点, 所述物联网敏感数据点是与所述物联网设备语义相关的文本标签; 从所述物联网应用程序的源代码中查找到与各所述物联网敏感数据点对应的别名标 签组, 将所有 所述物联网敏感数据点对应的别名标签组和所述若干物联网敏感数据点关联 的程序变量作为物联网设备敏感数据, 所述别名标签组是所述物联网敏感数据点在所述物 联网应用程序的源代码中的多个副本和/或多个引用。 2.根据权利要求1所述的物联网设备敏感数据的识别方法, 其特征在于, 从物联网设备 的描述文本信息中提取多个物联网敏感数据项包括: 利用命名实体识别模型从物联网设备的描述文本信 息中提取多个物联网敏感数据项, 所述描述文本信息至少包含物联网设备的新闻报道、 物联网应用程序的代码描述及开发者 文档。 3.根据权利要求1所述的物联网设备敏感数据的识别方法, 其特征在于, 根据语义信 息 从物联网应用程序的源代码中筛 选出若干物联网代码块包括: 将物联网应用程序的源代码切分为多个语义代码块, 各所述语义代码块中包含至少一 个文本标签, 所述文本标签具有语义信息; 根据各所述语义代码块中包含的文本标签筛选出与物联网设备语义相关的物联网代 码块。 4.根据权利要求3所述的物联网设备敏感数据的识别方法, 其特征在于, 根据 各所述语 义代码块中包 含的文本标签筛 选出与物联网设备语义相关的物联网代码块包括: 提取各所述语义代码块中的所有 文本标签; 将与各所述文本标签有语义关联的的文本标签扩展到各所述语义代码中, 以丰富各所 述语义代码块的语义; 将各所述语义代码块中的所有文本标签构 成一个文本标签列表, 对所述文本标签列表 进行预处理; 将预处理后的所述文本标签列表转化为数值向量, 将所述数值向量输入到训练好的文 本分类模型中得到物联网代码块。 5.根据权利要求1所述的物联网设备敏感数据的识别方法, 其特征在于, 所述文本分类 模型为: FastText模型。 6.根据权利要求1所述的物联网设备敏感数据的识别方法, 其特征在于, 根据 所述物联 网敏感语义词典识别出 各所述物联网代码块中包 含的若干物联网敏感数据点包括: 计算各所述物联网代码块中的所有文本标签与所述物联网敏感语义词典中的各所述 物联网敏感数据项之间的相似度; 若所述相似度大于预设的相似度阈值, 则所述文本标签为物联网敏感数据点; 否则, 所权 利 要 求 书 1/2 页 2 CN 115544567 A 2述文本标签不是物联网敏感数据点。 7.根据权利要求6所述的物联网设备敏感数据的识别方法, 其特征在于, 所述预设的相 似度阈值 为70%。 8.根据权利要求1所述的物联网设备敏感数据的识别方法, 其特征在于, 从所述物联网 应用程序的源代码中查找到与各 所述物联网敏感数据点对应的别名标签组包括: 利用基于语义信 息的变量关联组件, 从所述物联网应用程序的源代码中查找到各所述 物联网敏感数据点的多个副本和/或多个引用。 9.一种物联网设备 敏感数据的识别装置, 其特 征在于, 包括: 敏感语义词典构建模块, 用于从物联网设备的描述文本信 息中提取多个物联网敏感数 据项, 根据所述多个物联网敏感数据项构建物联网敏感语义词典; 物联网代码筛选模块, 用于根据语义信 息从物联网应用程序的源代码中筛选出若干物 联网代码块, 所述物联网代码块与所述物联网设备在语义上相关; 敏感数据点识别模块, 用于根据所述物联网敏感语义词典识别出各所述物联网代码块 中包含的若干物 联网敏感数据点, 所述物联网敏感数据点是与所述物联网设备语义相关的 文本标签; 设备敏感数据识别模块, 用于从所述物联网应用程序的源代码中查找到与 各所述物联 网敏感数据点对应的别名标签组, 将所有 所述物联网敏感数据点对应的别名标签组和所述 若干物联网敏感数据点关联的程序变量作为物联网设备敏感数据, 所述别名标签组是所述 物联网敏感数据点在所述物联网应用程序的源代码中的多个副本和/或多个引用。 10.一种电子设备, 其特 征在于, 包括: 存储器, 用于保存计算机程序; 处理器, 用于执行所述计算机程序, 以实现如权利要求1至8任一项所述的物联网设备 敏感数据的识别方法。权 利 要 求 书 2/2 页 3 CN 115544567 A 3

.PDF文档 专利 一种物联网设备敏感数据的识别方法、装置及电子设备

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种物联网设备敏感数据的识别方法、装置及电子设备 第 1 页 专利 一种物联网设备敏感数据的识别方法、装置及电子设备 第 2 页 专利 一种物联网设备敏感数据的识别方法、装置及电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 02:12:38上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。