(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111566535.1
(22)申请日 2021.12.20
(71)申请人 广东电网有限责任公司
地址 510000 广东省广州市越秀区东 风东
路757号
申请人 广东电网有限责任公司电力调度控
制中心
(72)发明人 王峰 李一泉 邓旭阳 谭乾
索江镭 朱佳 刘世丹 温涛
(74)专利代理 机构 广州三环 专利商标代理有限
公司 44202
代理人 郭浩辉 许羽冬
(51)Int.Cl.
H04L 9/40(2022.01)
H04L 9/32(2006.01)G06K 9/62(2022.01)
(54)发明名称
基于HK-Means和安全性检测的可信数据传
输方法
(57)摘要
本发明公开了基于HK ‑Means和安全性检测
的可信数据传输方法。 该方法包括步骤: 获取第
一数据集, 判断第一数据集中的数据对象是否存
在缺失值, 划分缺失数据子集和完整数据子集;
对完整数据子集中的第一数据对象进行聚类划
分, 直至聚类划分的结果满足预设的第一条件时
结束聚类划分; 根据聚类划分的结果对缺失数据
子集中的第二数据对象进行缺失值填充, 得到填
充数据子集, 将填充数据子集和完整数据子集进
行合并, 得到第二数据集; 对第二数据集中进行
属性约简, 得到第三数据集; 将第三数据集的数
据包进行加密发送, 接收密文, 并对解密后的数
据包进行安全性检测。 本发明技术方案提高了电
力数据的传输效率和安全性。
权利要求书2页 说明书9页 附图1页
CN 114401116 A
2022.04.26
CN 114401116 A
1.一种基于 HK‑Means和安全性检测的可信数据传输方法, 其特 征在于,
包括以下步骤:
获取第一数据集, 判断所述第一数据集中的数据对象是否存在缺失值, 若是则将存在
缺失值的数据对象划入缺 失数据子集, 若否则将不存在缺失值的数据对象划入完整数据子
集; 所述第一数据集 为电力设备运行 数据集;
对所述完整数据子集中的第 一数据对象进行预处理后, 对所述完整数据子集中的第 一
数据对象进行聚类划分, 直至所述聚类划分的结果满足预设的第一条件时结束所述聚类划
分;
根据所述 聚类划分的结果对所述缺失数据子集中的第 二数据对象进行缺失值填充, 得
到填充数据子集, 将所述 填充数据子集和所述完整数据子集进行合并, 得到第二数据集;
对所述第二数据集中的第三数据对象进行属性约简, 得到第三数据集;
将所述第三数据集的数据包进行加密发送后, 接收所述数据包对应的密文, 并对解密
后的数据包进行安全性检测。
2.根据权利要求1所述的基于HK ‑Means和安全性检测的可信数据传输方法, 其特征在
于, 对所述完整数据子集中的第一数据对象进行聚类划分, 具体为:
将N个第一数据对象, 划分为N/2个簇, 并从所述N个第一数据对象中选择出各个簇的第
一簇中心, 计算其余第一数据对 象与各个第一簇中心的第一相似度, 将所述其余第一数据
对象划分至与其第一相似度最大的第一簇中心所在的簇中; 所述N为正整数; 所述N个第一
数据对象为所述完整数据子集中的第一数据对象;
计算各个簇的均值向量, 并根据各所述均值向量更新对应簇的第一簇中心, 得到各个
簇的第二簇中心。
3.根据权利要求2所述的基于HK ‑Means和安全性检测的可信数据传输方法, 其特征在
于, 直至所述聚类划分的结果满足预设的第一条件结束时所述聚类划分, 具体为:
计算当前的各个簇的第一簇中心和第二簇中心之间的第二相似度;
针对所述第 二相似度 大于第一预设阈值的簇, 将所述第 二相似度 大于第一预设阈值的
簇中的数据对 象进行合并后, 再次进行聚类划分和计算第二相似度, 直至各个簇的所述第
二相似度小于等于第一预设阈值;
针对所述第二相似度小于等于第一预设阈值的簇, 结束聚类划分。
4.根据权利要求3所述的基于HK ‑Means和安全性检测的可信数据传输方法, 其特征在
于, 根据所述完整数据子集的聚类划分结果对所述缺 失数据子集中的第二数据对象进 行缺
失值填充, 得到填充后的缺失数据子集, 具体为:
计算所述缺失数据子集的每个第二数据对象和所述完整数据子集的各个第二簇中心
之间的第三相似度, 取所述每个第二数据对象的最大第三相似度对应的第二簇中心所在的
簇为各个第二数据对象的参照簇;
针对每个第二数据对象, 根据所述第二数据对象的缺失值的属性和数据类型, 从所述
第二数据对象的参照簇中获取相应的填充值, 用所述填充值对所述第二数据对象的缺失值
进行填充, 得到填充数据子集。
5.根据权利要求4所述的基于HK ‑Means和安全性检测的可信数据传输方法, 其特征在
于, 根据所述第二数据对 象的缺失值的属 性和数据类型, 从所述第二数据对 象的参照簇中权 利 要 求 书 1/2 页
2
CN 114401116 A
2获取相应的填充值, 具体为:
当所述第二数据对象的缺失值的数据类型为数值型时, 取所述第 二数据对象的参照簇
中对应属性的平均值作为所述缺 失值的填充值; 当所述第二数据对象的缺失值的类型为离
散型时, 取所述第二数据对象的参照簇中对应属性出现次数最多的值作为所述缺 失值的填
充值。
6.根据权利要求5所述的基于HK ‑Means和安全性检测的可信数据传输方法, 其特征在
于, 对所述第二数据集中的第三数据对象进行属性约简, 得到第三数据集, 具体为:
初始化第一属性集, 根据所述第二数据集的条件属性和第三属性集的依赖度的大小,
选择所述第二数据集的部分条件属 性添加至所述第一属 性集, 得到第四属 性集; 所述第一
属性集为所述第二数据集的最小相对属性集合, 所述第三属性集为所述第二数据集的决策
属性的集 合;
根据所述第四属性集中的条件属性对所述第二数据集中的第三数据对象进行属性约
简, 得到第三数据集。
7.根据权利要求6所述的基于HK ‑Means和安全性检测的可信数据传输方法, 其特征在
于, 根据所述第二数据集中条件属 性和第三属 性集的依赖度的大小, 选择所述第二数据集
的部分条件属性添加至所述第一属性 集, 得到第四属性 集, 具体为:
计算第二属性集相对于第 三属性集的第 一依赖度; 所述第 二属性集为所述第 二数据集
的全部条件属性的集 合;
计算所述第 二属性集中每个条件属性相对于第 三属性集的第 三依赖度, 根据 所述第二
属性集中每个条件属性的第三依赖度的大小, 将所述第二属性集的每个条件属性进行降序
排列;
将所述第二属性集的条件属性根据 所述降序排列的顺序逐个添加至所述第 一属性集,
每添加一个所述第二属性集的条件属性至所述第一属性集后, 计算当前的第一属性集相对
于所述第三属性集的第二依赖度以及所述第一依赖度和所述第二依赖度之 间的差值, 直至
所述差值小于第二预设阈值时, 停止添加所述第二属 性集的条件属 性至所述第一属 性集,
并得到第四属性 集。
8.根据权利要求7所述的基于HK ‑Means和安全性检测的可信数据传输方法, 其特征在
于, 对所述完整数据子集中的第一数据对象进行 预处理, 具体为:
将所述完整数据子集中的第一数据对象转 化为无单位的Z‑SCORE分值。
9.根据权利要求8所述的基于HK ‑Means和安全性检测的可信数据传输方法, 其特征在
于, 将所述第三数据集的数据包进行加密发送, 具体为:
根据MD5加密算法将所述第三数据集的数据包映射成第一数字指纹, 根据AES对称加密
算法将所述数据包和第一数字指纹进行加密, 发送所述数据包和第一数字指纹的加密密
文。
10.根据权利要求1至9任一项所述的基于HK ‑Means和安全性检测的可信数据传输方
法, 其特征在于, 对所述数据包进行安全性检测, 具体为:
接收并解密所述加密密文, 得到所述数据包和第一数字指纹; 根据MD5加密算法计算得
到所述数据包映射的第二数字指纹;
对所述第一数字指纹和所述第二数字指纹进行一 致性检查。权 利 要 求 书 2/2 页
3
CN 114401116 A
3
专利 基于HK-Means和安全性检测的可信数据传输方法
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 23:35:11上传分享