专利 基于HK-Means和安全性检测的可信数据传输方法

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111566535.1 (22)申请日 2021.12.20 (71)申请人广东电网有限责任公司地址 510000 广东省广州市越秀区东风东路757号申请人广东电网有限责任公司电力调度控制中心 (72)发明人王峰　李一泉　邓旭阳　谭乾　索江镭　朱佳　刘世丹　温涛　 (74)专利代理机构广州三环专利商标代理有限公司 44202 代理人郭浩辉　许羽冬 (51)Int.Cl. H04L 9/40(2022.01) H04L 9/32(2006.01)G06K 9/62(2022.01) (54)发明名称基于HK-Means和安全性检测的可信数据传输方法 (57)摘要本发明公开了基于HK ‑Means和安全性检测的可信数据传输方法。该方法包括步骤：获取第一数据集，判断第一数据集中的数据对象是否存在缺失值，划分缺失数据子集和完整数据子集；对完整数据子集中的第一数据对象进行聚类划分，直至聚类划分的结果满足预设的第一条件时结束聚类划分；根据聚类划分的结果对缺失数据子集中的第二数据对象进行缺失值填充，得到填充数据子集，将填充数据子集和完整数据子集进行合并，得到第二数据集；对第二数据集中进行属性约简，得到第三数据集；将第三数据集的数据包进行加密发送，接收密文，并对解密后的数据包进行安全性检测。本发明技术方案提高了电力数据的传输效率和安全性。权利要求书2页说明书9页附图1页 CN 114401116 A 2022.04.26 CN 114401116 A 1.一种基于 HK‑Means和安全性检测的可信数据传输方法，其特征在于，包括以下步骤：获取第一数据集，判断所述第一数据集中的数据对象是否存在缺失值，若是则将存在缺失值的数据对象划入缺失数据子集，若否则将不存在缺失值的数据对象划入完整数据子集；所述第一数据集为电力设备运行数据集；对所述完整数据子集中的第一数据对象进行预处理后，对所述完整数据子集中的第一数据对象进行聚类划分，直至所述聚类划分的结果满足预设的第一条件时结束所述聚类划分；根据所述聚类划分的结果对所述缺失数据子集中的第二数据对象进行缺失值填充，得到填充数据子集，将所述填充数据子集和所述完整数据子集进行合并，得到第二数据集；对所述第二数据集中的第三数据对象进行属性约简，得到第三数据集；将所述第三数据集的数据包进行加密发送后，接收所述数据包对应的密文，并对解密后的数据包进行安全性检测。 2.根据权利要求1所述的基于HK ‑Means和安全性检测的可信数据传输方法，其特征在于，对所述完整数据子集中的第一数据对象进行聚类划分，具体为：将N个第一数据对象，划分为N/2个簇，并从所述N个第一数据对象中选择出各个簇的第一簇中心，计算其余第一数据对象与各个第一簇中心的第一相似度，将所述其余第一数据对象划分至与其第一相似度最大的第一簇中心所在的簇中；所述N为正整数；所述N个第一数据对象为所述完整数据子集中的第一数据对象；计算各个簇的均值向量，并根据各所述均值向量更新对应簇的第一簇中心，得到各个簇的第二簇中心。 3.根据权利要求2所述的基于HK ‑Means和安全性检测的可信数据传输方法，其特征在于，直至所述聚类划分的结果满足预设的第一条件结束时所述聚类划分，具体为：计算当前的各个簇的第一簇中心和第二簇中心之间的第二相似度；针对所述第二相似度大于第一预设阈值的簇，将所述第二相似度大于第一预设阈值的簇中的数据对象进行合并后，再次进行聚类划分和计算第二相似度，直至各个簇的所述第二相似度小于等于第一预设阈值；针对所述第二相似度小于等于第一预设阈值的簇，结束聚类划分。 4.根据权利要求3所述的基于HK ‑Means和安全性检测的可信数据传输方法，其特征在于，根据所述完整数据子集的聚类划分结果对所述缺失数据子集中的第二数据对象进行缺失值填充，得到填充后的缺失数据子集，具体为：计算所述缺失数据子集的每个第二数据对象和所述完整数据子集的各个第二簇中心之间的第三相似度，取所述每个第二数据对象的最大第三相似度对应的第二簇中心所在的簇为各个第二数据对象的参照簇；针对每个第二数据对象，根据所述第二数据对象的缺失值的属性和数据类型，从所述第二数据对象的参照簇中获取相应的填充值，用所述填充值对所述第二数据对象的缺失值进行填充，得到填充数据子集。 5.根据权利要求4所述的基于HK ‑Means和安全性检测的可信数据传输方法，其特征在于，根据所述第二数据对象的缺失值的属性和数据类型，从所述第二数据对象的参照簇中权　利　要　求　书 1/2 页 2 CN 114401116 A 2获取相应的填充值，具体为：当所述第二数据对象的缺失值的数据类型为数值型时，取所述第二数据对象的参照簇中对应属性的平均值作为所述缺失值的填充值；当所述第二数据对象的缺失值的类型为离散型时，取所述第二数据对象的参照簇中对应属性出现次数最多的值作为所述缺失值的填充值。 6.根据权利要求5所述的基于HK ‑Means和安全性检测的可信数据传输方法，其特征在于，对所述第二数据集中的第三数据对象进行属性约简，得到第三数据集，具体为：初始化第一属性集，根据所述第二数据集的条件属性和第三属性集的依赖度的大小，选择所述第二数据集的部分条件属性添加至所述第一属性集，得到第四属性集；所述第一属性集为所述第二数据集的最小相对属性集合，所述第三属性集为所述第二数据集的决策属性的集合；根据所述第四属性集中的条件属性对所述第二数据集中的第三数据对象进行属性约简，得到第三数据集。 7.根据权利要求6所述的基于HK ‑Means和安全性检测的可信数据传输方法，其特征在于，根据所述第二数据集中条件属性和第三属性集的依赖度的大小，选择所述第二数据集的部分条件属性添加至所述第一属性集，得到第四属性集，具体为：计算第二属性集相对于第三属性集的第一依赖度；所述第二属性集为所述第二数据集的全部条件属性的集合；计算所述第二属性集中每个条件属性相对于第三属性集的第三依赖度，根据所述第二属性集中每个条件属性的第三依赖度的大小，将所述第二属性集的每个条件属性进行降序排列；将所述第二属性集的条件属性根据所述降序排列的顺序逐个添加至所述第一属性集，每添加一个所述第二属性集的条件属性至所述第一属性集后，计算当前的第一属性集相对于所述第三属性集的第二依赖度以及所述第一依赖度和所述第二依赖度之间的差值，直至所述差值小于第二预设阈值时，停止添加所述第二属性集的条件属性至所述第一属性集，并得到第四属性集。 8.根据权利要求7所述的基于HK ‑Means和安全性检测的可信数据传输方法，其特征在于，对所述完整数据子集中的第一数据对象进行预处理，具体为：将所述完整数据子集中的第一数据对象转化为无单位的Z‑SCORE分值。 9.根据权利要求8所述的基于HK ‑Means和安全性检测的可信数据传输方法，其特征在于，将所述第三数据集的数据包进行加密发送，具体为：根据MD5加密算法将所述第三数据集的数据包映射成第一数字指纹，根据AES对称加密算法将所述数据包和第一数字指纹进行加密，发送所述数据包和第一数字指纹的加密密文。 10.根据权利要求1至9任一项所述的基于HK ‑Means和安全性检测的可信数据传输方法，其特征在于，对所述数据包进行安全性检测，具体为：接收并解密所述加密密文，得到所述数据包和第一数字指纹；根据MD5加密算法计算得到所述数据包映射的第二数字指纹；对所述第一数字指纹和所述第二数字指纹进行一致性检查。权　利　要　求　书 2/2 页 3 CN 114401116 A 3

专利 基于HK-Means和安全性检测的可信数据传输方法

专利基于HK-Means和安全性检测的可信数据传输方法