(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210370986.6
(22)申请日 2022.04.08
(71)申请人 中国电信股份有限公司
地址 100033 北京市西城区金融大街31号
(72)发明人 谭涵秋 宋捷
(74)专利代理 机构 北京律智知识产权代理有限
公司 11438
专利代理师 孙宝海
(51)Int.Cl.
G06F 16/23(2019.01)
G06K 9/62(2022.01)
(54)发明名称
数据处理方法及装置、 设备、 计算机可读存
储介质
(57)摘要
本申请的实施例揭示了一种数据处理方法
及装置、 设备、 计算机可读存储介质。 该方法包
括: 将测量报告数据中的特征数据输入至训练好
的自编码器模 型中, 得到特征数据对应的重构误
差值; 若重构误差值大于预设误差阈值, 则将特
征数据与预设存储库中含有的异常特征数据进
行偏离比对, 得到特征数据相对于异常特征数据
的偏离率; 基于偏离率与预设偏离阈值的关系,
确定特征数据表征异常的情况; 若特征数据表征
存在新的异常, 则将特征数据存储至预设存储库
中。 该方法由于利用了自编码器模型, 通过重构
误差值, 能准确确定出测量报告数据中的异常特
征数据。
权利要求书2页 说明书15页 附图5页
CN 114722061 A
2022.07.08
CN 114722061 A
1.一种数据处 理方法, 其特 征在于, 包括:
将测量报告数据中的特征数据输入至训练好的自编码器模型中, 得到所述特征数据对
应的重构误差值;
若所述重构误差值大于预设误差 阈值, 则将所述特征数据与 预设存储库中含有的异常
特征数据进行偏离比对, 得到所述特 征数据相对于所述异常特 征数据的偏离率;
基于所述偏离率与预设偏离阈值的关系, 确定所述特 征数据表征异常的情况;
若所述特 征数据表征存在新的异常, 则将所述特 征数据存储至所述预设存 储库中。
2.根据权利要求1所述的方法, 其特征在于, 在所述将测量报告数据中的特征数据输入
至训练好的自编码器模型中, 得到所述特 征数据对应的重构误差值之前, 所述方法还 包括:
构建初始自编码器模型, 并对从测量报告样本数据中提取到的特征数据进行预处理,
得到特征样本数据;
将所述特征样本数据输入至所述初始自编码器模型中, 得到所述特征样本数据的相似
度系数;
若所述特征样本数据的相似度系数小于预设相似度阈值, 则利用所述特征样本数据对
所述初始自编码器模型进行训练, 得到所述训练好的自编码器模型。
3.根据权利要求2所述的方法, 其特征在于, 所述对从测量报告样本数据中提取到的特
征数据进行 预处理, 得到特 征样本数据, 包括:
对从测量报告样本数据中提取到的特征数据进行聚类处理, 得到多个类别的聚类特征
数据;
分别对所述多个类别的聚类特征数据进行二分类处理, 得到每个类别的聚类特征数据
的贡献度;
将贡献度大于预设 贡献阈值的聚类特 征数据确定为所述特 征样本数据。
4.根据权利要求2所述的方法, 其特征在于, 所述将所述特征样本数据输入至所述初始
自编码器模型中, 得到所述特 征样本数据的相似度系数, 包括:
将所述特征样本数据输入至所述初始自编码器模型中, 得到所述特征样本数据的异常
度, 以及所述特 征样本数据与所述初始自编码器模型中标准异常特 征数据的异常距离;
基于所述异常度与所述异常距离计算得到所述特 征样本数据的相似度系数。
5.根据权利要求4所述的方法, 其特征在于, 所述基于所述异常度与 所述异常距离计算
得到所述特 征样本数据的相似度系数, 包括:
获取所述异常度对应的权 重值, 以及所述异常距离对应的权 重值;
将所述异常度与所述异常度对应的权重值进行求乘积运算, 得到第一值, 以及将所述
异常距离与所述异常距离对应的权 重值进行求乘积运 算, 得到第二 值;
对所述第一 值与所述第二 值进行求和运 算, 得到所述特 征样本数据的相似度系数。
6.根据权利要求1至5中任一项所述的方法, 其特征在于, 所述基于所述偏离率与预设
偏离阈值的关系, 确定所述特 征数据表征异常的情况, 包括:
将所述偏离率与所述预设偏离阈值进行比较;
若所述偏离率大于所述预设偏离率阈值, 则确定所述特 征数据表征存在新的异常;
若所述偏离率小于或者等于所述预设偏离率阈值, 则确定所述特征数据表征不存在新
的异常。权 利 要 求 书 1/2 页
2
CN 114722061 A
27.根据权利要求1至5中任一项所述的方法, 其特征在于, 所述将所述特征数据存储至
所述预设存 储库中, 包括:
确定针对所述特征数据所表征的新的异常对应的异常处理方案; 其中, 所述异常处理
方案用于处 理所述异常以恢复正常运行;
将所述异常处 理方案与所述特 征数据关联存 储至所述预设存 储库中。
8.一种数据处 理装置, 其特 征在于, 包括:
获取模块, 被配置为将测量报告数据中的特征数据输入至训练好的自编码器模型中,
得到所述特 征数据对应的重构误差值;
比对模块, 被配置为若所述重构误差值大于预设误差阈值, 则将所述特征数据与预设
存储库中含有的异常特征数据进 行偏离比对, 得到所述特征数据相对于所述异常特征数据
的偏离率;
确定模块, 被配置为基于所述偏离率与预设偏离阈值的关系, 确定所述特征数据表征
异常的情况;
更新模块, 被配置为若所述特征数据表征存在新的异常, 则将所述特征数据存储至所
述预设存 储库中。
9.一种电子设备, 其特 征在于, 包括:
控制器;
存储器, 用于存储一个或多个程序, 当所述一个或多个程序被所述控制器执行时, 使得
所述控制器实现如权利要求1至7中任一项所述的方法。
10.一种计算机可读存储介质, 其特征在于, 其上存储有计算机可读指令, 当所述计算
机可读指令被 计算机的处 理器执行时, 使计算机执 行权利要求1至7中任一项所述的方法。权 利 要 求 书 2/2 页
3
CN 114722061 A
3
专利 数据处理方法及装置、设备、计算机可读存储介质
安全报告 >
其他 >
文档预览
中文文档
23 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 思考人生 于 2024-02-24 08:50:02上传分享