(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210017652.0
(22)申请日 2022.01.07
(71)申请人 中国电力科 学研究院有限公司
地址 100192 北京市海淀区清河小营东路
15号
(72)发明人 王亚男 庞宇航 潘娟 高炜
刘琼 温昊 任佳星 刘伟
高凯强
(74)专利代理 机构 北京中巡通大知识产权代理
有限公司 1 1703
代理人 文骊鹍
(51)Int.Cl.
G06F 16/906(2019.01)
G06F 16/901(2019.01)
G06F 16/36(2019.01)G06F 16/31(2019.01)
G06Q 50/06(2012.01)
G06Q 50/30(2012.01)
(54)发明名称
电力通信业务数据中站点聚类方法、 系统、
设备及介质
(57)摘要
本发明属于电力系统自动化领域, 公开了一
种电力通信业务数据中站点聚类方法、 系统、 设
备及介质, 包括: 获取电力系统的路由知识图谱;
获取所述路由知识 图谱中各站点的高维嵌入表
示; 搜索各站点的高维嵌入表 示中与当前站点的
高维嵌入表 示最接近的高维嵌入表 示, 得到当前
站点的最接近站点; 当当前站点的最接近站点的
最接近站点为当前站点时, 将当前站点与当前站
点的最接近站点聚合为同类站点。 有效消除电力
系统的业务路由信息中的站点冗余, 规范路由信
息中的站点信息, 规范由不同业务人员录入的信
息偏差, 在一定程度上完成数据清洗, 且不需要
先验的站点名称基准数据, 极大的降低了使用难
度。
权利要求书2页 说明书9页 附图3页
CN 114357268 A
2022.04.15
CN 114357268 A
1.一种电力通信业 务数据中站点聚类方法, 其特 征在于, 包括:
获取电力系统的路由知识图谱;
获取所述路由知识图谱中各站点的高维嵌入表示;
搜索各站点的高维嵌入表示中与当前站点的高维嵌入表示最接近的高维嵌入表示, 得
到当前站点的最接 近站点;
当当前站点的最接近站点的最接近站点为当前站点 时, 将当前站点与当前站点的最接
近站点聚合 为同类站点。
2.根据权利要求1所述的电力通信业务数据中站点 聚类方法, 其特征在于, 所述获取电
力系统的路由知识图谱的具体方法为:
获取电力系统的业 务路由数据并进行语义分割, 得到结构化链 表数据;
根据结构化链 表数据构造电力系统的路由知识图谱。
3.根据权利要求1所述的电力通信业务数据中站点 聚类方法, 其特征在于, 所述获取所
述路由知识图谱中各站点的高维嵌入表示时, 采用Struc2vec算法获取所述路 由知识图谱
中各站点的高维嵌入表示, 具体方法为:
获取并根据路由知识图谱中各站点的度及跳数, 得到路由知识图谱中任意两站点在各
跳的距离;
根据路由知识图谱中任意两站点在各跳的距离及各站点的跳数, 构造电力系统 的层次
带权图;
在层次带权图中进行各站点的序列采样, 得到各站点的序列采样结果, 并通过
word2vec算法训练各站点的顶点序列采样结果, 得到各站点的高维嵌入表示。
4.根据权利要求3所述的电力通信业务数据中站点 聚类方法, 其特征在于, 所述根据路
由知识图谱中各站 点的度及跳数, 得到路由知识图谱中任意两站点在各跳的距离的具体方
法为:
通过下式得到任意两站点之间的距离fk(u, v):
fk(u, v)=fk‑1(u, v)+g(s(Rk(u)), s(Rk(v)))
k≥0 and|Rk(u)|, |Rk(v)|>0
其中, Rk(u)表示u站点的第k跳的相邻站点集合, Rk(v)表示v站点的第k跳的相邻站点集
合; s(Rk(u))表示Rk(u)的站点度的有序序列, s(Rk(v))表示Rk(v)的站点度的有序序列; g(s
(Rk(u)), s(Rk(v)))表示s(Rk(u))和s(Rk(v))的距离, 为s(Rk(u))和s(Rk(v))中每一对元素
之间的距离的集 合;
所述根据路由知识图谱中任意两站点在各跳的距离及各站点的跳数, 构造电力系统的
层次带权图的具体方法为:
以电力系统站点的跳数为层, 通过 下式得到电力系统各站点之间的权值:
k=0, ..., k*
w(uk, uk+1)=log(Γk(u)+e), k =0, ..., k*‑1
w(uk, uk‑1)=1, k=1, ..., k*
其中, wk(u, v)为第k层的u站点与v站点之间的权值, wk(uk, uk+1)为第k层的u站点与第k+权 利 要 求 书 1/2 页
2
CN 114357268 A
21层的u站点之间的权值, Γk(u)为第k层的u站点与其他站点之间的权值大于平均 权值的站
点个数,
为第k层的u站点的平均权值, wk(uk, uk‑1)为第k层的u站点与第k+1层的u站点之
间的权值;
根据电力系统各站点之间的权值, 构造电力系统的层次带权图。
5.根据权利要求4所述的电力通信业务数据中站点聚类方法, 其特征在于, 所述s(Rk
(u))和s(Rk(v))中每一对元 素之间的距离d(a, b)通过 下式计算得到:
其中, a和b分别为s(Rk(u))和s(Rk(v))中对应位置元素的值, max(a,b)为a和b中最大的
值, min(a,b)为a和b中最小的值;
其中, 当s(Rk(u))和s(Rk(v))的长度不同时, 在计算s(Rk(u))和s(Rk(v))中每一对元素
之间的距离前, 采用动态时间规整算法对s(Rk(u))和s(Rk(v))序列进行对齐。
6.根据权利要求3所述的电力通信业务数据中站点 聚类方法, 其特征在于, 所述在层次
带权图中进行顶点序列采样时, 采用有偏随机游走法进行顶点序列采样。
7.根据权利要求1所述的电力通信业 务数据中站点聚类方法, 其特 征在于, 还 包括:
获取同类站点的人工审核结果, 并根据同类站点的人工审核结果更新同类站点的聚合
状态。
8.一种电力通信业 务数据中站点聚类方法系统, 其特 征在于, 包括:
数据获取模块, 用于获取电力系统的路由知识图谱;
高维嵌入表示获取模块, 用于获取 所述路由知识图谱中各站点的高维嵌入表示;
遍历模块, 用于搜索各站点的高维嵌入表示中与当前站点的高维嵌入表示最接近的高
维嵌入表示, 得到当前站点的最接 近站点;
聚类模块, 当当前站点的最接近站点的最接近站点为当前站点时, 将当前站点与当前
站点的最接 近站点聚合 为同类站点。
9.一种计算机设备, 包括存储器、 处理器以及存储在所述存储器中并可在所述处理器
上运行的计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现如权利要求 1至
7任一项所述电力通信业 务数据中站点聚类方法的步骤。
10.一种计算机可读存储介质, 所述计算机可读存储介质存储有计算机程序, 其特征在
于, 所述计算机程序被处理器执行时实现如权利要求 1至7任一项 所述电力通信业务数据中
站点聚类方法的步骤。权 利 要 求 书 2/2 页
3
CN 114357268 A
3
专利 电力通信业务数据中站点聚类方法、系统、设备及介质
安全报告 >
其他 >
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 08:59:25上传分享