全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210277367.2 (22)申请日 2022.03.15 (71)申请人 贵州电网有限责任公司 地址 550002 贵州省贵阳市南明区滨河路 17号 (72)发明人 王立 刘志宏 颜霞 李振 陈飞  汪黔疆 张方银 杨钦  (74)专利代理 机构 南京禹为知识产权代理事务 所(特殊普通 合伙) 32272 专利代理师 张永强 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/387(2019.01) G06Q 50/06(2012.01) (54)发明名称 一种变电站工程选 址知识图谱构建方法 (57)摘要 本发明公开了一种变电站工程选址知识图 谱构建方法, 此构建方法包括以下步骤, 采集变 电站工程选址的相关规范和标准, 经术语抽和筛 选, 得到概念集合和关系集合; 建立 “概念‑关系‑ 概念”三元组, 构建本体层知识图谱; 采集现有变 电站的运行资料, 经知 识抽取和筛选处理后实体 集合、 关系集合以及属性集合; 建立 “实例‑关系‑ 实例”和“实例‑关系‑属性”三元组, 构建实例层 知识图谱; 基于本体层知识图谱和实例层知 识图 谱以及相互之间的映射关系, 构建用于变电站工 程选址知识的检索学习和辅助决策; 本发明构建 较为完善的变电站选址知识图谱体系; 通过形成 丰富的案例知识库, 供新的工程检索和辅助决 策。 权利要求书2页 说明书7页 附图3页 CN 114817556 A 2022.07.29 CN 114817556 A 1.一种变电站工程选 址知识图谱构建方法, 其特 征在于: 包括以下步骤, 采集变电站工程选址的相关规范和标准, 经术语抽取得到变电站工程选址知识图谱的 关键术语; 参照现有选址的相关规范和标准, 结合关键术语, 经筛选, 得到变电站工程选址的概念 集合和关系集 合; 根据概念集 合和关系集 合建立“概念‑关系‑概念”三元组, 构建本体层 知识图谱; 采集现有变电站的运行资料, 经知识抽取和筛选处理后得到变电站工程选址知识的实 体集合、 关系集 合以及属性 集合; 通过实体集合、 关系集合以及属性集合建立 “实例‑关系‑实例”和“实例‑关系‑属性”三 元组, 构建实例层 知识图谱; 基于本体层知识图谱和实例层知识图谱以及相互之间的映射关系, 构建用于变电站工 程选址的知识体系。 2.根据权利要求1所述的变电站工程选址知识图谱构建方法, 其特征在于: 所述采集变 电站工程选址的相关规范和标准, 经术语抽取得到变电站工程选址知识图谱的关键术语, 包括以下步骤: 术语抽取, 首先使用阈值分类器抽取出语料库中的双字候选词汇, 然后再对候选词汇 向左右两侧进行一定程度的扩充, 筛 选符合要求的多字候选词汇; 使用TF‑IDF算法对所得候选词 汇进行过滤以得到最终结果, 即变电站工程选址知识图 谱的关键术语。 3.根据权利要求2所述的变电站工程选址知识图谱构建方法, 其特征在于: 所述使用 TF‑IDF算法对 所得候选词汇进 行过滤以得到变电站工程选址知识图谱的关键术语, 包括以 下步骤: 首先, 计算词频tfij, 即: 其中, ni, j是该词语在文件dj中出现的次数, nk, j分母则是文件dj中所有词汇 出现的次数 总和; 然后, 计算逆向文件频率 IDF, 即: 其中, |D|是收集的变电站工程选址知识中的文件总数, |{j: ti∈dj}|表示包含该词语 的文件总数(即ni, j≠0的文件总数); 最后, 计算TF ‑IDF, 即: TF ‑IDF=TF×IDF 其中, TF(tfij)表示为词频, IDF表示 为逆向文件频率。 4.根据权利要求2或3所述的变电站工程选址知识图谱构建方法, 其特征在于: 参照现 有选址的相关规范和标准, 结合关键术语, 经筛选, 得到变电站工程选址的概念集合和关系 集合, 包括以下步骤: 根据关键术语和采集的变电站选址相关规范和标准, 经过筛选得到变电站工程选址知权 利 要 求 书 1/2 页 2 CN 114817556 A 2识图谱本体层概念集 合; 根据获取的概念集合, 使用远程监督算法对采集的变电站工程选址相关规范、 标准进 行关系抽取, 再 经过筛选得到变电站工程选 址知识图谱本体层关系集 合。 5.根据权利要求4所述的变电站工程选址知识图谱构建方法, 其特征在于: 在得到变电 站工程选 址知识图谱本体层关系集 合的过程中, 还 包括以下步骤: 根据得到的概念集合再结合知识库进行概念对比, 对采集的变电站选址相关规范、 标 准等资料进行关系标注; 根据获取的知识进行远程监督关系抽取模型训练, 利用得到的模型进行关系抽取, 得 到变电站工程选 址知识图谱本体层关系集 合。 6.根据权利要求1~3和5任一所述的变电站工程选址知识图谱构建方法, 其特征在于: 对知识图谱本体层概念集合和关系集合进行检查和评估, 包括两方面: 一是核心概念结构 的合理性, 二是每 个概念的合理性、 必要性以及相似概念间的辨析。 7.根据权利要求6所述的变电站工程选址知识图谱构建方法, 其特征在于: 所述采集现 有变电站的运行资料, 经知识抽取和筛选处理后得到变电站工程选址知识的实体集合、 关 系集合以及属性 集合, 包括以下步骤: 对采集的现有变电站的运行资料进行分类, 得到变电站工程选址的结构化知识与非结 构化知识; 其中, 运行资料包括变电站的台账、 运行历史和过 载情况; 对于结构化知识的知识抽取, 采用R2RML语言将知识映射成RDF格式三元组, 得到相应 的实体、 关系和 属性; 对于非结构化知识的知识抽取, 结合构 建的本体层知识图谱, 采用LSTM ‑CRF模型、 远程 监督算法和MetaPAD分别进行实体抽取、 关系抽取和 属性抽取; 将前两步骤得到的实体、 关系、 属性相结合, 进行核查补缺后, 得到初始变电站工程选 址知识图谱的实体集 合、 关系集 合和属性集合。 8.根据权利要求7所述的变电站工程选址知识图谱构建方法, 其特征在于: 对得到的初 始变电站工程选址知识图谱的实体集合、 关系集合和属性集合进 行同义词、 近义词聚类, 确 定唯一规范表述, 获得精简后的初始变电站工程选址知识图谱实体集合、 关系集合和属 性 集合。 9.根据权利要求8所述的变电站工程选址知识图谱构建方法, 其特征在于: 对于实体抽 取、 关系抽取和 属性抽取, 采取以下步骤: 根据获取的本体对采集的变电站的运行资料采用LSTM ‑CRF模型进行实体抽取, 得到变 电站工程选 址知识图谱实体集 合; 根据获取的实体对采集的变电站的运行资料采用远程监督模型进行关系抽取, 得到变 电站工程选 址知识图谱实例层关系集 合; 根据获取的实体对采集的变电站的运行资料采用MetaPAD进行属性抽取, 得到变电站 工程选址知识图谱属性 集合。权 利 要 求 书 2/2 页 3 CN 114817556 A 3

.PDF文档 专利 一种变电站工程选址知识图谱构建方法

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种变电站工程选址知识图谱构建方法 第 1 页 专利 一种变电站工程选址知识图谱构建方法 第 2 页 专利 一种变电站工程选址知识图谱构建方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:51:30上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。