全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210397421.7 (22)申请日 2022.04.15 (71)申请人 中北大学 地址 030051 山西省太原市学院路3号中北 大学 (72)发明人 杨喜旺 黄晋英 高佳鑫 马健程  (74)专利代理 机构 山西五维专利事务所(有限 公司) 1410 5 专利代理师 茹牡花 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/901(2019.01) G06F 40/295(2020.01) (54)发明名称 一种道岔转辙机故障诊断知识图谱构建方 法 (57)摘要 本发明属于高速铁路道岔转辙机故障诊断 技术领域和知识图谱技术领域。 具体涉及一种道 岔转辙机故障诊断知识图谱构建方法。 本发明是 通过建立道岔转辙机故障诊断本体模 型; 使用双 向长短记忆神经网络模型组合线性链条件随机 场模型进行命名实体识别任务, 将同一行数据中 抽取出的实体存储在一起等步骤实现。 本发明充 分利用道岔转辙机故障记录文本数据, 构建其故 障诊断知识图谱。 将道岔转辙机故障原因、 故障 现象、 故障位置等要素信息以图的形式进行表 示, 直观地展现各信息之间的关联, 对故障知识 进行组织。 使用此知识图谱可以完成由故障现象 到故障原因、 由故障原因到故障位置等信息的查 询, 提高故障诊断效率。 权利要求书1页 说明书3页 附图2页 CN 114691889 A 2022.07.01 CN 114691889 A 1.一种道岔转 辙机故障诊断知识图谱构建方法, 其特 征在于: 包括以下步骤: 步骤1.建立道岔转 辙机故障诊断本体模型; 步骤2.使用 双向长短记忆神经网络模型组合线性链条件随机场模型进行命名实体识 别任务, 将同一行 数据中抽取 出的实体存 储在一起, 分为4个步骤: A1.使用BIO标记法对道岔转辙机故障记录中每条文本序列进行文本标注, BIO标记法 是将每个字符标注为 “B‑X”、“I‑X”、 或“O”; A2.词向量 转换, 使用W ord embedding方法对文本序列进行词向量 转换; A3.建立双向长短记忆神经网络模型, 将序列词向量作为输入进行训练, 输出发射矩 阵; A4.使用线性链条件随机场模型对双 向长短记忆神经网络模型的输出结果进行矫正; 对于一个输入序列X, 某条预测标签序列y通过线性链条件随机场模 型的分数包括 发射分数 和状态转移分数两部分; 双向长短记忆神经网络模型输出结果为发射分数, 状态转移分数 则由线性链条件随机场模型转移矩阵决定, 分数计算公式为 式中, 为标签yi转移到yi+1的概率, Pi,yi为序列中第i个元 素标签为yi的概率, n为序列长度; 线性链条件随机场模型损失函数由真实路径分数和所有路径分数总和构成, 公式为 式中, sRealPath为真实路径的分数, YX为序 列X所有可能标签序列的集 合; 步骤3.步骤2实体抽取结果中存在实体词不同, 具体是指词的字符不一致, 但其含义相 同, 都指向 同一事物; 将步骤2实体抽取结果使用人工检验的方法将形式不同但含义相同的 实体词进行合并、 统一; 步骤4.在步骤3的基础上, 进行信息拼接; 将每个句子中模型提取出的故障位置和故障 原因拼接后作为作为最 终的故障原因, 将故障位置逻辑上作为其属性, 以步骤1本体层 对应 的关系连接; 在可视化阶段, 仍以节点、 关系三元组的形式在数据库中进行存储; 故障现象 也是同样 操作, 这样可以防止知识图谱出现查询结构混乱的情况; 步骤5.将步骤4后的结果, 按照步骤1中建立的本体概念之间的关系进行关联; 步骤2到 步骤4的工作中, 同一行数据中抽取出的实体存储在一起, 按照本体概念之 间的关系直接将 同一行数据中提取的实体进 行关联, 形成知识图谱基本三元 组; 之后使用neo4j图数据库进 行知识图谱可视化; 因转辙机与道岔联合工作, 两者之 间相互影响, 实体抽取时不可避免地 将道岔的故障位置信息进 行了提取; 在neo4j图数据库中, 在故障位置节 点内标明其属于转 辙机或道岔, 以及转 辙机的哪个 基本组成结构。权 利 要 求 书 1/1 页 2 CN 114691889 A 2一种道岔转辙机故障诊断知识图谱构建 方法 技术领域 [0001]本发明属于高速铁路道岔转辙机故障诊断技术领域和知识图谱技术领域, 特别是 涉及一种道岔转 辙机故障诊断知识图谱构建方法。 背景技术 [0002]随着我国铁路系统规模越来越大, 对其安全提出了更高的要求。 道岔转辙机作为 铁路信号设备 的重要组成部分, 起着转换列车前进方向的作用, 其运行状态与列车 的安全 运行、 运输效率息 息相关。 对其进行故障诊断研究显得至关重要。 [0003]目前道岔转辙机故障诊断存在一些不足: (1 )无法有效利用历史故障文本数据。 (2)传统的故障诊断方法无法表示其各故障要素之间的关系。 (3)目前没有对道岔转辙机故 障诊断的相关知识进行有效组织。 发明内容 [0004]为解决目前道岔转辙机故障诊断没有有效利用历史故障记录文本数据、 目前传统 故障诊断方法无法表 示其故障要素信息内部联系等技术问题。 本发明提供一种道岔转辙机 故障诊断知识图谱构建方法。 [0005]为解决上述 技术问题, 本发明采用的技 术方案包 含以下步骤: [0006]步骤1.建立道岔转 辙机故障诊断本体模型; [0007]步骤2.使用双向长短记忆神经网络模型组合线性链条件随机场模型进行命名实 体识别任务, 将同一行 数据中抽取 出的实体存 储在一起, 分为4个步骤: [0008]A1.使用BIO标记法对道岔转辙机故障记录中每条文本序列进行文本标注, BIO标 记法是将每 个字符标注为 “B‑X”、“I‑X”、 或“O”; [0009]A2.词向量 转换, 使用W ord embedding方法对文本序列进行词向量 转换; [0010]A3.建立双向长短记忆神经 网络模型, 将序列词向量作为输入进行训练, 输出发射 矩阵; [0011]A4.使用线性链条件随机场模型对双向长短记忆神经网络模型的输出结果进行矫 正; 对于一个输入序列X, 某条预测标签序列y通过线性链条件随机场模型的分数包括发射 分数和状态转移分数两部分; 双向长短记忆神经网络模型输出结果为发射分数, 状态转移 分 数 则 由 线 性 链 条 件 随 机 场 模 型 转 移 矩 阵 决 定 ,分 数 计 算 公 式 为 式中, 为标签yi转移到yi+1的概率, 为序列中第i个元素 标签为yi的概率, n为序列长度; [0012]线性链条件随机场模型损失函数由真实路径分数和所有路径分数总和构成, 公式 为 式中, sRealPath为真实路径的分数, YX为 序列X所有可能标签序列的集 合;说 明 书 1/3 页 3 CN 114691889 A 3

.PDF文档 专利 一种道岔转辙机故障诊断知识图谱构建方法

文档预览
中文文档 7 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共7页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种道岔转辙机故障诊断知识图谱构建方法 第 1 页 专利 一种道岔转辙机故障诊断知识图谱构建方法 第 2 页 专利 一种道岔转辙机故障诊断知识图谱构建方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:55:26上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。