全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211523876.5 (22)申请日 2022.12.01 (71)申请人 南京迈能 能源科技有限公司 地址 211100 江苏省南京市江宁区苏源大 道19号九龙湖国际企业总部园A2座9 层(江宁开发区) (72)发明人 张远来 黄睿 艾力 晏斐 杨贇  (74)专利代理 机构 南昌旭瑞知识产权代理事务 所(普通合伙) 36150 专利代理师 曹远龙 (51)Int.Cl. G06Q 10/06(2012.01) G06Q 50/06(2012.01) G06F 16/215(2019.01) G06F 16/22(2019.01)G06F 16/28(2019.01) G06F 16/31(2019.01) G06F 16/35(2019.01) G06F 40/30(2020.01) (54)发明名称 一种电力调度操作指令信息抽取方法及系 统 (57)摘要 本发明提供了一种电力调度操作指令信息 抽取方法及系统, 该方法通过对历史文本数据进 行清洗, 根据类别进行标注, 得到训练集, 再将训 练集输入识别模型中, 对该识别模型进行训练, 得到目标识别模型, 当目标识别模型建立完成 后, 将实际的操作指令输入目标识别模型中, 可 以得到从操作指令中提取的目标实体类别和目 标实体关系类别, 最后根据目标 实体类别和目标 实体关系类别进行实体追溯, 得到完整设备实体 及对应的完整状态, 大大减 轻人工数据抽取的工 作量, 提高调度业 务实施效率。 权利要求书3页 说明书10页 附图4页 CN 115545578 A 2022.12.30 CN 115545578 A 1.一种电力调度操作指令信息抽取 方法, 其特 征在于, 所述方法包括: 获取历史文本数据, 将所述历史文本数据进行清洗, 得到目标历史文本数据, 并确定类 别, 所述类别包括实体 类别和实体关系类别; 根据所述实体类别和所述实体关系类别, 将所述目标历史文本数据进行数据标注, 并 将所述目标历史文本数据按预设比例划分为训练集、 验证集以及测试集; 建立识别模型, 并将所述训练集输入所述识别模型, 以对所述识别 模型进行训练, 得到 目标识别模型; 获取操作指令, 并将所述操作指令输入所述目标识别模型, 输出目标实体类别和目标 实体关系类别, 并根据所述目标实体类别和所述目标实体关系类别, 进 行实体追溯, 得到完 整设备实体及所述完整设备实体对应的完整状态。 2.根据权利要求1所述的电力调度操作指令信 息抽取方法, 其特征在于, 所述识别模型 包括实体识别子模型和关系识别子模型, 所述实体识别子模型的建立过程包括: 获取文本片段, 将所述文本片段中的各字符进行索引, 得到对应的字符索引, 并分别确 定首字符索引和尾字符索引; 根据所述首字符索引和所述尾字符索引, 获取候选实体, 并将所述候选实体输入基于 Albert轻量Ber t预训练模型中, 输出 所述候选实体的首尾字符的第一语义表征; 获取所述候选实体的长度, 将所述第一语义表征和所述长度进行合并, 并通过神经网 络的线性分类层和Softmax函数, 计算所述候选实体属于各所述 实体类别的第一概率, 并进 行实体类别判断。 3.根据权利要求2所述的电力调度操作指令信 息抽取方法, 其特征在于, 所述关系识别 子模型的建立过程包括: 获取文本片段, 将所述文本片段中的各字符进行索引, 得到对应的字符索引, 并分别确 定首字符索引和尾字符索引; 根据所述首字符索引和所述尾字符索引, 获取候选实体, 并将所述文本片段中的各所 述候选实体进行组合, 形成对应的候选实体对; 将各所述候选实体对的主体头尾和客体头尾分别添加反映主体、 客体和类别信 息的特 殊字符, 并输入所述基于Alb ert轻量Bert预训练模型中, 输出所述候选实体对中各字符的 第二语义表征; 根据所述第二语义表征, 将主体头部的第一特殊字符和客体头部的第二特殊字符合 并, 并通过线性分类层和Softmax函数, 计算所述候选实体对属于各所述实体 关系类别的第 二概率, 并进行实体关系类别判断。 4.根据权利要求3所述的电力调度操作指令信 息抽取方法, 其特征在于, 所述实体类别 判断和所述实体关系类别判断的损失函数均采用Softmax交叉熵损失函数, 如下 所示: 权 利 要 求 书 1/3 页 2 CN 115545578 A 2其中, 为Softmax函数, n表示为实体类别数量或实体关系类别数量, q (x) 表示为 候选实体或候选实体对x经过神经网络后得到对应的实体类别或实体关系类别的概率, p (x) 表示为候选实体或候选实体对x对应的真实实体类别或真实实体 关系类别的one ‑hot编 码。 5.根据权利要求4所述的电力调度操作指令信 息抽取方法, 其特征在于, 所述建立识别 模型, 并将所述训练集输入所述识别模 型, 以对所述识别模型进 行训练, 得到目标识别模型 的步骤包括: 设置超参数, 并利用所述测试集分别训练所述实体识别子模型和所述关系识别子模 型; 分别计算得到所述实体识别 子模型和所述关系识别子模型的评价指标值, 并根据 所述 评价指标值, 保存最优 模型文件, 以得到目标识别模型。 6.根据权利要求5所述的电力调度操作指令信 息抽取方法, 其特征在于, 所述评价指标 值的计算公式为: 其中, P表示 为精确率, R表示 为召回率, F1表示 为所述评价指标值。 7.根据权利要求6所述的电力调度操作指令信 息抽取方法, 其特征在于, 所述获取操作 指令, 并将所述操作指令输入所述目标识别模型, 输出目标实体类别和目标实体关系类别, 并根据所述 目标实体类别和所述 目标实体关系类别, 进行实体追溯, 得到完整设备实体及 所述完整设备实体对应的完整状态的步骤 包括: 根据所述目标实体类别和所述目标实体关系类别, 获取发射实体, 所述发射实体包括 发射主体和发射 客体; 以所述发射主体为基准, 根据所述目标实体类别和所述目标实体关系类别, 获取第一 设备信息; 以所述发射客体为基准, 根据所述目标实体类别和所述目标实体关系类别, 获取第二 设备信息和状态信息; 将所述第一设备信息、 所述第二设备信息以及所述状态信息合并, 并输出。 8.一种电力调度操作指令信息抽取系统, 其特 征在于, 所述系统包括: 获取模块, 用于获取历史文本数据, 将所述历史文本数据进行清洗, 得到目标历史文本 数据, 并确定类别, 所述类别包括实体 类别和实体关系类别; 标注模块, 用于根据所述实体类别和所述实体关系类别, 将所述目标历史文本数据进 行数据标注, 并将所述目标历史文本数据按预设比例划分为训练集、 验证集以及测试集; 训练模块, 用于建立识别模型, 并将所述训练集输入所述识别模型, 以对所述识别模型 进行训练, 得到目标识别模型; 追溯模块, 用于获取操作指令, 并将所述操作指令输入所述目标识别模型, 输出目标实 体类别和目标实体关系类别, 并根据所述 目标实体类别和所述 目标实体关系类别, 进行实 体追溯, 得到 完整设备实体及所述完整设备实体对应的完整状态。 9.一种计算机可读存 储介质, 其特 征在于, 包括: 所述计算机可读存储介质存储一个或多个程序, 该程序被处理器执行时实现如权利要权 利 要 求 书 2/3 页 3 CN 115545578 A 3

PDF文档 专利 一种电力调度操作指令信息抽取方法及系统

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种电力调度操作指令信息抽取方法及系统 第 1 页 专利 一种电力调度操作指令信息抽取方法及系统 第 2 页 专利 一种电力调度操作指令信息抽取方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:58:09上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。