全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210409530.6 (22)申请日 2022.04.19 (71)申请人 中国水利水电科 学研究院 地址 100048 北京市海淀区车公庄西路20 号 (72)发明人 苏楠 章少辉 白美健 张宝忠  陈皓锐  (74)专利代理 机构 北京正华智诚专利代理事务 所(普通合伙) 11870 专利代理师 陈航 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/35(2019.01) G06F 16/332(2019.01) G06F 40/186(2020.01)G06F 40/295(2020.01) G06K 9/62(2022.01) G06N 20/00(2019.01) (54)发明名称 一种灌区流量调度知识图谱问答系统构建 与使用方法 (57)摘要 本发明公开了一种灌区流量调度知识图谱 问答系统构建与使用方法, 属于灌区流量调度技 术领域, 包括如下步骤, 得到若干不同类型流量 调度特征数据; 构建调度场景机器学习模型, 并 将各不同类型流量调度特征数据输入已训练的 调度场景机器学习模型调参, 得到第一机器学习 模型; 得到最优特征值组合和调度经验数据; 将 最优特征值组合输入第一机器学习模型训练并 调参, 得到第二机器学习模型; 分别得到各类型 流量调度特征数据对应的调度流量梯度; 构建灌 区流量调度知识问答系统; 构建灌区流量调度的 问题模板, 并利用朴素贝叶斯分类器对问题集合 与问题模板概率匹配, 结合HanLP分词器, 完成灌 区流量调度知识问答系统的使用; 本方案解决了 灌区用水流 量调度可信度与便利度低的问题。 权利要求书2页 说明书8页 附图2页 CN 114780742 A 2022.07.22 CN 114780742 A 1.一种灌区流 量调度知识图谱问答系统构建与使用方法, 其特 征在于, 包括如下步骤: S1、 获取灌区流量调度特征量数据集, 并根据不同调度场景对灌区流量调度特征量数 据集分类, 得到若干不同类型流 量调度特 征数据; S2、 构建调度场景机器学习模型, 并将各不同类型流量调度特征数据输入已训练的调 度场景机器学习模型调参, 得到第一机器学习模型; S3、 利用SHAP模型解译法解译第一机器学习模型, 得到最优特征值组合和调度经验数 据; S4、 将最优特 征值组合输入第一机器学习模型训练并调参, 得到第二机器学习模型; S5、 利用第二机器学习模型预测各不同类型流量调度特征数据, 分别得到各类型流量 调度特征数据对应的调度流 量梯度; S6、 基于调度经验数据、 各不同类型流量调度特征数据以及各类型流量调度特征数据 对应的调度流 量梯度, 构建灌区流 量调度知识问答系统; S7、 构建灌区流量调度的问题模板, 并利用朴素贝叶斯分类器对问题集合与问题模板 概率匹配, 且通过灌区流量调度知识问答系统结合HanLP分词器, 完成灌区流量调度知识问 答系统的使用。 2.根据权利要求1所述的灌区流量调度知识图谱问答系统构建与使用方法, 其特征在 于, 所述构建调度场景机器学习模型包括如下步骤: A1、 获取灌区用水调度目标流 量; A2、 构建灌区用水调度目标流量和各不同类型流量调度特征数据间的非线性回归映 射; A3、 根据非线性回归映射得到若干最优决策树和各最优决策树对应的预测值; A4、 基于各最优决策树和对应的预测值构建决策树森林网络, 完成构建机器学习模型。 3.根据权利要求2所述的灌区流量调度知识图谱问答系统构建与使用方法, 其特征在 于, 所述步骤A3包括如下步骤: B1、 根据非线性回归映射随机从各不同类型流量调度特征数据抽取m个特征变量, 其 中, m表示特 征变量个数; B2、 从m个特征变量中选取s个特征变量作 为决策树节点, 其中, s表示特征变量个数, 且 s小于m; B3、 针对各相邻决策树节点均方差和最小时, 将该决策树节点分化并递归得到最优决 策树; B4、 将各最优决策树叶子节点的均值作为对应的预测值; B5、 重复步骤B1到B4, 得到若干最优决策树和各最优决策树对应的预测值。 4.根据权利要求3所述的灌区流量调度知识图谱问答系统构建与使用方法, 其特征在 于, 所述步骤S3包括如下步骤: S31、 利用SHAP模型解译法解译第一机器学习模型, 分别得到特征值重要性排序和不同 特征值对调度流 量的影响方向; S32、 根据 特征值重要性排序选择排序靠前的特征值, 并删除不同调度场景特征值组合 的冗余, 得到最优特 征值组合; S33、 分析不同特 征值对调度流 量的影响方向, 得到调度经验数据。权 利 要 求 书 1/2 页 2 CN 114780742 A 25.根据权利要求4所述的灌区流量调度知识图谱问答系统构建与使用方法, 其特征在 于, 所述步骤S31包括如下步骤: S311、 利用SHAP模型计算特 征变量的shapley值; S312、 根据特 征变量的shapley值计算得到第一机器学习模型的SHAP值g(z ′); S313、 根据第一机器学习模型的SHAP值g(z ′)得到特征值重要性排序和不 同特征值对 调度流量的影响方向。 6.根据权利要求5所述的灌区流量调度知识图谱问答系统构建与使用方法, 其特征在 于, 所述特 征变量的shapley值的计算表达式如下: 其中, φj表示第j个 特征变量的shapley值, f( ·)表示非线性回归映射, N表示特征变量 样本集, M表示特征变量样本集维度, S表示从特征变量样本集N中抽取的特征变量样本子 集, |S|表 示特征变量样 本子集S的维度, f(S∪{j})表 示样本子集S融合第 j个特征变量后的 样本预测值的平均值, f(S)表示样本 子集S的预测值。 7.根据权利要求6所述的灌区流量调度知识图谱问答系统构建与使用方法, 其特征在 于, 所述第一机器学习模型的SHAP值g(z ′)的表达式如下: z′j∈{0′,1′}M φj∈R 其中, z′表示联合向量, 0 ′表示第j个特征变量不位于联合向量z ′j的决策路径中, 1 ′表 示第j个特 征变量位于联合向量z ′j的决策路径中, φ0表示决策参数, R表示实数。 8.根据权利要求7所述的灌区流量调度知识图谱问答系统构建与使用方法, 其特征在 于, 所述步骤S6包括如下步骤: S61、 将闸门、 调度流量、 调度经验数据、 各不同类型流量调度特征数据以及各类型流量 调度特征数据对应的调度流 量梯度分别作为实体存 储至图形 数据库Neo 4j; S62、 基于图形 数据库Neo 4j, 构建灌区流 量调度知识问答系统。 9.根据权利要求8所述的灌区流量调度知识图谱问答系统构建与使用方法, 其特征在 于, 所述步骤S7包括如下步骤: S71、 构建灌区流 量调度的问题模板; S72、 利用朴素贝叶斯分类 器对问题集 合与问题模板概 率匹配; S73、 通过灌区流量调度知识问答系统获取提问数据, 并通过HanLP分词器将提问数据 与问题模板匹配, 得到问题集 合中的对应问题; S74、 根据对应问题查找图形数据库Neo4j, 并通过灌区流量调度知识问答系统反馈图 形数据库Neo 4j查找结果, 完成灌区流 量调度知识问答系统的使用。权 利 要 求 书 2/2 页 3 CN 114780742 A 3

.PDF文档 专利 一种灌区流量调度知识图谱问答系统构建与使用方法

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种灌区流量调度知识图谱问答系统构建与使用方法 第 1 页 专利 一种灌区流量调度知识图谱问答系统构建与使用方法 第 2 页 专利 一种灌区流量调度知识图谱问答系统构建与使用方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:54:29上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。