说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210433516.X (22)申请日 2022.04.24 (71)申请人 国网上海市电力公司 地址 200122 上海市浦东 新区自由贸易试 验区源深路1 122号 (72)发明人 毛玮韵 魏本刚 徐湘忆 陈璐 吴天逸 彭政睿 任辰 (74)专利代理 机构 上海科盛知识产权代理有限 公司 312 25 专利代理师 翁惠瑜 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/332(2019.01) G06F 40/295(2020.01) G06F 40/30(2020.01) (54)发明名称 一种基于知识图谱的应答方法、 电子 设备及 介质 (57)摘要 本发明涉及一种基于知识图谱的应答方法、 电子设备及介质, 方法包括以下步骤: S1、 获取用 户问题; S2、 将用户问题输入训练好的语义提取 模型, 获得问题 语义信息; S3、 对问题 语义信息进 行命名实体识别, 获得问题命名实体; S4、 根据问 题命名实体在预先构建的知识图谱中进行匹配, 输出问题答案; 知识图谱的构建过程包括: 采集 若干条应答历史数据, 构成历史数据集, 并输入 训练好的语义提取模型, 获得语义数据集; 对语 义数据集进行命名实体识别, 获得若干个问题语 义向量, 构成知 识图谱。 与现有 技术相比, 本发明 具有精度高、 准确率高和速度快等优点。 权利要求书2页 说明书6页 附图1页 CN 114880481 A 2022.08.09 CN 114880481 A 1.一种基于知识图谱的应答方法, 其特 征在于, 包括以下步骤: S1、 获取用户问题; S2、 将用户问题输入训练好的语义 提取模型, 获得问题语义信息; S3、 对问题语义信息进行命名实体识别, 获得问题命名实体; S4、 根据问题命名实体在预 先构建的知识图谱中进行匹配, 输出问题答案; 其中, 所述的知识图谱的构建过程包括: 采集若干条应答历史数据, 构成历史数据集; 将历史数据集输入训练好的语义 提取模型, 获得语义数据集; 对语义数据集进行命名实体识别, 获得若干个问题语义向量, 构 成知识图谱, 所述的问 题语义向量的表达式为: (实体, 关系, 实体); 所述的步骤S4的具体过程包括: 根据问题命名实体在知识图谱中匹配问题语义向量, 将匹配到的问题语义向量作为问 题答案并输出。 2.根据权利要求1所述的一种基于知识图谱的应答方法, 其特征在于, 训练语义提取模 型的损失函数表达式为: 其中, x为输入向量, w为特征权重, n为样本 数量, y为期望输 出值, hw(x)为一般线 性回归 函数的假设函数, hw(x)的表达式为: 其中, b为噪声参数。 3.根据权利要求2所述的一种基于知识图谱的应答方法, 其特征在于, 所述的语义提取 模型的每次迭代训练中, 通过随机斜 率下降法和误差反向传播 算法对特 征权重进行更新。 4.根据权利要求1所述的一种基于知识图谱的应答方法, 其特征在于, 所述的步骤S3的 具体过程包括: 通过隐马尔可 夫模型的隐含序列确定问题语义信息中的可观测状态; V={v1, ..., vM} H={h1, ..., hN} O={o1, ..., oT} I={i1, ..., iT} 其中, V和H分别为自然语言集合和隐藏状态合集, 其中v表示字, M为已知字数, h代表隐 状态, N为状态数量, O为可观测状态序列, I为隐含状态序列, o表示已观测 到的文本, i为已 观测到的文本对应的隐状态, T为字数; 计算隐马尔可 夫模型初始化隐状态的概 率分布 π: π =P(i1=hi) 其中, P(i1=hi)为序列中第一个字i1的实体标记为hi的概率;权 利 要 求 书 1/2 页 2 CN 114880481 A 2计算用于表示 不同状态间转移的概 率的状态转移 矩阵Aij: 计算用于表示隐状态生成观测结果的观测概 率矩阵Bjk: Bjk=P(ot=vk|it=hj) 其中, P(ot=vk|it=hj)表示t时刻实体标记hi对应到文字vk的概率, vk∈H, hi, j∈H; 基于概率 分布 π、 状态转移矩阵Aij以及观测概率矩阵Bjk, 通过目标函数得整体的序列和 隐状态发生的概 率最优化, 得到第t时刻的最优标注; 所述的目标函数为: argmax( π, A, B)=P(i1...ito1...ot| π, A, B) 通过维特比算法中的动态规划算法找到全局最优的标记序列, 作为命名实体: 其中, 为全局最优的标记序列。 5.根据权利要求4所述的一种基于知识图谱的应答方法, 其特征在于, 所述的隐马尔可 夫模型初始化隐状态的概 率分布 π 的计算公式为: π =P(i1=hi) 其中, P(i1=hi)为序列中第一个字i1的实体标记为hi的概率。 6.根据权利要求4所述的一种基于知识图谱的应答方法, 其特征在于, 所述的状态转移 矩阵A的计算公式为: Aij=P(it+1=hj|it=hi) 其中, Aij为状态转移矩阵, P(it+1=hj|it=hi)表示t时刻实体标记为hi, 而在t+1时刻实 体标记转换到 hj的概率。 7.根据权利要求4所述的一种基于知识图谱的应答方法, 其特征在于, 所述的观测概率 矩阵Bjk的计算公式为: Bjk=P(ot=vk|it=hj) 其中, P(ot=vk|it=hj)表示t时刻实体标记hi对应到文字vk的概率, vk∈H, hi, j∈H。 8.根据权利要求1所述的一种基于知识图谱的应答方法, 其特征在于, 所述的步骤S4的 具体过程包括: 通过索引在知识图谱中搜索问题命名实体, 返回与问题命名实体相关的候选问题语义 向量, 针对问题和关系、 问题和答案进 行联合语义表征, 然后从候选问题语义向量中选择得 分最高的候选问题语义向量作为 答案。 9.一种电子设备, 其特征在于, 包括存储器和 处理器, 所述存储器存储有计算机程序, 所述处理器调用所述 程序指令能够执 行如权利要求1至8任一所述的应答方法。 10.一种计算机可读存储介质, 其特征在于, 包括计算机程序, 所述计算机程序能够被 处理器执行以实现如权利要求1 ‑8任一所述的应答方法。权 利 要 求 书 2/2 页 3 CN 114880481 A 3
专利 一种基于知识图谱的应答方法、电子设备及介质
文档预览
中文文档
10 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 10:53:55
上传分享
举报
下载
原文档
(481.8 KB)
分享
友情链接
GB 18967-2009 改性沥青聚乙烯胎防水卷材.pdf
T-SIPAQLHH 0001—2022 锂电池安全管理规程.pdf
GB-T 41268-2022 网络关键设备安全检测方法 路由器设备.pdf
信通院 移动互联网应用程序-APP个人信息保护治理白皮书.pdf
DB46-T 542-2021 快递绿色包装通用要求 海南省.pdf
GB/T 40127-2021 全断面隧道掘进机 顶管机安全要求.pdf
DB37-T 5245-2022 桥梁智慧健康监测技术标准 山东省.pdf
GB-T 35673-2017 工业通信网络 网络和系统安全 系统安全要求和安全等级.pdf
IT管理制度.pdf
GB-T 43564-2023 中小学合成材料面层田径场地.pdf
GB-T 30976.1-2014 信息安全技术 工业控制系统信息安全 第1部分:评估规范.pdf
GB-T 19228.2-2011 不锈钢卡压式管件组件 第2部分:连接用薄壁不锈钢管.pdf
GM-T 0045-2016 金融数据密码技术规范.pdf
T-CI 175—2022 智能交通基础设施数字化技术规范.pdf
GB-T 17901.1-2020 信息技术 安全技术 密钥管理 第1部分:框架.pdf
T-EERT 042—2024 工业有机废气蓄热燃烧治理设施运行维护规范.pdf
GB-T 37697-2019 露天煤矿边坡变形监测技术规范.pdf
GB-Z 43030-2023 低压开关设备和控制设备 网络安全.pdf
GB-T 35753-2017 空调器室外机安装用支架.pdf
GB-T 40218-2021 工业通信网络 网络和系统安全 工业自动化和控制系统信息安全技术.pdf
1
/
3
10
评价文档
赞助2.5元 点击下载(481.8 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。