(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210115804.0
(22)申请日 2022.02.07
(65)同一申请的已公布的文献号
申请公布号 CN 114153993 A
(43)申请公布日 2022.03.08
(73)专利权人 杭州远传新 业科技有限公司
地址 310051 浙江省杭州市滨江区信诚路
857号世贸中心 23楼
(72)发明人 嵇望 陈默 梁青
(74)专利代理 机构 杭州创智卓英知识产权代理
事务所(普通 合伙) 33324
专利代理师 张迪
(51)Int.Cl.
G06F 16/36(2019.01)
G06F 16/31(2019.01)G06F 16/332(2019.01)
G06F 16/338(2019.01)
G06F 16/35(2019.01)
(56)对比文件
CN 113505586 A,2021.10.15
WO 2021254 457 A1,2021.12.23
CN 112100351 A,2020.12.18
CN 110555153 A,2019.12.10
CN 109271506 A,2019.01.25
CN 10949 2077 A,2019.0 3.19
谢榕 等. 《人工智能课程领域知识图谱及其
创新教学模式》 . 《软件导刊》 .2021,
审查员 刘莹
(54)发明名称
一种用于智能问答的知识图谱自动化构建
方法及系统
(57)摘要
本发明提供一种用于智能问答的知识图谱
自动化构建方法及系统, 其中方法包括: 提取待
重建的问答系统的问答数据库; 确定问答数据库
内各个问答数据对应的知识领域; 基于知识领域
对问答数据进行分组, 确定多个问题组; 获取知
识领域对应的知识图谱构建模板; 基于知识领域
对应的问题组和知识图谱构建模板, 构建待处理
图谱; 将构建的待处理图谱进行整合关联, 形成
知识图谱。 本发 明的用于智能问答的知识图谱自
动化构建方法, 实现在原有的FAQ智能问答系统
的基础上进行用于智能问答的知识图谱的自动
化构建, 降低企业的智能问答系统转换的周期以
及成本。
权利要求书4页 说明书11页 附图3页
CN 114153993 B
2022.05.06
CN 114153993 B
1.一种用于智能问答的知识图谱自动化构建方法, 其特 征在于, 包括:
提取待重建的问答系统的问答数据库;
确定所述问答数据库内各个问答数据对应的知识领域;
基于所述知识领域对所述问答数据进行分组, 确定多个问题组;
获取所述知识领域对应的知识图谱构建模板;
基于所述知识领域对应的所述问题组和所述知识图谱构建模板, 构建待处 理图谱;
将构建的所述待处 理图谱进行整合关联, 形成知识图谱;
所述基于所述知识领域对应的所述问题组和所述知识图谱构建模板, 构建待处理图
谱, 包括:
解析所述知识图谱构建模板, 确定实体识别规则、 关系识别规则、 属性识别规则;
基于所述实体识别规则, 确定所述问题组内各个所述问答数据中的实体数量以及实体
名称;
基于所述实体对所述问题组内的所述问答数据进行聚类处 理, 获取多个问答数据集;
提取所述问答数据集中实体数量大于等于二的所述问答数据, 基于所述关系识别规则
确定所述问答数据中所述实体与其 他的实体的关系;
基于所述实体与其 他的实体的关系和所述实体名称, 构建第一 三元组;
提取所述问答数据集中实体数量为一的所述问答数据, 确定所述实体的属性以及所述
属性对应的属性 值;
基于所述实体名称、 所述属性和所述属性 值, 构建第二 三元组;
基于所述第一 三元组和所述第二 三元组, 构建所述待处 理图谱;
在提取待重建的问答系统的问答数据库之后, 还 包括:
确定所述问答系统对应的硬件的可用存 储空间;
确定所述问答数据库的第一数据量;
基于所述第 一数据量和所述可用存储空间, 生成第 一提示信 息并输出包含第 一提示信
息的第一问询;
接收用户对于所述第一问询的第一反馈;
解析所述第一反馈, 确定所述知识图谱的第一数据量的第一限制规则;
在所述知识图谱整合完成后, 还 包括:
确定所述知识图谱的第一数据量;
当所述第一数据量符合所述第一限制规则时, 结束所述知识图谱的构建;
当所述第一数据量超出所述第一 限制规则时, 获取所述问答系统的使用记录; 解析所
述使用记录, 确定各个问答数据的使用参数; 获取 各个问答数据的构建参数;
基于所述使用参数和所述构建参数, 确定各个问答数据的关键度;
基于所述关键度从小到大的顺序对所述问答数据进行排序, 形成第一 候选表;
从上至下依次确定所述第一候选表中各个问答数据在所述知识图谱中对应的第三数
据量, 并确定出已经确定的第三数据量的总值;
当所述第一数据量减去所述第 三数据量的总值符合所述第 一限制规则时, 基于所述候
选表中确定出 数据量的所述问答数据生成数据删减清单并输出;
当所述第一数据量未达到所述第一 限制规则时, 获取所述问答系统的使用记录; 解析权 利 要 求 书 1/4 页
2
CN 114153993 B
2所述使用记录, 确定各个问答数据的使用参数; 获取 各个问答数据的构建参数;
基于所述使用参数和所述构建参数, 确定各个问答数据的关键度;
基于所述关键度从大到小的顺序对所述问答数据进行排序, 形成第二 候选表;
依次提取所述第 二候选表中的问答数据, 从大数据平台上获取数据对所述问答数据对
应的知识图谱的数据进行补充, 并确定补充的数据的第四数据量;
确定已补充的第四数据量的总值;
当所述第一数据量加上所述第四数据量的总值符合所述第 一限制规则时, 基于补充的
数据生成补充数据清单并输出。
2.如权利要求1所述的用于智能问答的知识图谱自动 化构建方法, 其特征在于, 所述确
定所述问答数据库内各个问答数据对应的知识领域, 包括:
对所述问答数据进行关键词提取, 获取多个关键词;
分别对多个所述关键词进行量 化, 获取多个参数值;
基于多个所述 参数值, 构建表示 参数集;
获取预设的知识领域判断库; 所述知识领域判断库中判断参数集与知识领域判断结果
一一对应且相互关联;
将所述表示参数集与 所述知识领域判断库中各个所述判断参数集进行匹配, 获取匹配
符合的所述判断参数集对应关联的所述知识领域判断结果。
3.如权利要求1所述的用于智能问答的知识图谱自动 化构建方法, 其特征在于, 基于所
述使用参数和所述构建参数, 确定各个问答数据的关键度, 包括:
对所述使用参数和所述构建参数进行 特征提取, 确定多个特 征值;
基于多个所述特 征值, 查询预设的关键度量 化表, 确定所述问答数据的所述关键度;
其中, 所述特征值包括: 总使用次数、 最近一次使用时间、 上一预设的周期内的使用次
数、 构建时间、 构建人员的权限其中一种或多种结合;
所述关键度量 化表中所述特 征值与所述关键度对应关联。
4.如权利要求1所述的用于智能问答的知识图谱自动 化构建方法, 其特征在于, 所述从
大数据平台上获取数据对所述问答数据对应的知识图谱的数据进 行补充, 并确定补充的数
据的第四数据量, 包括:
确定所述问答数据中的所述实体的所述实体名称;
基于所述实体名称采用爬虫 软件从大 数据平台上获取待处 理数据;
解析所述待处 理数据, 构建对应所述实体的第三 三元组;
获取所述知识图谱中对应所述实体名称的第一 三元组和第二 三元组;
基于所述第一 三元组和所述第二 三元组, 对所述第三 三元组进行去重处 理;
经过去重处理后的所述第 三三元组为待补充进所述知识图谱的数据, 对应的数据量为
所述第四数据量。
5.如权利要求1所述的用于智能问答的知识图谱自动化构建方法, 其特征在于, 还包
括:
在提取待重建的问答系统的问答数据库之后, 获取 所述问答系统的使用记录;
解析所述使用记录, 确定各个问答数据的使用参数;
获取各个问答数据的构建参数;权 利 要 求 书 2/4 页
3
CN 114153993 B
3
专利 一种用于智能问答的知识图谱自动化构建方法及系统
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 08:54:34上传分享