全网唯一标准王
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202210147145.9 (22)申请日 2022.02.17 (65)同一申请的已公布的文献号 申请公布号 CN 114706992 A (43)申请公布日 2022.07.05 (73)专利权人 中科雨辰科技有限公司 地址 100093 北京市海淀区清琴麓 苑170号 楼2层 (72)发明人 张正义 刘宸 傅晓航 常鸿宇  (74)专利代理 机构 北京锺维联合知识产权代理 有限公司 1 1579 专利代理师 安娜 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/35(2019.01)G06F 16/332(2019.01) G06K 9/62(2022.01) (56)对比文件 CN 113590737 A,2021.1 1.02 CN 111143578 A,2020.0 5.12 CN 112269885 A,2021.01.26 审查员 高小霞 (54)发明名称 一种基于知识图谱的事 件信息处 理系统 (57)摘要 本发明提供了一种基于知识图谱的事件信 息处理系统, 所述系统包括: 第一数据库、 第二数 据库、 处理器和存储有计算机程序的存储器, 第 一数据库包括: 样本事件ID和样本事件ID 对应的 样本文本列表, 当计算机程序被处理器执行时, 实现以下步骤: 从第一数据库中获取样本事件ID 对应的样 本文本并根据样本文本, 获取样本文本 对应的多元 组列表; 根据所有样 本文本和样本文 本对应的多元组列表, 获取训练集数据; 将获取 训练集数据输入至多元组构建模 型进行训练, 得 到目标多元 组构建模型。 本发明能够根据实际样 本事件构建训练集并获取目标多元组构建模型, 使得准确的识别出同一实体不同描述, 提高了模 型的准确性和适用性。 权利要求书2页 说明书6页 附图2页 CN 114706992 B 2022.09.30 CN 114706992 B 1.一种基于知识图谱的事件信息处理系统, 其特征在于, 所述系统包括: 第一数据库、 第二数据库、 处理器和存储有计算机程序的存储器, 所述第一数据库包括: 样本事件ID和样 本事件ID对应的样 本文本列表, 第二数据库包括: 样 本事件ID、 样 本事件ID对应的事件类型 和事件类型对应的预设多元组列表, 当所述计算机程序被处 理器执行时, 实现以下步骤: S 1 0 0 、从 所 述 第 一 数 据 库 中 获 取 A = (A1, A2,… …, Ai,… …, Am) , 其中, Aij是指第i个样本事件ID对应的第j 个样本文本, i=1 ……m, m为样本事件数量, j=1 ……ni, ni为第i个样本事件ID对应的样本 文本列表中所有样本文本数量; S200、 根据 Aij, 获取Aij对应的初始实体列表 其 中, 是指Aij对应的第q个初 始实体, q=1 ……p, p为初始实体数量, 其中, 在步骤S2 00中, 还包括如下步骤: S201、 获取Aij的触发词且 根据Aij的触发词与预设触发词数据库中每一预设触发词进行 比对; S203、 根据Aij的触发词与预设触发词数据库中任一预设触发词一致时, 确定出Aij的事 件类型; S205、 从第二数据库中获取Aij的事件类 型对应的预设多元组且 根据Aij的事件类 型对应 的预设多元组, 获取Aij对应的多元组列表; S 3 0 0 、根 据 Aq i j, 获 取 Ai对 应 的 样 本 事 件 I D 的 中 间 数 据 集 其中, S400、 根据 获取Ai对应的样本事件ID的训练集, 其中, 在 步骤S400中, 还包括如下步 骤: S401、 遍历Aq i, 获取Aq i对应的实体数量列表 是指在Aq i中第x实体种类的数量, 其中, x=1 ……sq, sq为在Aq i中第q实体的种类数量; S403、 根据Bq ix, 获取Bq ix对应的概率值Fq ix, Fq ix符合如下条件: Fq ix=Bq ix/Bq i0, 其中, Bq i0 是指Bq i中最大数量值; S405、 当Fq ix>预设的概率阈值F0时, 确定Fq ix对应的实体作为中间实体, 构建Fq ix对应的 中间实体列表且确定Bq i0对应的实体作为关键实体Hq i0; S407、 遍历Fq ix对应的中间实体列表且从Fq ix对应的中间实体列表中获取Hq i0对应的所 有关联实体(Hq i1, Hq i2,……, Hq ikq), kq为Hq i0对应的关联实体数量; S409、 将Hq i0和Hq i0对应的所有关联实体(Hq i1, Hq i2,……, Hq ik), 构建成Aq i对应的关键实 体列表Hq i=(Hq i0, Hq i1, Hq i2,……, Hq ikq)且基于Hq i构建成Ai对应的样本事 件ID的训练集; S500、 基于所有Ai对应的样本事 件ID的训练集, 构建成目标训练集数据; S600、 将目标训练集数据输入至事 件图谱模型进行训练, 得到目标事 件图谱模型。 2.根据权利要求1所述的基于知识图谱的事件信 息处理系统, 其特征在于, 关键实体的 关联实体是指所有中间实体中除关键实体之外的其 他中间实体。 3.根据权利要求1所述的基于知识图谱的事件信 息处理系统, 其特征在于, 所述样本事权 利 要 求 书 1/2 页 2 CN 114706992 B 2件ID对应的样 本事件是指预设时间段内发生的事件, 其中, 所述预设时间段的取值范围为 1 ~3年。 4.根据权利要求1所述的基于知识图谱的事件信 息处理系统, 其特征在于, 所有样本数 据列表的确定方式一 致。 5.根据权利要求1所述的基于知识图谱的事件信息处理系统, 其特征在于, 当p=3时, Aij对应的多元组列表(A1 ij、 A2 ij, A3 ij), 其中, A1 ij为第i个样本事件中第j个样本文本中第一 实体, A2 ij为第i个样本事 件中第j个样本文本中第二实体, A3 ij是指A1 ij和A2 ij之间关系。权 利 要 求 书 2/2 页 3 CN 114706992 B 3

.PDF文档 专利 一种基于知识图谱的事件信息处理系统

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于知识图谱的事件信息处理系统 第 1 页 专利 一种基于知识图谱的事件信息处理系统 第 2 页 专利 一种基于知识图谱的事件信息处理系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:52:47上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。