全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211030073.6 (22)申请日 2022.08.26 (71)申请人 广西师范大学 地址 541004 广西壮 族自治区桂林市七 星 区育才路15号 (72)发明人 朱俊霖 罗旭东 张鑫瑞  (74)专利代理 机构 桂林市华杰 专利商标事务所 有限责任公司 451 12 专利代理师 周雯 (51)Int.Cl. G06F 40/211(2020.01) G06F 16/33(2019.01) G06F 16/36(2019.01) G06F 17/16(2006.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 一种基于领域图谱感知的类 案检索方法 (57)摘要 本发明公开一种基于领域图谱感知的类案 检索方法, 通过实体感知操作在领域图谱中识别 出所有的领域实体, 并将领域实体 之间丰富的关 联信号和领域知识融入到源实体中。 为了增强查 询实体和候选实体的向量表示, 利用多层级图神 经网络来捕获领域图谱中的实体 之间的联系。 最 后将每个实体的特征表示扩散到整个图, 同时也 将多级邻居节 点的特征表示聚合到每个实体上, 从而完成更加深入的信息交互, 最终实现了以更 高效率、 更高精度完成法律场景下的相似案件检 索。 权利要求书2页 说明书6页 附图1页 CN 115409019 A 2022.11.29 CN 115409019 A 1.一种基于领域图谱感知的类案检索方法, 其特 征在于, 包括如下步骤: 步骤1、 将案件数据库中的候选案件按句子进行切分, 利用TF ‑IDF计算每个句子与查询 案件的相似度, 并按照相似度从高到底进行排序, 选取前K个句子组合成新的候选案件; 然 后分别抽取 出查询案件与候选 案件中的关键实体得到一组查询实体集和一组候选实体集; 步骤2、 将查询实体集和候选实体集中的每个实体与领域图谱中的实体进行匹配, 得到 每个实体所对应的所有相关的领域实体的三元组集 合; 步骤3、 将实体的三元组集合中的每个实体三元组输入预训练语言模型BERT得到对应 的三元组向量表示; 然后, 利用聚合操作, 将实体所匹配到的所有关联实体、 关系 特征聚合 到该实体上 得到一个初始向量表示; 步骤4、 通过点积操作计算查询实体和候选实体的节点特征矩阵, 然后对节点特征矩阵 进行归一 化, 并使用归一 化后的矩阵来构建一个图神经网络进行训练; 步骤5、 构造图神经网络所需要的邻接矩阵, 该矩阵描述了节点之间的关系; 具体而言, 利用了领域图谱的连接关系来作为图神经网络中的实体之间的连接关系; 步骤6、 通过图神经网络学习查询实体和候选实体的向量表示, 并捕 获领域图谱中的实 体之间的联系; 此外, 为了缓解图神经网络在传播信号的过程中出现的梯度爆炸和梯度消 失的问题, 需要将邻接矩阵进行归一 化; Di,i=ΣjAi,j, 图神经网络在经过多层级传播之后将一个实体的特征表示扩散到整个图, 同时也能将 邻居节点的特 征表示聚合到自身上, 从而更加深入的完成信息交 互; 步骤7、 在得到全图节点的特征表示之后, 聚合所有节点的特征表示并通过线性层来计 算最终的相似度得分; 权 利 要 求 书 1/2 页 2 CN 115409019 A 2上述式中, pi表示实体集中的第i个实体, l∈{q,c}表示案件的类别, q是查询案件, c是 候选案件, 和 分别表示三元组中的头实体、 关系和尾实体的向量表示, 表示实体 集中的实体pi对应的初始向量表示, n表示查询实体 集或候选实体 集中实体pi与领 域图谱所匹配到的三元组个数; N和M分别表示查询实体集和候选实体集中实体 的个数; X* 表示节点特征矩阵, 用于图神经网络的初始输入向量表示; 是领域图谱, f( ·)是一个匹 配函数, 若候选实体集中的实体pi和实体pj都属于 则f(pi,pj)=1, 表示pi和pj之间有连 接关系; 表示归一化后的邻接矩阵, D是一个对角度矩阵, 通过引入自身度矩阵来解决自 传递问题; Z(t)表示经过t层图神经网络传播之后获得的全图节 点的向量表 示, t是一个自定 义的超参数, σ 是一个非线性激活函数, 为ReLU( ·), W(t‑1)表示第t‑1层的可学习的权重 参数 矩阵; Wo表示预测层神经网络的可学习的权重参 数矩阵, bo表示预测层神经网络的偏置项; o 表示查询 案件和候选案件的相关程度, y表示预测层神经网络输出 的每个类别分数, Y表示 每个类别经过归一化后的最终预测分数; ·表示点乘,⊙表示哈达 玛积; 上标T表示转置。权 利 要 求 书 2/2 页 3 CN 115409019 A 3

.PDF文档 专利 一种基于领域图谱感知的类案检索方法

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于领域图谱感知的类案检索方法 第 1 页 专利 一种基于领域图谱感知的类案检索方法 第 2 页 专利 一种基于领域图谱感知的类案检索方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-17 23:39:18上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。