全网唯一标准王
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202210511295.3 (22)申请日 2022.05.12 (65)同一申请的已公布的文献号 申请公布号 CN 114610891 A (43)申请公布日 2022.06.10 (73)专利权人 湖南工商大 学 地址 410205 湖南省长 沙市岳麓 大道569号 (72)发明人 陈晓红 郑旭哲 梁伟 吴嘉懿  胡东滨  (74)专利代理 机构 长沙轩荣专利代理有限公司 43235 专利代理师 董崇东 (51)Int.Cl. G06F 16/35(2019.01) G06F 40/253(2020.01) G06F 40/284(2020.01) G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01)G06Q 10/04(2012.01) G06Q 50/18(2012.01) (56)对比文件 CN 113536780 A,2021.10.2 2 CN 110750635 A,2020.02.04 CN 110717843 A,2020.01.21 CN 112183094 A,2021.01.0 5 WO 202025 3052 A1,2020.12.24 陶永才等.一种结合 LSTM和集成算法的文本 校对模型. 《小型微型计算机系统》 .2020,(第0 5 期), 张虎等.面向法律裁判文 书的法条推荐方 法. 《计算机科 学》 .2019,第46卷(第9期), (续) 审查员 王辞 (54)发明名称 面向不平衡司法裁判文书数据的法条推荐 方法及系统 (57)摘要 本发明提供了一种面向不平衡司法裁判文 书数据的法条推荐方法及系统, 将获取的司法裁 判文书数据输入模型并预处理, 进行序列化得到 模型的训练集; 将训练集通过基于预训练模型的 嵌入层, 得到文本的向量表示; 将文本向量通过 CNN (卷积神经网络) 获取文本特征; 将训练集通 过基于语 法依赖信息的词语搭配算法, 得到文本 的词语搭配特征; 将文本特征和词语搭配特征通 过神经网络进行融合, 得到混合语义向量; 将混 合语义向量输入到深层神经网络中, 输出法条预 测结果; 基于法条预测结果和真实司法裁判文书 的法条标签进行模型训练, 并将训练完成的模型 用于司法案件的辅助判决, 能有效在极度不平衡数据下推荐适用的法条辅助法官进行司法裁判。 [转续页] 权利要求书3页 说明书9页 附图2页 CN 114610891 B 2022.07.22 CN 114610891 B (56)对比文件 Matthew E.Peters等.De ep contextual ized word representati ons. 《Proceedings of the 2018 Co nference of the North American C hapter of the Association for Computati onal Linguistics》 .2018, 王旭.基于法律裁判文 书的法条推荐研究与 应用. 《万方数据库》 .2021, 肖莉才.文本摘要生成技 术研究与应用. 《万 方数据库》 .2021,2/2 页 2[接上页] CN 114610891 B1.一种面向不平衡司法裁判文 书数据的法条推荐方法, 其特 征在于, 包括如下步骤: S1, 将获取的司法裁判文书数据输入模型, 对原始的裁判文书进行数据预处理, 并且将 预处理后的文本数据进行序列化得到模型的训练集; S2, 将训练集 通过基于预训练模型的嵌入层, 得到文本的向量表示; S3, 将文本向量 通过卷积神经网络获取文本特 征; S4, 将训练集通过基于语法依赖信息的词语搭配算法, 得到文本的词语搭配特征; 通过 句中词语语法依赖信息获取词语的搭配信息, 并通过结合注意力机制的双向长 短期记忆神 经网络将搭配的单词向量 合并, 得到词语搭配特 征; 具体包括如下子步骤: S 4 1 ,通 过 词 语 的 依 赖 关 系 提 取 词 语 序 列 的 词 语 搭 配 序 列 , , 其中 , 代表了 中的两个词; S42, 将每个词转换成其对应的语义向量, 得到搭配嵌入 和句向量 , 其中 是搭配词语 的嵌入向量; S43, 将每个单词组中的单词嵌入向量 和 通过一层结合注意力机制的双向长 短期记忆神经网络进行合并, 得到搭配 语义向量 , 具体计算公式如下 所示: 其中, 是第j时间下长短期记忆神经网络的正向 隐藏状态, 是第j时间下LSTM的反 向隐藏状态, 计算公式如下: 对于每一个搭配语义向量 , 将注意力 机制应用到词语搭配特征的计算过程中, 并且 得到词语搭配特 征 , 其具体的计算方式如下: 其中 是搭配语义向量 的注意力权 重值, 其计算公式如下: 其中 是权重矩阵, 是激活函数; S5, 将文本特征和词语搭配 特征通过神经网络进行融合, 得到混合语义向量 , 其计算 公式如下: 其中 是神经网络的权 重矩阵, 是偏置向量, 是矩阵加法; S6, 将混合语义向量输入到使用 作为激活函数的双层神经网络中进行法条的权 利 要 求 书 1/3 页 2 CN 114610891 B 3

.PDF文档 专利 面向不平衡司法裁判文书数据的法条推荐方法及系统

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 面向不平衡司法裁判文书数据的法条推荐方法及系统 第 1 页 专利 面向不平衡司法裁判文书数据的法条推荐方法及系统 第 2 页 专利 面向不平衡司法裁判文书数据的法条推荐方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:15:21上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。