全网唯一标准王
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202210996111.7 (22)申请日 2022.08.19 (65)同一申请的已公布的文献号 申请公布号 CN 115062609 A (43)申请公布日 2022.09.16 (73)专利权人 北京语言大 学 地址 100083 北京市海淀区学院路15号 (72)发明人 杨麟儿 余婧思 师佳璐 肖丹  杨尔弘  (74)专利代理 机构 北京市广友专利事务所有限 责任公司 1 1237 专利代理师 张仲波 (51)Int.Cl. G06F 40/211(2020.01) G06F 40/30(2020.01)G06F 40/268(2020.01) G06F 40/289(2020.01) (56)对比文件 CN 106708800 A,2017.0 5.24 CN 106708800 A,2017.0 5.24 CN 114742054 A,202 2.07.12 CN 109241538 A,2019.01.18 CN 112183059 A,2021.01.0 5 审查员 霍玉明 (54)发明名称 一种汉语增强依存句法的方法及装置 (57)摘要 本发明公开了一种汉语增强依存句法的方 法及装置, 涉及自然语 言处理技术领域。 包括: 获 取待增强的句子; 获取句子的基础依存句法结 果; 基于构建好的依存增强规则集与句子的基础 依存句法结果进行匹配, 得到待增强的句子的增 强依存句法结果。 本发明具有逻辑清晰、 效率高、 比较全面的优点, 妥善解决了 现有依存句法分析 无法充分表达实词间的语义关系, 增加了进一步 研究和应用的工作量的问题。 权利要求书2页 说明书10页 附图2页 CN 115062609 B 2022.12.09 CN 115062609 B 1.一种汉语增强依存句法的方法, 其特 征在于, 所述方法包括: S1、 获取待增强的句子; S2、 获取所述句子的基础依存句法结果; S3、 基于构建好的依存增强规则集与所述句子的基础依存句法结果进行匹配, 得到所 述待增强的句子的增强依存句法结果; 所述S3中的依存增强规则集包括介词和连词的增强规则、 并列项的增强规则、 句式转 换的增强规则、 特殊句式的增强规则以及不确定句式的增强规则; 所述句式转换的增强规则包括被动句的增强规则、 把字句的增强规则、 形容词修饰语 的增强规则以及动词短语修饰 语的增强规则; 其中, 所述被动句的增强规则包括: 获取句子中的谓语以及被动主语, 对所述谓语以及 被动主语增 加标签为dobj的依存弧; 所述被动句的增强规则还包括: 获取句子中被动短语的动词以及中心语, 对所述被动 短语的动词以及中心语增 加标签为dobj的依存弧; 所述把字句的增强规则包括: 获取句子中的动词以及由把字引导的宾语, 对所述动词 以及由把字引导的宾语增 加标签为dobj的依存弧; 所述形容词修饰语的增强规则包括: 获取句子中由形容词修饰的中心语以及动词, 对 所述由形容词修饰的中心语以及动词增 加标签为 nsubj的依存弧; 所述动词短语修饰语的增强规则包括: 获取句子中由动词短语修饰的中心语以及动 词, 对所述由动词短语修饰的中心语以及动词增 加标签为dobj的依存弧。 2.根据权利要求1所述的方法, 其特征在于, 所述S2中的获取所述句子的基础依存句法 结果包括: 基于斯坦福依存句法框架, 获取 所述句子的基础依存句法结果。 3.根据权利要求1所述的方法, 其特征在于, 所述介词和连词的增强规则包括介词的增 强规则以及连词的增强规则; 其中, 所述介词的增强规则包括: 获取句子中介词的依存标签, 在所述介词的依存标签 上添加介词提 示, 将所述依存标签与所述介词提 示采用下划线连接; 所述连词的增强规则包括: 获取句子中连词的依存标签, 在所述连词的依存标签上添 加连词提 示, 将所述依存标签与所述连词提 示采用下划线连接 。 4.根据权利要求1所述的方法, 其特 征在于, 所述并列项的增强规则包括: 获取句子中存在并列依存关系的多个词语; 获取所述多个词语中任一词语与句子中支配词或 从属词间的依存关系; 对其他存在并列依存关系的词语与 所述支配词或从属词增加所述依存关系的依存弧; 其中, 所述其他存在并列依存关系的词语包括存在并列 依存关系的多个词语中除了所获取 的词语外的其 他词语。 5.根据权利要求1所述的方法, 其特征在于, 所述特殊句式的增强规则包括兼语句的增 强规则、 连动句的增强规则以及 省略成分的增强规则; 其中, 所述兼语句的增强规则包括: 获取句子中的兼语以及兼语后的谓语, 对所述兼语 以及兼语后的谓语增 加标签为 nsubj的依存弧; 所述连动句 的增强规则包括: 获取句子中由两个及两个以上动词构成的谓语中的动权 利 要 求 书 1/2 页 2 CN 115062609 B 2词, 对所述动词以及所述动词的主语增 加标签为 nsubj的依存弧; 所述省略成分的增强规则包括: 获取句子中省略主语或宾语的小句, 获取句子中所述 小句的主语或宾语, 对所述主语或宾语增 加表示主语或宾语依存关系的依存弧。 6.根据权利要求1所述的方法, 其特征在于, 所述不确定句式的增强规则包括: 当需要 添加或修改的依存关系不确定时, 为所述依存关系增 加UNC标记; 所述不确定句式的增强规则还包括: 当为同一个词语添加的同一类依存关系 存在两个 及两个以上 可能时, 为所述依存关系增 加ALT标记。 7.根据权利要求1所述的方法, 其特征在于, 所述S3 中的基于构建好的依存增强规则集 与所述句子的基础依存句法结果进行匹配, 得到所述待增强的句子的增强依存句法结果包 括: S31、 将所述句子的基础依存句法结果与构建好的依存增强规则集中的所有增强规则 进行匹配, 获取成功匹配的增强规则, 将所述成功匹配的增强规则作用于所述句 子的基础 依存句法结果上; S32、 重复上述步骤S31, 直到不产生新的成功匹配的增强规则, 输出所述待增强的句子 的增强依存句法结果。 8.一 种汉语增强依存句法的装置, 其特 征在于, 所述装置包括: 获取模块, 用于获取待增强的句子; 基础结果获取模块, 用于获取 所述句子的基础依存句法结果; 输出模块, 用于基于构建好的依存增强规则集与 所述句子的基础依存句法结果进行匹 配, 得到所述待增强的句子的增强依存句法结果; 所述依存增强规则集包括介词和连词的增强规则、 并列项的增强规则、 句式转换的增 强规则、 特殊句式的增强规则以及不确定句式的增强规则; 所述句式转换的增强规则包括被动句的增强规则、 把字句的增强规则、 形容词修饰语 的增强规则以及动词短语修饰 语的增强规则; 其中, 所述被动句的增强规则包括: 获取句子中的谓语以及被动主语, 对所述谓语以及 被动主语增 加标签为dobj的依存弧; 所述被动句的增强规则还包括: 获取句子中被动短语的动词以及中心语, 对所述被动 短语的动词以及中心语增 加标签为dobj的依存弧; 所述把字句的增强规则包括: 获取句子中的动词以及由把字引导的宾语, 对所述动词 以及由把字引导的宾语增 加标签为dobj的依存弧; 所述形容词修饰语的增强规则包括: 获取句子中由形容词修饰的中心语以及动词, 对 所述由形容词修饰的中心语以及动词增 加标签为 nsubj的依存弧; 所述动词短语修饰语的增强规则包括: 获取句子中由动词短语修饰的中心语以及动 词, 对所述由动词短语修饰的中心语以及动词增 加标签为dobj的依存弧。权 利 要 求 书 2/2 页 3 CN 115062609 B 3

PDF文档 专利 一种汉语增强依存句法的方法及装置

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种汉语增强依存句法的方法及装置 第 1 页 专利 一种汉语增强依存句法的方法及装置 第 2 页 专利 一种汉语增强依存句法的方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:14:07上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。