(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202211091554.8 (22)申请日 2022.09.07 (65)同一申请的已公布的文献号 申请公布号 CN 115168567 A (43)申请公布日 2022.10.11 (73)专利权人 北京慧点科技有限公司 地址 100192 北京市海淀区西小口6 6号东 升科技园.北 领地C1-10 5 (72)发明人 张晓芳 陈科 张雷 郑元 杨斌  王文泽  (74)专利代理 机构 北京智桥联合知识产权代理 事务所(普通 合伙) 11560 专利代理师 金光恩 (51)Int.Cl. G06F 16/335(2019.01)G06F 16/35(2019.01) G06F 16/36(2019.01) (56)对比文件 CN 111666401 A,2020.09.15 CN 112784066 A,2021.0 5.11 CN 112364172 A,2021.02.12 CN 113157931 A,2021.07.23 US 2022147835 A1,202 2.05.12 审查员 刘栩宏 (54)发明名称 一种基于知识图谱的对象推荐方法 (57)摘要 本申请提供一种基于知识图谱的对象推荐 方法, 所述方法包括: 确定所述公文文本对应的 原始文本标签集合、 时间属性、 地域属性和部门 属性; 基于当前公文文本与公文知识图谱的匹配 关系, 确定当前公文文本对应的扩展文本标签集 合; 根据扩展文本标签集合以及当前公文文本的 类型, 在公文数据库中确定推荐对象。 本发明实 施例在构建公文知识图谱时使用了时间属性、 地 域属性和部门属性等公文文本的特征作为三元 组的实体关系, 并使用公文知识图谱扩展了公文 标签的丰富度, 并在使用知识图谱时同时考虑到 了文本标签的匹配和公文属性的匹配, 还在公文 对象推荐时利用文本类型的匹配值调整了公文 推荐的排序, 使得公文对象推荐的结果更具鲁棒 性。 权利要求书2页 说明书10页 附图2页 CN 115168567 B 2022.12.02 CN 115168567 B 1.一种基于知识图谱的对象推荐方法, 其特 征在于, 所述方法包括: 获取用户输入的当前公文文本, 并确定所述当前公文文本对应的原始文本标签集合、 时间属性、 地 域属性和部门属性; 基于所述当前公文文本对应的原始文本标签集合、 时间属性、 地域属性和部门属性, 与 公文知识图谱的匹配关系, 确定所述当前公文文本对应的扩展文本标签集合; 所述匹配关 系包括所述当前公文文本对应的原始文本标签集合与所述公文知识图谱中三元组的头实 体或尾实体的匹配关系, 以及所述当前公文文本对应的时间属 性、 地域属 性和部门属 性与 所述公文知识图谱中三元组的实体关系之间的匹配关系; 根据所述当前公文文本对应的扩展文本标签集合以及所述当前公文文本的类型, 在公 文数据库中确定目标公文 文本和/或目标公文 文本的审批信息作为推荐对象; 所述公文知识图谱通过如下 方式生成: 根据所述公文数据库的历史公文文本, 获取第 一三元组集合; 其中, 所述第 一三元组集 合中的每一目标三元 组是基于公文数据库中的某一历史公文文本生成的; 每一目标三元组 的头实体为所述历史公文文本中的第一标签, 尾实体为所述历史公文文本中与所述第一标 签关联的第二标签, 所述实体关系为表征所述历史公文文本的时间属 性、 地域属 性和部门 属性的特 征向量; 将所述第一三元组集合中头实体和尾实体相同或相反的目标三元组进行合并, 得到第 二三元组集 合; 根据所述第二 三元组集 合生成所述公文知识图谱。 2.根据权利要求1所述的对象推荐方法, 其特征在于, 所述根据 所述公文数据库的历史 公文文本, 获取第一 三元组集 合, 具体包括: 在所述公文数据库的任一公文文本进行高频实词搜索, 提取所述公文文本的第一标 签; 根据预设大小的窗口在所述第一标签邻近文本中搜索与所述第一标签对应的第二标 签; 以所述第一标签为头实体、 以所述第二标签为尾实体、 以表征所述公文文本的时间属 性、 地域属性和部门属性的特 征向量为实体关系, 生成对应的第一 三元组; 根据所有生成的所述第一 三元组, 得到第一 三元组集 合。 3.根据权利要求1所述的对象推荐方法, 其特征在于, 所述将所述第 一三元组集合中头 实体和尾实体相同或相反的目标三元组进行合并, 得到第二 三元组集 合, 具体包括: 在所述第一三元组集合中, 若某一第 一三元组的头实体和尾实体与另一第 一三元组 的 头实体和尾实体分别相同或在公文字典中为近义关系, 或者, 某一第一三元组的头实体和 尾实体与另一第一三元组的尾实体和头实体分别相同或在公文字典中为近义关系, 则将两 个第一三元组合并为第二 三元组; 根据合并得到的所有第二 三元组, 得到第二 三元组集 合。 4.根据权利要求3所述的对象推荐方法, 其特征在于, 若某一第 一三元组 的头实体和尾 实体与另一第一三元组的头实体和尾实体分别相同或在公文字典中为近义关系, 或者, 某 一第一三元组的头实体和尾实体与另一第一三元组的尾实体和头实体分别相同或在公文 字典中为近义关系, 所述第二三元组的头实体和尾实体分别为所述某一第一三元组的头实权 利 要 求 书 1/2 页 2 CN 115168567 B 2体和尾实体。 5.根据权利要求3所述的对象推荐方法, 其特征在于, 若某一第一三元组的头实体和/ 或尾实体与另一第一三元组的头实体和/或尾实体分别 在公文字典中为近义关系, 或者, 某 一第一三元组的头实体和/或尾实体与另一第一三元组的尾实体和/或头实体分别在公文 字典中为近义关系, 所述第二三元组的头实体和/或尾实体的属 性值分别为所述另一第一 三元组的头实体和/或尾实体。 6.根据权利要求3所述的对象推荐方法, 其特征在于, 所述第 二三元组 的实体关系为所 述某一第一 三元组和所述另一第一 三元组的实体关系的平均值。 7.根据权利要求1所述的对象推荐方法, 其特征在于, 所述根据 所述当前公文文本对应 的扩展文本标签集合以及所述当前公文文本的类型, 在公文数据库中确定目标公文文本 和/或目标公文 文本的审批信息作为推荐对象, 具体包括: 基于所述当前公文文本对应的扩展文本标签集合在所述公文数据库中进行标签匹配, 确定潜在目标公文 文本的第一 排序结果; 根据所述当前公文文本的类型与潜在目标公文文本类型的匹配值, 调整所述潜在目标 公文文本的第一 排序结果, 得到潜在目标公文 文本的第二 排序结果; 将所述潜在目标公文文本的第 二排序结果中排名靠前的目标公文文本和/或 目标公文 文本的审批信息作为推荐对象。 8.根据权利要求1所述的对象推荐方法, 其特征在于, 所述基于所述当前公文文本对应 的原始文本标签集合、 时间属性、 地域属性和部门属性, 与公文知识图谱的匹配关系, 确定 所述当前公文 文本对应的扩展 文本标签集 合, 具体包括: 基于所述当前公文文本对应的原始文本标签集合与所述公文知识图谱中三元组的头 实体或尾实体的匹配关系, 以及所述当前公文文本对应的时间属 性、 地域属 性和部门属 性 与所述公文知识图谱中三元组的实体关系之间的匹配关系, 在所述 公文知识图谱中查找与 所述当前公文 文本对应的扩展标签; 将所述扩展标签合并到所述原始文本标签集合中, 得到所述当前公文文本对应的扩展 文本标签集 合。 9.根据权利要求1所述的对象推荐方法, 其特征在于, 所述原始文本标签集合是对所述 当前公文文本进行实体抽取后得到的; 所述时间属 性、 地域属 性和部门属 性是在电子公文 系统中提取 得到的。权 利 要 求 书 2/2 页 3 CN 115168567 B 3

.PDF文档 专利 一种基于知识图谱的对象推荐方法

安全报告 > 其他 > 文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于知识图谱的对象推荐方法 第 1 页 专利 一种基于知识图谱的对象推荐方法 第 2 页 专利 一种基于知识图谱的对象推荐方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常2024-03-17 23:39:03上传分享
给文档打分
您好可以输入 255 个字符
网站域名是多少( 答案:github5.com )
评论列表
  • 暂时还没有评论,期待您的金玉良言
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。