全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 20221025425 5.5 (22)申请日 2022.03.15 (71)申请人 云粒智慧科技有限公司 地址 100037 北京市西城区阜成门外大街 甲28号西楼13层0 6室 (72)发明人 许志远 吴海燕 许玲  (74)专利代理 机构 北京品源专利代理有限公司 11332 专利代理师 苏舒音 (51)Int.Cl. G06F 16/36(2019.01) G06F 40/295(2020.01) (54)发明名称 垂直行业数据的三元组构建方法、 装置、 电 子设备及 介质 (57)摘要 本发明公开了一种垂直行业数据的三元组 构建方法、 装置、 设备及介质。 该方法包括: 针对 从相同垂直行业的多个实体中确定的每一个待 处理实体组, 对待处理实体组 中两个实体之间的 实体属性进行匹配得到至少一个实体属性关联 组; 对同一实体属性关联组中实体属性进行关联 度加权, 得到待处理实体组中两个实体的关联结 果; 依据待处理实体组中两个实体的关联结果, 确定是否对待处理实体组中两个实体构建实体 三元组。 本发 明实施例能够在 有限集的实体范围 内构建知识图谱用到的三元 组, 极大提升构建效 率, 同时保障三元组关系的准确性。 权利要求书2页 说明书9页 附图3页 CN 114942996 A 2022.08.26 CN 114942996 A 1.一种垂直行业数据的三元组构建方法, 其特 征在于, 所述方法包括: 针对从相同垂直行业的多个实体中确定的每一个待处理实体组, 对待处理实体组中两 个实体之间的实体属性进行匹配得到 至少一个实体属性关联组; 对同一实体属性关联组中实体属性进行关联度加权, 得到待处理实体组中两个实体的 关联结果; 依据待处理实体组中两个实体的关联结果, 确定是否对待处理实体组中两个实体构建 实体三元组。 2.根据权利要求1所述的方法, 其特征在于, 对待处理实体组中两个实体之间的实体属 性进行匹配得到 至少一个属性关联组, 包括: 对待处理实体组中每个实体原有的实体属性进行归纳汇总, 得到每个实体的实体属性 分类; 依据每个实体的实体属性分类, 将同属一个属性分类的待处理实体组中两个实体之间 的实体属性进行匹配, 得到 至少一个实体属性关联组。 3.根据权利要求1所述的方法, 其特征在于, 对同一实体属性关联组中实体属性进行关 联度加权, 得到待处 理实体组中两个实体的关联 结果, 包括: 确定各所述实体属性关联组中两个实体属性的关联度, 将同一所述实体属性关联组中 的两个实体属性进行关联度加权; 依据各所述实体属性关联组对应的关联度加权值, 确定待处理实体组中两个实体的关 联结果。 4.根据权利要求3所述的方法, 其特征在于, 确定各所述实体属性关联组中两个实体属 性的关联度, 包括: 针对每个所述实体属性关联组, 确定所述实体属性关联组中各个实体属性的属性 值; 依据各个实体属性的属性值, 确定所述实体属性关联组中两个实体属性之间的关联 度。 5.根据权利要求4所述的方法, 其特征在于, 将同一所述实体属性关联组中的两个实体 属性进行关联度加权, 包括: 确定同一所述实体属性关联组中两个实体属性的权 重 将同一所述实体属性关联组中两个实体属性之间的关联度与两个实体属性的权重进 行相乘, 得到所述实体属性关联组对应的关联度加权值。 6.根据权利要求3所述的方法, 其特征在于, 依据 各所述实体属性关联组对应的关联度 加权值, 确定待处 理实体组中两个实体的关联 结果, 包括: 将各所述实体属性关联组对应的关联度加权值求和, 得到所述待处理实体组 的关联度 加权值和; 若所述待处理实体组 的关联度加权值和大于关联度加权 阈值, 则确定待处理实体组中 两个实体之间存在关联关系; 若所述待处理实体组 的关联度加权值和小于关联度加权 阈值, 则确定待处理实体组中 两个实体之间不存在关联关系。 7.根据权利要求6所述的方法, 其特征在于, 所述关联度加权 阈值基于多个目标实体组 中两个实体之 间关联结果的判断准确度进 行动态调整, 以便动态调整后重新对待处理实体权 利 要 求 书 1/2 页 2 CN 114942996 A 2组进行关联关系判断; 所述多个目标实体组包括从关联度加权值和大于关联度加权阈值的 待处理实体组中随机 筛选的确定 。 8.一种垂直行业数据的三元组构建装置, 其特 征在于, 所述装置包括: 属性匹配模块, 用于针对从相同垂直行业的多个实体中确定的每一个待处理实体组, 对待处理实体组中两个实体之间的实体属性进行匹配得到 至少一个实体属性关联组; 关联结果确定模块, 用于对 同一实体属性关联组中实体属性进行关联度加权, 得到待 处理实体组中两个实体的关联 结果; 三元组构建模块, 用于依据待处理实体组中两个实体的关联结果, 确定是否对待处理 实体组中两个实体构建实体三元组。 9.一种电子设备, 其特 征在于, 所述电子设备包括: 至少一个处 理器; 以及 与所述至少一个处 理器通信连接的存 储器; 其中, 所述存储器存储有可被所述至少一个处理器执行的计算机程序, 所述计算机程序被所 述至少一个处理器执行, 以使所述至少一个处理器能够执行权利要求1 ‑7中任一项所述的 垂直行业数据的三元组构建方法。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有计算机指 令, 所述计算机指令用于使处理器执行时实现权利要求1 ‑7中任一项所述的垂直行业数据 的三元组构建方法。权 利 要 求 书 2/2 页 3 CN 114942996 A 3

.PDF文档 专利 垂直行业数据的三元组构建方法、装置、电子设备及介质

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 垂直行业数据的三元组构建方法、装置、电子设备及介质 第 1 页 专利 垂直行业数据的三元组构建方法、装置、电子设备及介质 第 2 页 专利 垂直行业数据的三元组构建方法、装置、电子设备及介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:56:29上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。