全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210112165.2 (22)申请日 2022.01.29 (71)申请人 北京金堤科技有限公司 地址 100086 北京市海淀区知春路6 5号院1 号楼B座20层20 01号 (72)发明人 佟德超  (74)专利代理 机构 北京工信联合知识产权代理 有限公司 1 1266 专利代理师 贾银秋 (51)Int.Cl. G06F 16/36(2019.01) (54)发明名称 一种目标对象多维图谱的生成方法、 装置和 存储介质 (57)摘要 本公开实施例公开了一种目标对象多维图 谱的生成方法和装置, 以及存储介质和电子设 备, 其方法包括: 响应于接收到针对目标对象的 搜索请求, 获取与目标对象对应的非企业相关数 据和企业相关数据, 非企业相关数据包括与目标 对象具有亲属关系、 好友关系和配偶关系中的至 少之一的至少一个第一关联对象的相关数据, 企 业相关数据包括与目标对象具有投资关系和/或 任职关系的至少一个第二关联对象的相关数据; 以及基于非企业相关数据和企业相关数据, 生成 以目标对象、 至少一个第一关联对象和至少一个 第二关联对象为节点、 以及对应的关联关系为边 的目标对象多维图谱。 权利要求书3页 说明书11页 附图3页 CN 114547331 A 2022.05.27 CN 114547331 A 1.一种目标对象多维图谱的生成方法, 包括: 响应于接收到针对目标对象的搜索请求, 获取与 所述目标对象对应的非企业相关数据 和企业相关数据, 所述非企业相关数据包括与所述 目标对象具有亲属关系、 好友关系和配 偶关系中的至少之一的至少一个第一关联对象的相关数据, 所述 企业相关数据包括与所述 目标对象具有投资 关系和/或任职关系的至少一个第二关联对象的相关数据; 以及 基于所述非企业相关数据和所述企业相关数据, 生成以所述目标对象、 所述至少一个 第一关联对象和所述至少一个第二关联对象为节 点、 以及对应的关联关系为边的目标对象 多维图谱。 2.根据权利要求1所述的方法, 其中, 所述关联关系包括与所述目标对象具有的投资关系和与所述目标对象具有的任职关 系以及与所述目标对象具有以下关系中的至少一项的: 亲属关系 、 好友关系 、 配偶关系。 3.根据权利要求2所述的方法, 其中, 所述获取与 所述目标对象对应的非企业相关数据 和企业相关数据, 包括: 从多个数据源获取与所述目标对象对应的非 企业相关数据; 和/或 从企业信息库中获取与所述目标对象对应的企业相关数据。 4.根据权利要求3所述的方法, 其中, 所述从多个数据源获取与目标对象对应的非企业 相关数据, 包括: 从所述多个数据源获取目标对象的第一基本数据和关于目标对象的第一关系数据; 根据所述第一基本数据和所述第一关系数据, 确定与所述目标对象具有亲属关系和/ 或好友关系和/配偶关系的至少一个第一相关对象; 获取每个第一相关对象分别对应的第二基本数据和第二关系数据。 5.根据权利要求4所述的方法, 其中, 在所述获取每个第 一相关对象分别对应的第 二基 本数据和第二关系数据之后, 还 包括: 针对所述至少一个第 一相关对象中的每个, 获取并根据获取的当前相关对象对应的第 二基本数据和 第二关系数据, 确定与当前相关对象具有 亲属关系和/或好友 关系和/或配偶 关系的至少一个第二相关对象; 获取每个第二相关对象分别对应的第三基本数据和第三关系数据。 6.根据权利要求4所述的方法, 其中, 从多个数据源获取与所述目标对象对应的非企业 相关数据, 包括: 当所述数据源 包括第一数据源时, 从所述第一数据源获取与所述目标对象具有亲属关系和/或好友关系和/或配偶关系 的非企业相关数据。 7.根据权利要求6所述的方法, 其中, 在获取与所述目标对象具有亲属关系和/或好友 关系和/或配偶关系的非 企业相关数据之后, 还 包括: 针对所述目标对象, 通过预设正则表达式和预设抽取组合模型, 对与所述目标对象具 有亲属关系和/或好友 关系和/或配偶关系的非企业相关数据进 行关系抽取, 生成对应的关 系三元组, 其中, 所述关系三元组用于表征所述目标对象与相关对象之间的亲属关系和/或好友 关系和/或配偶关系。 8.根据权利要求3所述的方法, 其中, 所述从多个数据源获取与 所述目标对象对应的非权 利 要 求 书 1/3 页 2 CN 114547331 A 2企业相关数据之后, 还 包括: 对所述非 企业相关数据进行 数据处理, 得到处 理后的非 企业相关数据。 9.根据权利要求8所述的方法, 其中, 所述对所述非企业相关数据进行数据处理, 得到 处理后的非 企业相关数据, 包括: 对所述非企业相关数据进行脏数据过滤和脏数据清洗, 得到处理后的非企业相关数 据。 10.根据权利要求9所述的方法, 其中, 所述非企业相关数据中的脏数据包括以下至少一项: 爬取所述非企业相关数据时获取 的超文本标记语言标签、 所述非企业相关数据中包含的无法识别的乱码和冗余的标点符 号。 11.根据权利要求8所述的方法, 其中, 所述对所述非企业相关数据进行数据处理, 得到 处理后的非 企业相关数据, 包括: 若所述非企业相关数据均来源于同一数据源, 获取与该数据源匹配的第一基本模块; 判断所述非企业相关数据中的当前目标对 象相关信息的字段格式是否符合所述第一基本 模块中的字段格式, 若否, 则基于与该数据源匹配的所述第一基本模块中的字段格式, 对所 述非企业相关数据中的当前目标对象相关信息的字段进行格式转换处理, 得到处理后的所 述非企业相关数据。 12.根据权利要求8所述的方法, 其中, 对所述非企业相关数据进行处理, 得到处理后的 非企业相关数据, 包括: 若所述非企业相关数据来源于不同的数据源, 则基于每个非企业相关数据分别所属的 数据源, 对每 个非企业相关数据执 行以下数据格式转换操作: 确定当前非企业相关数据所属的数据源以及当前非企业相关数据中的当前目标对象 相关信息的字段; 获取与该 数据源匹配的预设字段格式; 判断当前非企业相关数据中的当前目标对象相关信息的字段格式是否符合所述预设 字段格式, 若否, 则基于所述预设字段格式, 对当前非企业相关数据中的当前目标对象相关 信息的字段进行格式转换处 理, 得到处 理后的非 企业相关数据。 13.根据权利要求1所述的方法, 其中: 所述搜索请求中携带有对象基本信 息和对象详情信 息, 所述企业相关数据存储于预设 数据库中: 所述方法还 包括: 基于所述对象基本信息和所述对象详情信息, 从多个待选对象中确定出所述目标对 象, 并从所述预设数据库中读取与所述目标对象对应的投资信息和/或任职信息 。 14.根据权利要求13所述的方法, 其中, 基于所述对象基本信息和所述对象详情信息, 从多个待选对象中确定出 所述目标对象, 包括: 基于所述对象基本信息从多个待选对象中确定 至少一个候选对象; 基于所述对象详情信 息和预设文本之间的相似度, 从所述至少一个候选对象中确定出 所述目标对象。 15.一种目标对象多维图谱的生成装置, 包括:权 利 要 求 书 2/3 页 3 CN 114547331 A 3

.PDF文档 专利 一种目标对象多维图谱的生成方法、装置和存储介质

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种目标对象多维图谱的生成方法、装置和存储介质 第 1 页 专利 一种目标对象多维图谱的生成方法、装置和存储介质 第 2 页 专利 一种目标对象多维图谱的生成方法、装置和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:54:41上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。