全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111678208.5 (22)申请日 2021.12.31 (71)申请人 深圳云天励飞技 术股份有限公司 地址 518000 广东省深圳市龙岗区园山 街 道龙岗大道8288号深圳大运软件小镇 17栋1楼 (72)发明人 刘国伟  (74)专利代理 机构 深圳驿航知识产权代理事务 所(普通合伙) 44605 专利代理师 杨伦 (51)Int.Cl. G06F 16/535(2019.01) G06F 16/538(2019.01) G06F 16/55(2019.01) G06F 16/583(2019.01)G06V 40/16(2022.01) G06V 10/74(2022.01) G06K 9/62(2022.01) (54)发明名称 档案合并方法、 装置、 电子设备及存 储介质 (57)摘要 本发明公开了一种档案合并方法、 装置、 电 子设备及存储介质, 该档案合并方法包括: 对归 档数据集中的任意两个归档数据进行相似度计 算, 得到相似度集合, 归档数据集为由同一人员 的多个归档数据组成的归档数据集; 根据相似度 集合, 确定多个归档数据之间的密度值集合; 根 据密度值集合及相似度集合计算多个归档数据 的距离值集合; 将满足预设条件的密度值和距离 值所对应的多个归档数据确定为多个聚类中心 点; 将多个聚类中心点对应的归档数据作为封面 图像。 本发明避免了生成的封面图像随机性较 大, 提升了封面图像的精准度和代 表性。 权利要求书2页 说明书9页 附图6页 CN 114443875 A 2022.05.06 CN 114443875 A 1.一种档案合并方法, 其特 征在于, 包括: 对归档数据集中的任意两个归档数据进行相似度计算, 得到相似度集合, 所述归档数 据集为由同一人员的多个归档数据组成的归档数据集; 根据所述相似度集 合, 确定多个所述归档数据之间的密度值 集合; 根据所述密度值 集合及所述相似度集 合计算多个所述归档数据的距离值 集合; 将满足预设条件的密度值和距离值所对应的多个归档数据确定为多个聚类中心点; 将所述多个聚类中心点对应的归档数据作为封面图像。 2.根据权利要求1所述的档案合并方法, 其特征在于, 所述根据 所述相似度集合确定多 个所述归档数据之间的密度值 集合包括: 确定所述相似度集 合中每个归档数据的相似度阈值; 根据每个归档数据的相似度阈值对所述相似度集 合进行筛 选; 根据预定算法将筛 选后的相似度集 合进行计算, 以得到所述密度值 集合。 3.根据权利要求2所述的档案合并方法, 其特征在于, 所述根据 预定算法将筛选后的相 似度集合进行计算, 以得到所述密度值 集合包括: 根据筛选后的所述相似度集 合确定出对应的相似度; 将所述相似度进行求和, 以得到每 个归档数据对应的多个密度值; 将多个所述归档数据对应的所述密度值进行排序, 得到所述密度值 集合。 4.根据权利要求1所述的档案合并方法, 其特征在于, 所述根据 所述密度值集合及所述 相似度集 合计算多个所述归档数据的距离值 集合包括: 根据每个归档数据的密度值集合对所述归档数据集进行排序, 并将排序后的所述归档 数据集进行筛 选; 将筛选后的所述归档数据集进行距离计算, 得到所述距离值 集合。 5.根据权利要求4所述的档案合并方法, 其特征在于, 所述根据每个归档数据的密度值 集合对所述归档数据集进行排序, 并将排序后的所述归档数据集进行筛 选包括: 根据每个归档数据的密度值将所述归档数据集由大到小 进行排序; 针对每个所述归档数据, 确定出密度值大于所述归档数据自身密度值的多个参考归档 数据; 在多个所述参考归档数据中确定出与所述归档数据之间相似度最小的目标归档数据, 以根据所述目标归档数据和所述归档数据进行距离计算。 6.根据权利要求1所述的档案合并方法, 其特 征在于, 所述方法还 包括: 根据所述多个聚类中心点, 将所述归档数据集进行合并, 得到聚类簇集合; 其中, 每个 所述聚类簇包括对应的封面图像; 根据所述聚类簇集 合确定每 个聚类簇的封面图像; 在多个所述聚类簇与所述封面图像满足预设 关系时, 将多个所述聚类簇进行合并。 7.根据权利要求6所述的档案合并方法, 其特征在于, 所述在所述 聚类簇集合与所述封 面图像满足预设 关系时, 将多个所述聚类簇进行合并包括: 判断多个所述聚类簇的数量是否大于所述封面图像的数量; 当多个所述聚类簇的数量大于所述封面图像的数量 时, 确定两两聚类簇的聚类中心点 之间的相似度;权 利 要 求 书 1/2 页 2 CN 114443875 A 2在两两所述聚类中心点的相似度大于预设相似度的情况下, 将对应的两两聚类簇进行 合并。 8.一种档案合并装置, 其特 征在于, 包括: 第一计算模块, 用于对所述归档数据集中的任意两个归档数据进行相似度计算, 得到 相似度集 合, 所述归档数据集 为由同一人员的多个归档数据组成的归档数据集; 第一确定模块, 用于根据所述相似度集 合确定多个所述归档数据之间的密度值 集合; 第二计算模块, 用于根据所述密度值集合及所述相似度集合计算多个所述归档数据的 距离值集合; 第二确定模块, 用于将满足预设条件的密度值和距离值所对应的多个归档数据确定为 多个聚类中心点; 第三确定模块, 用于将所述多个聚类中心点对应的归档数据作为封面图像。 9.一种电子设备, 包括存储器、 处理器以及存储在所述存储器中并可在所述处理器上 运行的计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现如权利要求1至7 任一项所述的档案合并方法的步骤。 10.一种计算机可读存储介质, 所述计算机可读存储介质存储有计算机程序, 其特征在 于, 所述计算机程序被处理器执行时实现如权利要求 1至7任一项 所述的档案合并方法的步 骤。权 利 要 求 书 2/2 页 3 CN 114443875 A 3

.PDF文档 专利 档案合并方法、装置、电子设备及存储介质

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 档案合并方法、装置、电子设备及存储介质 第 1 页 专利 档案合并方法、装置、电子设备及存储介质 第 2 页 专利 档案合并方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 22:45:28上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。