说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210524735.9 (22)申请日 2022.05.13 (71)申请人 清华大学 地址 100084 北京市海淀区双清路3 0号清 华大学清华园北京 100084-82信箱 (72)发明人 刘洋 丁文伯 杨美林 徐健  (74)专利代理 机构 北京路浩知识产权代理有限 公司 11002 专利代理师 王春霞 (51)Int.Cl. G06F 16/22(2019.01) G06F 16/2453(2019.01) G06F 21/62(2013.01) G06K 9/62(2022.01) (54)发明名称 一种基于多个客户端的跨机构哈希检索方 法及装置 (57)摘要 本发明提供一种基于多个客户端的跨机构 哈希检索方法及装置。 其中, 方法包括以下步骤: 获取待检索数据; 将待检索数据输入 预先训练的 深度哈希模型中, 以生成查询哈希码; 其中, 深度 哈希模型是根据所有目标客户端的本地数据训 练得到的; 将查询哈希码与各个目标客户端预存 的本地数据的参考哈希码进行匹配, 并根据匹配 结果得到查询哈希码与各参考哈希码的相似距 离; 遍历相似距离, 并以相似距离中最小值对应 的参考哈希码作为目标数据。 本发 明的技术方能 实现了对多个客户端的跨机构检索, 通过深度哈 希模型的应用, 减少了数据的通信量, 同时将查 询哈希码分发到各目标客户端本地查询目标数 据, 实现了 本地数据不出本地, 保护了数据隐私。 权利要求书2页 说明书9页 附图7页 CN 115168336 A 2022.10.11 CN 115168336 A 1.一种基于多个客户端的跨机构哈希检索方法, 其特 征在于, 包括: 获取待检索数据; 将所述待检索数据输入预先训练的深度哈希模型中, 以生成查询哈希码; 其中, 所述深 度哈希模型 是根据所有目标客户端的本地数据训练得到的; 将所述查询哈希码与 各个所述目标客户端预存的本地数据的参考哈希码进行匹配, 并 根据匹配结果得到所述 查询哈希码与各 所述参考哈希码的相似距离; 遍历所述相似距离, 并以所述相似距离中最小值对应的参 考哈希码作为目标 数据。 2.根据权利要求1所述的基于多个客户端的跨机构哈希检索方法, 其特征在于, 所述深 度哈希模型的预 先训练过程包括以下步骤: 获取初始深度哈希模型; 分别利用各所述目标客户端的本地数据, 对所述初始深度哈希模型进行训练, 以得到 训练后的深度哈希模型; 以训练后的深度哈希模型作为初始深度哈希模型进行迭代训练, 直至预设迭代次数用 尽或训练后的深度哈希模型输出的训练效果达 到预设要求。 3.根据权利要求2所述的基于多个客户端的跨机构哈希检索方法, 其特征在于, 所述以 训练后的深度哈希模型作为初始深度哈希模型进 行迭代训练, 直至预设迭代次数用尽或训 练后的深度哈希模型输出的训练效果达 到预设要求, 具体包括: 全局模型更新: 聚合各所述目标客户端训练后的深度哈希模型的参数, 从而更新所述 初始深度哈希模型; 本地模型更新: 通过更新后的所述初始深度哈希模型对各所述目标客户端的深度哈希 模型进行 更新; 本地模型训练: 分别利用各所述目标客户端的本地数据, 对更新后的各所述客户端的 深度哈希模型进行训练, 以得到训练后的深度哈希模型; 重复全局模型更新、 本地模型更新、 本地模型训练步骤, 直至预设循环次数用尽, 则结 束迭代训练。 4.根据权利要求2所述的基于多个客户端的跨机构哈希检索方法, 其特征在于, 所述以 训练后的深度哈希模型作为初始深度哈希模型进 行迭代训练, 直至预设迭代次数用尽或训 练后的深度哈希模型输出的训练效果达 到预设要求, 之后还 包括: 基于训练后深度哈希模型, 生成各所述目标客户端的本地数据中各类数据的平均哈希 码; 聚合所述各类数据的平均哈希码, 生成全局编码原型; 以将所述全局编码原型作为约束条件的训练后的深度哈希模型, 作为所述初始深度哈 希模型进 行迭代训练, 直至预设迭代次数用尽或训练后的深度哈希模型输出的训练结果达 到预设要求。 5.根据权利要求4所述的基于多个客户端的跨机构哈希检索方法, 其特征在于, 在生成 所述全局编码原型时, 若 部分所述平均哈希码标识的是同一类数据, 则将标识有同一类数据的这部分所述平均 哈希码再次进行平均值计算, 以得到同一类数据的平均哈希码。 6.根据权利要求4所述的基于多个客户端的跨机构哈希检索方法, 其特征在于, 以所述权 利 要 求 书 1/2 页 2 CN 115168336 A 2全局编码原型作为约束条件的训练后的深度哈希模型, 作为所述初始深度哈希模型进 行迭 代训练, 直至预设迭代次数用尽或训练后的深度哈希模型输出的训练结果达到预设要求, 具体包括: 向各所述目标客户端对应的训练后的深度哈希模型中输入训练样本, 以生成与所述训 练样本对应的样本哈希码; 在所述全局编码原型中寻找与所述训练样本同属一类的平均哈希码; 当判别器无法识别出所述样本哈希码相对所述训练样本对应的平均哈希码之间的真 实性时, 则结束迭代训练。 7.一种基于多个客户端的跨机构哈希检索装置, 其特 征在于, 包括: 数据获取模块, 用于获取待检索数据; 哈希码生成模块, 用于将所述待检索数据输入预先训练的深度哈希模型中, 以生成查 询哈希码; 其中, 所述深度哈希模型 是根据所有目标客户端的本地数据训练得到的; 匹配模块, 用于将所述查询哈希码与各个所述目标客户端预存的本地数据的参考哈希 码进行匹配, 并根据匹配结果得到所述 查询哈希码与各 所述参考哈希码的相似距离; 查询模块, 用于遍历所述相似距离, 并以所述相似距离中最小值对应的参考哈希码作 为目标数据。 8.一种电子设备, 包括存储器、 处理器及存储在所述存储器上并可在所述处理器上运 行的计算机程序, 其特征在于, 所述处理器执行所述程序时实现如权利要求1至6任一项所 述基于多个客户端的跨机构哈希检索方法。 9.一种非暂态计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机 程序被处理器执行时实现如权利要求1至6任一项所述基于多个客户端的跨机构哈希检索 方法。 10.一种计算机程序产品, 包括计算机程序, 其特征在于, 所述计算机程序被处理器执 行时实现如权利要求1至 6任一项所述基于多个客户端的跨机构哈希检索方法。权 利 要 求 书 2/2 页 3 CN 115168336 A 3

PDF文档 专利 一种基于多个客户端的跨机构哈希检索方法及装置

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于多个客户端的跨机构哈希检索方法及装置 第 1 页 专利 一种基于多个客户端的跨机构哈希检索方法及装置 第 2 页 专利 一种基于多个客户端的跨机构哈希检索方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-07 12:39:13上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。