(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211428175.3
(22)申请日 2022.11.15
(71)申请人 以萨技术股份有限公司
地址 266000 山东省青岛市黄岛区灵山 卫
街道办事处灵岩路7 7号
(72)发明人 刘晓文 李凡平 石柱国
(74)专利代理 机构 北京锺维联合知识产权代理
有限公司 1 1579
专利代理师 安娜
(51)Int.Cl.
G06F 16/245(2019.01)
G06F 16/2453(2019.01)
G06F 16/22(2019.01)
(54)发明名称
一种向量特征比对 方法、 电子 设备及存储介
质
(57)摘要
本发明提供了一种向量特征比对 方法、 电子
设备及存储介质, 该方法包括: 获取待比对特征
向量; 对待比对特征向量进行降维处理, 获得处
理后特征向量; 根据处理后特征向量从第二数据
库或第三数据库中, 确定出第一目标数据信息标
识; 获取第一目标原始特征向量; 根据第一目标
原始特征向量对应的匹配度, 确定第二目标原始
特征向量; 将每一第二目标原始特征向量对应的
数据信息标识作为第二目标数据信息标识; 获取
并输出对应的属性信息。 本发明通过第二数据库
和第三数据库的特征向量的不同处理效率, 对不
同数据特性的待比对特征向量进行特征比对处
理, 加快了 特征比对速度, 且通过降维处理, 使向
量特征检索系统可处理高维度的特征向量的特
征比对工作。
权利要求书3页 说明书8页 附图3页
CN 115510089 A
2022.12.23
CN 115510089 A
1.一种向量特征比对方法, 其特征在于, 应用于向量特征检索系统, 所述向量特征检索
系统包括第一数据库、 第二数据库和第三数据库, 所述第一数据库分别与所述第二数据库
和所述第三数据库通信连接; 所述第一数据库用于存储若干原始数据, 每个所述原始数据
包括数据信息标识和原始特征向量, 每个所述原始数据的数据信息标识均不同; 所述第二
数据库用于存储每一所述原始特征向量对应的第一特征向量和对应的数据信息标识, 所述
第一特征向量为对所述原始特征向量进行降维处理后得到的; 所述第三数据库用于存储每
一所述原始特征向量对应的第一特征向量、 对应的数据信息标识和对应的原始数据的属性
信息; 所述第二数据库的读写性能高于所述第三数据库的读写性能;
所述方法包括如下步骤:
S100、 获取待比对特征向量; 所述待比对特征向量的维度与所述原始特征向量的维度
相同;
S200、 对所述待比对特征向量进行降维处理, 获得处理后特征向量; 所述处理后特征向
量的维度与所述第一特 征向量的维度相同;
S300、 根据所述处理后特征向量从所述第二数据库或所述第三数据库中, 确定出n个第
一目标数据信息标识; 所述第一目标数据信息标识对应的第一特征向量与所述处理后特征
向量之间的匹配度符合第一预设条件;
S400、 根据n个所述第一目标数据信息标识, 从所述第一数据库中获取每一所述第一目
标数据信息标识对应的原 始特征向量作为第一目标原 始特征向量;
S500、 根据待比对特征向量和每一所述第一目标原始特征向量之间的匹配度, 从n个所
述第一目标原 始特征向量中, 确定出m个第二目标原 始特征向量; 其中, m<n;
S600、 将每一所述第 二目标原始特征向量对应的数据信息标识作为第 二目标数据信息
标识;
S700、 从所述第 三数据库中获取并输出每一所述第 二目标数据信息标识对应的原始数
据的属性信息 。
2.根据权利要求1所述的方法, 其特 征在于, 所述 步骤S300具体包括:
S310、 获取每一所述待比对特征向量对应的处理时间t, 所述处理时间为对应的待比对
特征向量最后操作的时间;
S320、 若t>a, 则执行步骤S330; 若t≤a, 则执行步骤S340; 其中, a为根据当前时间确定
的时间阈值;
S330、 根据所述处理后特征向量从所述第三数据库中, 确定出n个第一目标数据信息标
识;
S340、 根据所述处理后特征向量从所述第二数据库中, 确定出n个第一目标数据信息标
识。
3.根据权利要求2所述的方法, 其特 征在于, 所述 步骤S330包括:
S331、 获取所述第三数据库中每一第一特征向量, 得到第一特征向量集Q=(Q1,…,
Qb,…,Qc); 其中, b=1, …,c; c为所述第三数据库中第一特征向量的数量; Qb为所述第三数据
库中第b个第一特 征向量;
S332、 将所述处理后特征向量与所述第三数据库中每一第一特征向量进行特征对比处
理, 得到处 理后特征向量与第三数据库中每一第一特 征向量之间的匹配度;权 利 要 求 书 1/3 页
2
CN 115510089 A
2S333、 根据处理后特征向量与第三数据库中每一第一特征向量之间的匹配度, 得到第
一匹配度集G=(G1,…,Gb,…,Gc); 其中, Gb为处理后特征向量与第三数据库中第b个第一特
征向量之间的匹配度;
S334、 按照数值递减, 对G1,…,Gb,…,Gc进行排序, 以得到第一排序列表W=(W1,…,
Wb,…,Wc); 其中, Wb为W中第b个匹配度;
S335、 将W1,…,Wn对应的第一特征向量对应的数据信息标识确定为第一 目标数据信息
标识; 其中, n≤ c。
4.根据权利要求3所述的方法, 其特 征在于, 所述 步骤S340包括:
S341、 获取所述第二数据库中每一第一特征向量, 得到第二特征向量集P=(P1,…,
Pb,…,Pc); 其中, Pb为所述第二数据库中第b个第一特 征向量;
S342、 将所述处理后特征向量与所述第二数据库中每一第一特征向量进行特征对比处
理, 得到处 理后特征向量与第二数据库中每一第一特 征向量之间的匹配度;
S343、 根据处理后特征向量与第二数据库中每一第一特征向量之间的匹配度, 得到第
二匹配度集K=(K1,…,Kb,…,Kc); 其中, Kb为处理后特征向量与第二数据库中第b个第一特
征向量之间的匹配度;
S344、 按照数值递减, 对K1,…,Kb,…,Kc进行排序, 以得到第二排序列表Y=(Y1,…,
Yb,…,Yc); 其中, Yb为Y中第b个匹配度;
S345、 将Y1,…,Yn对应的第一特征向量对应的数据信息标识确定为第一 目标数据信息
标识。
5.根据权利要求1所述的方法, 其特 征在于, 所述 步骤S500包括:
S510、 将待比对特征向量与每一所述第一目标原始特征向量进行特征对比处理, 得到
待比对特 征向量与每一所述第一目标原 始特征向量之间的匹配度;
S520、 根据待比对特征向量与每一所述第一目标原始特征向量之间的匹配度, 得到第
三匹配度集E=(E1,…,Eu,…,En); 其中, u=1, …,n, Eu为待比对特征向量与第u个第一目标原
始特征向量之间的匹配度;
S530、 按照数值递减, 对E1,…,Eu,…,En进行排序, 以得到第三排序列表Z=(Z1,…,
Zu,…,Zn); 其中, Zu为Z中第u个匹配度;
S540、 将Z1,…,Zm对应的第一目标原始特征向量确定为第二目标原始 特征向量; 其中, m
≤n。
6.根据权利要求1所述的方法, 其特 征在于, 所述 步骤S200具体包括:
S210、 对所述待比对特征向量进行降维处理, 得到待比对降维特征向量; 所述待比对降
维特征向量的维度与所述第一特 征向量的维度相同;
S220、 对所述待比对降维特 征向量进行 单位化处理, 得到处 理后特征向量。
7.根据权利要求6所述的方法, 其特 征在于, 所述 步骤S220具体包括:
S221、 获取所述待比对降维特 征向量的维度值s和向量R=(R1,R2,…,Rs);
S222、 获取所述待比对降维特 征向量的模| |R||;
S223、 确定处 理后特征向量为Rnew=(R1/||R||,R2/||R||,…,Rs/||R||)。
8.根据权利要求1所述的方法, 其特 征在于, 所述降维处 理通过PCA模型进行 数据处理。
9.一种非瞬时性计算机可读存储介质, 所述存储介质中存储有至少一条指令或至少一权 利 要 求 书 2/3 页
3
CN 115510089 A
3
专利 一种向量特征比对方法、电子设备及存储介质
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 11:31:42上传分享