(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210730031.7
(22)申请日 2022.06.24
(71)申请人 润联软件系统 (深圳) 有限公司
地址 518000 广东省深圳市福田区梅林街
道梅都社区中康路136号深圳新一代
产业园2栋801
(72)发明人 钟焰涛 郑毅
(74)专利代理 机构 深圳市世联合知识产权代理
有限公司 4 4385
专利代理师 杨晖琼
(51)Int.Cl.
G06F 16/332(2019.01)
G06F 21/60(2013.01)
G06F 21/62(2013.01)
G06F 40/279(2020.01)G06F 40/30(2020.01)
(54)发明名称
一种信息检索方法、 装置、 计算机设备及存
储介质
(57)摘要
本申请公开了一种信息检索方法、 装置, 计
算机设备及存储介质, 属于大数据技术领域。 本
申请通过 获取目标用户输入的查询语句, 提取查
询语句的关键词组合, 对关键词组合进行向量转
化, 得到初始查询向量, 获取目标用户的兴趣向
量, 得到兴趣向量集合, 计算初始查询向量和兴
趣向量集合的相关度, 当相关度大于或等于预设
阈值时, 组合初始查询向量和兴趣向量集合, 得
到查询组合向量, 基于预设的全同态加密算法对
查询组合向量进行加密, 得到加密向量, 基于加
密向量在预设的加密文件索引表中进行同态检
索, 得到同态检索结果, 并对同态检索结果进行
解密, 得到信息检索结果。 本申请提高了信息检
索的精度, 同时避免了用户隐私的泄 露。
权利要求书2页 说明书12页 附图5页
CN 115203391 A
2022.10.18
CN 115203391 A
1.一种信息检索方法, 其特 征在于, 包括:
接收信息检索指令, 并获取目标用户输入的查询语句;
对所述查询语句进行关键词提取, 得到所述 查询语句对应的关键词组合;
对所述关键词组合进行向量 转化, 得到初始查询向量;
从预设的兴趣库中获取 所述目标用户的兴趣向量, 得到兴趣向量 集合;
计算所述初始查询向量和所述兴趣向量 集合的相关度;
当所述初始查询向量和所述兴趣向量集合的相关度 大于或等于预设阈值 时, 组合所述
初始查询向量和所述兴趣向量 集合, 得到查询组合向量;
基于预设的全同态加密算法对所述 查询组合向量进行加密, 得到加密向量;
基于所述加密 向量在预设的加密文件索引表中进行同态检索, 得到同态检索结果, 并
对所述同态检索结果进行解密, 得到信息检索结果。
2.如权利要求1所述的信 息检索方法, 其特征在于, 所述对所述查询语句进行关键词提
取, 得到所述 查询语句对应的关键词组合, 具体包括:
对所述查询语句进行分词处 理, 得到文本分词;
基于预设的关键词提取算法从所述文本分词中提取关键词, 得到查询语句对应的关键
词组合。
3.如权利要求1所述的信 息检索方法, 其特征在于, 所述对所述关键词组合进行向量转
化, 得到初始查询向量, 具体包括:
获取预设的关键词列表;
分别判断所述关键词组合中的关键词是否存在于所述关键词列表中;
基于所述关键词判断结果对所述关键词组合进行向量 转化, 得到初始查询向量。
4.如权利要求3所述的信 息检索方法, 其特征在于, 所述基于所述关键词判断结果对所
述关键词组合进行向量 转化, 得到初始查询向量, 具体包括:
若所述关键词组合中的关键词存在于所述关键词列表中, 则所述关键词的赋值 为“1”;
若所述关键词组合中的关键词不存在于所述关键词列表中, 则所述关键词的赋值为
“0”;
当所述关键词组合中的所有关键词均完成赋值后, 组合所有所述关键词的赋值, 得到
所述初始查询向量。
5.如权利要求1所述的信 息检索方法, 其特征在于, 在所述从预设的兴趣库中获取所述
目标用户的兴趣向量, 得到兴趣向量 集合之前, 还 包括:
获取所述目标用户的用户数据, 得到目标用户数据;
从所述目标用户数据中提取兴趣特 征, 得到目标兴趣特 征;
对得到的所有所述目标兴趣特 征进行向量 转化, 得到兴趣向量 集合;
将所述兴趣向量 集合导入所述兴趣库进行存 储。
6.如权利要求1所述的信 息检索方法, 其特征在于, 通过以下公式计算所述初始查询向
量和所述兴趣向量 集合的相关度:
权 利 要 求 书 1/2 页
2
CN 115203391 A
2式中, Q0为初始查询向量, Ij为目标用户的兴趣向量集合BI中的第j个兴趣向量, 兴趣向
量集合BI由m个目标兴趣向量{I1, I2, ..., Im}构成, Sj为目标用户的第j个目标兴趣向量Ij和
初始查询向量 Q0相关度。
7.如权利要求6所述的信 息检索方法, 其特征在于, 在基于所述加密向量在预设的加密
文件索引表中进行同态检索, 得到同态检索结果, 并对所述同态检索结果进行解密, 得到信
息检索结果之后, 还 包括:
对所述兴趣向量 集合进行更新。
8.如权利要求7所述的信息检索方法, 其特征在于, 所述对所述兴趣向量集合进行更
新, 具体包括:
将所述兴趣向量集合中的每一个目标兴趣向量均乘以预设衰退因子, 得到兴趣衰退向
量集合;
计算所述兴趣衰退向量 集合中每一个兴趣衰退向量的向量 值;
分别将每一个所述兴趣衰退向量的向量 值与预设衰退阈值进行比对;
将向量值小于所述预设衰退阈值的兴趣衰退向量从所述兴趣衰退向量集合中剔除, 得
到兴趣更新向量 合集;
将所述初始查询向量添加到所述兴趣更新向量合集, 以完成对所述兴趣向量集合的更
新。
9.一种信息检索装置, 其特 征在于, 包括:
指令接收模块, 用于 接收信息检索指令, 并获取目标用户输入的查询语句;
关键词提取模块, 用于对所述查询语句进行关键词提取, 得到所述查询语句对应的关
键词组合;
向量转化模块, 用于对所述关键词组合进行向量 转化, 得到初始查询向量;
向量获取模块, 用于从预设的兴趣库中获取所述目标用户的兴趣向量, 得到兴趣向量
集合;
相关度计算模块, 用于计算所述初始查询向量和所述兴趣向量 集合的相关度;
向量组合模块, 用于当所述初始查询向量和所述兴趣向量集合的相关度 大于或等于预
设阈值时, 组合所述初始查询向量和所述兴趣向量 集合, 得到查询组合向量;
向量加密模块, 用于基于预设的全 同态加密算法对所述查询组合向量进行加密, 得到
加密向量;
同态检索模块, 用于基于所述加密 向量在预设的加密文件索引表中进行同态检索, 得
到同态检索结果, 并对所述同态检索结果进行解密, 得到信息检索结果。
10.一种计算机设备, 其特征在于, 包括存储器和处理器, 所述存储器中存储有计算机
可读指令, 所述处理器执行所述计算机可读指 令时实现如权利要求 1至8中任一项 所述的信
息检索方法的步骤。
11.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质上存储有计算机
可读指令, 所述计算机可读指 令被处理器执行时实现如权利要求 1至8中任一项 所述的信息
检索方法的步骤。权 利 要 求 书 2/2 页
3
CN 115203391 A
3
专利 一种信息检索方法、装置、计算机设备及存储介质
安全报告 >
其他 >
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 思考人生 于 2024-02-07 20:38:25上传分享