全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211276453.8 (22)申请日 2022.10.19 (71)申请人 湖南创亚信息科技有限公司 地址 410000 湖南省长 沙市长沙高新开发 区麓天路28号第A-4栋13层13 01号 (72)发明人 刘旭  (74)专利代理 机构 广州市红荔专利代理有限公 司 44214 专利代理师 李婷 (51)Int.Cl. G06F 16/242(2019.01) G06F 16/2455(2019.01) G06F 16/248(2019.01) (54)发明名称 一种客户信息检索方法、 装置、 电子设备及 存储介质 (57)摘要 本申请提供了本申请提供了一种客户信息 检索方法、 装置、 电子设备及存储介质, 首先获取 检索关键词, 当检索关键词包括多个时, 对检索 关键词进行分词, 并生成分词后的第一词集合及 每个词的权重, 然后确定数据库中的每个客户信 息与第一词集 合的相似度; 相似度满足 公式: , 其中, S表示相似度, An表示第一 词集合中第n个词的权重, Sn表示据库中的每个 客户信息与第一词集合中第n个词的相似度; 按 相似度降序方式对客户信息进行排序显示。 本申 请提供了本申请提供的客户信息检索方法、 装 置、 电子设备及存储介质具有检索客户信息的精 度更高的优点。 权利要求书3页 说明书10页 附图2页 CN 115357605 A 2022.11.18 CN 115357605 A 1.一种客户信息检索方法, 其特 征在于, 所述方法包括: 获取检索关键词; 当所述检索关键词包括多个时, 对所述检索关键词进行分词, 并生成分词后的第一词 集合及每个词的权 重; 确定数据库中的每 个客户信息与所述第一词集 合的相似度; 所述相似度满足 公式: 其中, S表示相似度, An表示第一词集合中第n个词的权重, Sn表示据库中的每个客户信 息与第一词集 合中第n个词的相似度; 按相似度降序方式对所述 客户信息进行排序显示; 其中, 对所述检索关键词进行分词, 并生成分词后的第一词集合及每个词的权重的步骤包 括: 当存在与设定词相同的第一词时, 确定所述第一词的权 重为最低权重; 当分词后的词数量小于三个时, 则确定除所述第一词以外的第二词的权重为中等权 重; 当分词后的词数量大于或等于三个时, 则确定处于 中间位置的第 二词的权重为最高权 重, 其余的第二词为中等权 重。 2.如权利要求1所述的客户信 息检索方法, 其特征在于, 所述最低权重与所述中等权重 之间的差值大于 0.3; 所述中等权 重与所述 最高权重之间的差值小于 0.2。 3.如权利要求1所述的客户信 息检索方法, 其特征在于, 按相似度降序方式对所述客户 信息进行排序显示的步骤之前, 所述方法还 包括: 当存在至少两个相似度相同的客户信息时, 提升所述第一词集合中每个词集合的权 重, 并重新确定所述至少 两个相似度相同的客户信息中, 每个客户信息与第一词集合的相 似度, 以对所述 客户信息进行排序。 4.如权利要求1所述的客户信 息检索方法, 其特征在于, 在生成分词后的第 一词集合及 每个词的权 重的步骤之前, 所述方法还 包括: 当所述分词后的关键词中包括属性关键词时, 依据所述属性关键词确定客户信息属 性; 所述确定数据库中的每 个客户信息与所述第一词集 合的相似度的步骤 包括: 依据所述客户信 息属性对所述数据库中的每个客户信 息进行筛选, 并确定筛选后的每 个客户信息与所述第一词集 合的相似度。 5.如权利要求4所述的客户信 息检索方法, 其特征在于, 所述依据 所述客户信 息属性对 所述数据库中的每 个客户信息进行筛 选的步骤 包括: 去除未包 含所述属性关键词或其 衍生词的客户信息; 将剩余的客户信息依据属性关键词或其 衍生词生成客户信息 权重; 所述相似度满足 公式:权 利 要 求 书 1/3 页 2 CN 115357605 A 2其中, Xn表示第n个客户信息 权重。 6.如权利要求5所述的客户信 息检索方法, 其特征在于, 将剩余的客户信 息依据属性关 键词或其 衍生词生成客户信息 权重的步骤 包括: 生成属性关键词或其 衍生词的第二词集 合; 将包含所述属性关键词或其 衍生词的客户信息进行分词, 以生成第三词集 合; 所述客户信息 权重满足公式: 其中, z1为第二词集合和第三词集合的交集中的词的数量, z2为第二词集合和第三词 集合的差集中的词的数量, aj为第二词集合和第三词集合的交集中第 j个词的权重, β j为第 二词集合和第三词集 合的差集中第j个词的权 重, θ ij为第三词集 合中的词W ij的权重。 7.一种客户信息检索装置, 其特 征在于, 所述装置包括: 数据获取 单元, 用于获取检索关键词; 数据处理单元, 用于当所述检索关键词包括多个时, 对所述检索 关键词进行分词, 并生 成分词后的第一词集 合及每个词的权 重; 数据处理单元, 还用于确定数据库中的每个客户信息与所述第一词集合的相似度; 所 述相似度满足 公式: 其中, S表示相似度, An表示第一词集合中第n个词的权重, Sn表示据库中的每个客户信 息与第一词集 合中第n个词的相似度; 数据处理单元, 还用于按相似度降序方式对所述 客户信息进行排序显示; 其中, 数据处理单元具体用于: 当存在与设定词相同的第一词时, 确定所述第一词的权 重为最低权重; 当分词后的词数量小于三个时, 则确定除所述第一词以外的第二词的权重为中等权 重; 当分词后的词数量大于或等于三个时, 则确定处于 中间位置的第 二词的权重为最高权 重, 其余的第二词为中等权 重。 8.一种电子设备, 其特 征在于, 包括: 存储器, 用于存 储一个或多个程序; 处理器; 当所述一个或多个程序被所述处理器执行时, 实现如权利要求1 ‑6中任一项所述的方 法。权 利 要 求 书 2/3 页 3 CN 115357605 A 3

.PDF文档 专利 一种客户信息检索方法、装置、电子设备及存储介质

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种客户信息检索方法、装置、电子设备及存储介质 第 1 页 专利 一种客户信息检索方法、装置、电子设备及存储介质 第 2 页 专利 一种客户信息检索方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 00:49:01上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。