全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210995701.8 (22)申请日 2022.08.18 (71)申请人 深圳市承泽信息科技有限公司 地址 518000 广东省深圳市龙岗区南湾街 道南岭村社区南新路15号1983创意小 镇C1栋201 1-2015房 (72)发明人 安梦君 汤荣华 周越丽  (74)专利代理 机构 芜湖宸泽知识产权代理事务 所(普通合伙) 34208 专利代理师 李俊建 (51)Int.Cl. G06F 16/9535(2019.01) G06F 40/284(2020.01) G06F 40/279(2020.01) G06F 40/30(2020.01)G06K 9/62(2022.01) (54)发明名称 一种互联网基 于云数据关键词搜索方法 (57)摘要 本发明公开了一种互联网基于云数据关键 词搜索方法, 涉及关键词搜索技术领域, 通过预 先计算所有搜索关键词之间的词义相似度, 将相 似词义的搜索关键词关联起来; 再通过每条云数 据的点击量将每个搜索关键词对应的云数据进 行排序; 将用户输入的搜索词使用分词工具进行 分词, 获取多个搜索关键词; 再查找每个搜索关 键词对应的云数据集合; 以及与每个搜索关键词 词义相近的搜索关键词对应的云数据集合; 并优 先展示搜索关键词对应的云数据集合, 后展示词 义相近的搜索关键词对应的云数据集合; 保证了 用户搜索关键词结果的准确性以及实用性。 权利要求书2页 说明书5页 附图1页 CN 115292605 A 2022.11.04 CN 115292605 A 1.一种互联网基于云数据关键词搜索方法, 其特 征在于, 包括以下步骤: 步骤一: 用户将云数据上传至云平台; 所述云数据包括标题、 摘要以及详细内容; 并获 取每条云数据的搜索关键词; 步骤二: 将用户的搜索关键词按搜索次数进行从大到小排序并编号; 将搜索关键词按 顺序编号 为1,2,…, N; 其中, N 为搜索关键词的数量; 按1,2,…, N的顺序找出与每 个搜索关键词语义相近的搜索关键词组; 步骤三: 将云数据按搜索关键词的字典序进行排序; 将搜索关键词标记为k; 对于每个 搜索关键词k, 将所有搜索关键词中包含k的云数据使用集合保存; 将搜索关键词k对应的包 含搜索关键词k的云数据集合标记为Pk; 将云数据集合Pk中的云数据按点击量进行从大到 小进行排序; 步骤四: 用户在搜索客户端输入搜索词并点击搜索按钮进行搜索, 搜索客户端将搜索 词通过无线网络发送至 云平台; 云平台查找符合搜索词的云数据, 并将云数据标题、 摘要以 及详细内容发送至 搜索客户端。 2.根据权利要求1所述的一种互联网基于云数据关键词搜索方法, 其特征在于, 所述搜 索关键词为用户提交或使用关键词提取算法自动提取。 3.根据权利要求1所述的一种互联网基于云数据关键词搜索方法, 其特征在于, 对于每 个搜索关键词n, 找出与该搜索关键词语义相近的搜索关键词组包括以下步骤: 步骤S1: 使用N LP技术计算搜索关键词n与所有其 他的搜索关键词之间的语义相似度; 步骤S2: 在所有搜索关键词中, 统计出所有与搜索关键词n相似度大于相似度阈值t的 搜索关键词; 并使用集合形式保存搜索关键词组; 将搜索关键词n对应的词义相近的搜索关 键词集合标记为Sn; 所述相 似度阈值t按实际经验设置; 将词义相似度大于像素点阈值t的 搜索关键词定义 为词义相近; 步骤S3: 对于搜索关键词集合Sn中的搜索关键词, 按与搜索关键词的相似度大小, 从大 至小进行排序。 4.根据权利要求1所述的一种互联网基于云数据关键词搜索方法, 其特征在于, 所述云 平台查找符合搜索词的云数据包括以下步骤: 步骤P1: 使用分词工具对搜索词进行分词; 获得搜索关键词的集合; 将分词后的搜索关 键词集合标记为G; 步骤P2: 预先生成词性黑名单; 使用词性标注算法对搜素关键词集合G中的搜索关键词 进行词性分析; 并去除词性处于词性黑名单中的搜索关键词; 将剩余的搜索关键词集合标 记为H; 步骤P3: 云平台将搜索关键词集合H中的搜索关键词按搜索数量以从大到小的顺序进 行排序; 将排序后的搜索关键词集 合标记为H1; 对于搜索关键词集合H1中的每个搜索关键词h, 云平台搜索与搜索关键词h相关的云数 据。 5.根据权利要求1所述的一种互联网基于云数据关键词搜索方法, 其特征在于, 所述云 平台搜索与搜索关键词h相关 云数据包括以下步骤: 步骤Q1: 云平台根据搜索关键词h的字典序, 从已完成排序的搜索关键词中查找搜索关 键词h; 若未查找到 搜索关键词h, 则转至步骤Q2; 否则转至步骤Q3;权 利 要 求 书 1/2 页 2 CN 115292605 A 2步骤Q2: 计算搜索关键词h与所有搜索关键词的词义相似度; 并将词义相似度最大的搜 索关键词作为 新的搜索关键词h; 并转至步骤Q3; 步骤Q3: 将搜索关键词h对应的云数据集合Ph返回搜索客户端; 并按云数据的点击量从 大到小进行排序, 按排序后的云数据顺序向用户展示云数据标题以及摘要; 步骤Q4: 获取搜索关键词h的词义相近的搜索关键词集合Sh; 对于搜索关键词集合Sh中 的每个搜索关键词s, 获取搜索关键词s对应的云数据集合Ps; 将 搜索关键词s与搜索关键词 h的词义相似度标记为lsh; 将云数据集合Ps中的每条云数据标记为p, 将云数据p的点击量 标记为Kp; 计算每条云数据p的展示优先级Fp; 计算公式为Fp=α *lsh+β *kp; 其中, α、 β 分别 为根据实际经验预设的比例系数; 步骤Q5: 将搜索关键词集合Sh中所有搜索关键词s对应的云数据集合Ps中的云数据p按 优先级Fp从大到小进 行排序; 并将所有云数据按排序后的顺序向用户展示云数据的标题以 及摘要。 6.根据权利要求1所述的一种互联网基于云数据关键词搜索方法, 其特征在于, 所述点 击量为每条云数据标题被用户点击并查看云数据详细内容的次数。 7.根据权利要求4所述的一种互联网基于云数据关键词搜索方法, 其特征在于, 所述词 性黑名单为一个词性集合, 在词性黑名单中的词性均不作为搜索关键词; 所述词性黑名单 根据实际经验设置 。 8.根据权利要求1所述的一种互联网基于云数据关键词搜索方法, 其特征在于, 所述搜 索客户端与云平台分别为搜索程序的前端与后端; 其中, 前端用于与用户进行 交互, 获取用 户的搜索关键词并向用户展示云数据的标题以及摘要, 用户点击标题后, 查看云数据的详 细内容; 后端用于根据用户的搜索关键词查找对应的云数据。权 利 要 求 书 2/2 页 3 CN 115292605 A 3

PDF文档 专利 一种互联网基于云数据关键词搜索方法

文档预览
中文文档 9 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种互联网基于云数据关键词搜索方法 第 1 页 专利 一种互联网基于云数据关键词搜索方法 第 2 页 专利 一种互联网基于云数据关键词搜索方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:14:08上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。