全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111675032.8 (22)申请日 2021.12.31 (71)申请人 深圳市梦网视讯有限公司 地址 518000 广东省深圳市南 山区粤海街 道高新中四道30号龙泰利科技大厦 325室 (72)发明人 慕畅  (74)专利代理 机构 深圳市恒程创新知识产权代 理有限公司 4 4542 专利代理师 钟永翠 (51)Int.Cl. G06K 9/62(2022.01) G06N 3/04(2006.01) G06Q 30/02(2012.01) (54)发明名称 点击率重要因子的萃取方法、 系统、 终端设 备及介质 (57)摘要 本发明公开了一种点击率重要因子的萃取 方法、 系统、 终端设备和介质, 包括以下步骤: 基 于点击场景下各个项集的支持度和置信度分别 确定第一支持度阈值和第一置信度阈值, 并基于 非点击场景下各个项集的支持度和置信度分别 确定第二支持度阈值和第二置信度阈值; 根据第 一支持度阈值和一置信度阈值和提升度阈值对 点击场景下的多个项集进行筛选得到第一待过 滤项集, 并根据第二支持度阈值和第二置信度阈 值对非点击场景下的多个项集进行筛选得到第 二待过滤项集; 基于第一待 过滤项集和所述第二 待过滤项集得到待过滤候选集, 针对待过滤候选 集进行测地线过滤得到目标项集, 并从所述目标 项集中萃取点击率重要因子。 本发 明能够实现对 点击率重要因子的精准萃取。 权利要求书2页 说明书13页 附图5页 CN 114462499 A 2022.05.10 CN 114462499 A 1.一种点击率重要因子的萃取方法, 其特征在于, 所点击率的重要因子的萃取方法包 括以下步骤: 基于预设的点击场景下各个项集的支持度和置信度分别确定第一支持度阈值和第一 置信度阈值, 并基于预设的非点击场景下各个项集的支持度和置信度分别确定第二支持度 阈值和第二置信度阈值; 根据所述第一支持度阈值和所述第一置信度阈值和预设的提升度阈值对所述点击场 景下的多个项集进行筛选得到第一待过滤项集, 并根据所述第二支持度阈值和所述第二置 信度阈值对所述非点击场景 下的多个项集进行筛 选得到第二待过 滤项集; 基于所述第 一待过滤项集和所述第 二待过滤项集得到待过滤候选集, 针对所述待过滤 候选集进行测地线过 滤得到目标项集, 并从所述目标项集中萃取点击率重要因子 。 2.如权利要求1所述的点击率重要因子的萃取方法, 其特征在于, 在所述基于预设的点 击场景下各个项集的支持度和置信度分别确定第一支持度阈值和 第一置信度阈值, 并基于 预设的非点击场景下各个项集的支持度和置信度分别确定第二支持度阈值和第二置信度 阈值的步骤之前, 还 包括: 获取预设的原始数据, 基于所述原始数据进行关联统计得到预设的点击场景下的多个 项集各自对应的支持度、 置信度和 提升度, 以及预设的非点击场景下 的多个项集各自对应 的支持度、 置信度和提升度。 3.如权利要求1所述点击率重要因子的萃取方法, 其特征在于, 所述基于预设的点击场 景下各个项集的支持度和置信度分别确定第一支持度阈值和第一置信度阈值的步骤, 包 括: 将所述点击场景下各个项集各自的支持度进行排序得到对应的第一中位数和第一上 位分数, 并将所述第一中位数对应的支持度或者所述第一上位分数对应的支持度确定为所 述第一支持度阈值; 将所述点击场景下各个项集各自的置信度进行排序得到对应的第二中位数和第二上 位分数, 并将所述第二中位数对应的置信度或者所述第二上位分数对应的置信度确定为所 述第一置信度阈值。 4.如权利要求1所述点击率重要因子的萃取方法, 其特征在于, 所述基于预设的非点击 场景下各个项集的支持度和置信度分别确定第二支持度阈值和 第二置信度阈值的步骤, 包 括: 将所述非点击场景下各个项集的支持度进行排序得到对应的第三中位数和第三上位 分数, 并将所述第三中位数对应的支持度或者所述第三上位分数对应的支持度确定为所述 第二支持度阈值; 将所述非点击场景下各个项集的置信度进行排序得到对应的第四中位数和第四上位 分数, 并将所述第四中位数对应的置信度或者所述第四上位分数对应的置信度确定为所述 第二置信度阈值。 5.如权利要求1所述点击率重要因子的萃取方法, 其特征在于, 所述根据 所述第一支持 度阈值和所述第一置信度阈值和预设的提升度阈值对所述点击场景下的多个项集进行筛 选得到第一待过滤项集, 并根据所述第二支持度阈值和所述第二置信度阈值对所述 非点击 场景下的多个项集进行筛 选得到第二待过 滤项集的步骤, 包括:权 利 要 求 书 1/2 页 2 CN 114462499 A 2从所述点击场景下的多个项集中筛选出支持度大于所述第 一支持度阈值、 置信度 大于 所述第一置信度阈值且提升度大于预设的提升度阈值的项集作为第一待过 滤项集; 从所述非点击场景下的多个项集中筛选出支持度小于所述第二支持度阈值且置信度 小于所述第二置信度阈值的项集作为第二待过 滤项集。 6.如权利要求1所述点击率重要因子的萃取方法, 其特征在于, 所述基于所述第 一待过 滤项集和所述第二待过滤项集得到待过滤候选集, 针对所述待过滤候选集进 行测地线过滤 得到目标项集的步骤, 包括: 将所述第一待过滤项集和所述第 二待过滤项集的交集确定为待过滤候选集, 并按照预 设的项集过 滤规则针对所述待过 滤候选集进行测地线过 滤得到对应的目标项集。 7.如权利要求1所述点击率重要因子的萃取方法, 其特征在于, 所述点击率重要因子包 括: 点击率重要单因子、 点击率重要双因子和点击率重要三因子; 所述从所述目标项集中萃取点击率重要因子的步骤, 包括: 从所述目标项集中至少萃取所述点击率重要单因子、 所述点击率重要双因子和所述点 击率重要三因子 。 8.一种点击率重要因子的萃取系统, 其特征在于, 所述点击率重要因子的萃取系统, 包 括: 确定模块, 用于基于预设的点击场景下各个项集的支持度和置信度分别确定第 一支持 度阈值和 第一置信度阈值, 并基于预设的非点击场景下各个项集的支持度和置信度分别确 定第二支持度阈值和第二置信度阈值; 筛选模块, 用于根据 所述第一支持度阈值和所述第 一置信度阈值和预设的提升度阈值 对所述点击场景下的多个项集进 行筛选得到第一待过滤项集, 并根据所述第二支持度阈值 和所述第二置信度阈值对所述非点击场景 下的多个项集进行筛 选得到第二待过 滤项集; 萃取模块, 用于基于所述第一待过滤项集和所述第二待过滤项集得到待过滤候选集, 针对所述待过滤候选集进 行测地线过滤得到目标项集, 并从所述目标项集中萃取点击率重 要因子。 9.一种终端设备, 其特征在于, 所述终端设备包括存储器、 处理器和存储在所述存储器 上并可在所述处理器上运行的点击率重要因子的萃取程序, 所述点击率重要因子的萃 取程 序被所述处理器执行时实现如权利要求1至7中任一项所述的点击率重要因子的萃取方法 的步骤。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质上存储有点击率 重要因子的萃取程序, 所述点击率重要因子的萃取程序被处理器执行时实现如权利要求1 至7中任一项所述的点击率重要因子的萃取 方法的步骤。权 利 要 求 书 2/2 页 3 CN 114462499 A 3

.PDF文档 专利 点击率重要因子的萃取方法、系统、终端设备及介质

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 点击率重要因子的萃取方法、系统、终端设备及介质 第 1 页 专利 点击率重要因子的萃取方法、系统、终端设备及介质 第 2 页 专利 点击率重要因子的萃取方法、系统、终端设备及介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 22:45:33上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。