全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210250117.X (22)申请日 2022.03.14 (71)申请人 曾庆波 地址 450018 河南省郑州市郑东 新区商务 外环路23号中科金座大厦B座1601- 1605室 (72)发明人 曾庆波  (74)专利代理 机构 北京汇捷知识产权代理事务 所(普通合伙) 11531 专利代理师 葛葆财 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/9535(2019.01) G06F 9/445(2018.01) (54)发明名称 基于数字化的大数据用户信息采集方法及 大数据服务器 (57)摘要 本申请的基于数字化的大数据用户信息采 集方法及大数据服务器, 通过确定用户信息采集 状态, 并基于已放行信息采集策略的信息采集策 略特征、 目标信息抽取线程的信息抽取线程触发 条件、 信息抽取线程完成条件以及信息抽取线程 视觉引导, 确定已放行信息采集策略之间的信息 抽取线程关联情况, 基于第一目标信息集、 第二 目标信息集, 以及已放行信息采集策略之间的信 息抽取线程关联情况, 确定目标信息采集方式, 实现了自适应信息采集方式的确定, 有效降低信 息采集方式确定难度, 提高已授权服务平台系统 的信息采集效率, 确保得到的目标信息采集方式 符合已授权服务平台系统的实际信息处理习惯, 并保障大数据服务器中的相关用户 信息的安全 有序采集。 权利要求书3页 说明书21页 附图2页 CN 114637821 A 2022.06.17 CN 114637821 A 1.一种基于智能数字化的云业务大数据挖掘方法, 其特征在于, 应用于与已授权服务 平台系统通信连接的大 数据服务器, 所述方法至少包括: 确定用户信 息采集状态; 其中, 所述用户信 息采集状态包括信 息采集策略关键词、 信 息 采集策略特征、 信息抽取线程触发条件、 信息抽取线程完成条件以及信息抽取线程视觉引 导; 基于已放行信 息采集策略的信 息采集策略特征、 目标信 息抽取线程的信 息抽取线程触 发条件、 信息抽取线程完成条件以及信息抽取线程视觉引导, 确定已放行信息采集策略之 间的信息抽取线程关联情况; 利用第一 目标信息集、 第二 目标信息集和所述已放行信息采 集策略之 间的信息抽取线程关联情况, 确定目标信息采集方式; 其中, 所述已放行信息采集 策略为同意已授权服务平台系统使用的信息采集策略, 所述目标信息抽取线程为所述已放 行信息采集策略中同意已授权服 务平台系统使用的信息抽取线程。 2.如权利要求1所述的方法, 其特征在于, 所述用户信 息采集状态还包括策略唤醒关键 词和策略休眠关键词; 所述基于已放行信息采集策略的信息采集策略特征、 目标信息抽取 线程的信息抽取线程触发条件、 信息抽取线程完成条件以及信息抽取线程视觉引导, 确定 已放行信息采集策略之间的信息抽取线程关联情况, 包括: 基于已放行信 息采集策略的策略唤醒关键词和策略休眠关键词, 确定各已放行信 息采 集策略的后一阶段的信息采集策略队列; 基于各已放行信 息采集策略的后 一阶段的信 息采集策略队列、 已放行信 息采集策略的 信息采集策略特征、 目标信息抽取线程的信息抽取线程触发条件、 信息抽取线程完成条件 以及信息抽取线程视 觉引导, 确定已放行信息采集策略之间的信息抽取线程关联情况。 3.如权利要求2所述的方法, 其特征在于, 所述基于已放行信 息采集策略的策略唤醒关 键词和策略休眠关键词, 确定各已放行信息采集策略的后一阶段 的信息采集策略队列, 包 括: 针对第一已放行信 息采集策略, 将第 二已放行信 息采集策略视作所述第 一已放行信 息 采集策略的后一阶段 的信息采集策略; 其中, 所述第一已放行信息采集策略为任一已放行 信息采集策略, 所述第二已放行信息采集策略的策略唤醒关键词 与所述第一已放行信息采 集策略的策略休眠关键词相同; 基于所述第二已放行信息采集策略确定所述第一已放行信息采集策略的后一阶段的 信息采集策略队列。 4.如权利要求2所述的方法, 其特征在于, 所述基于各已放行信 息采集策略的后 一阶段 的信息采集策略队列、 已放行信息采集策略的信息采集策略特征、 目标信息抽取线程的信 息抽取线程触发条件、 信息抽取线程完成条件以及信息抽取线程视觉引导, 确定已放行信 息采集策略之间的信息抽取线程关联情况, 包括: 针对任一已放行信息采集策略的后一阶段的信息采集策略队列中的任一后一阶段的 信息采集策略, 基于该已放行信息采集策略的信息采集策略特征、 第一 目标信息抽取线程 的信息抽取线程完成条件、 第一目标信息抽取线程的信息抽取线程视觉引导以及第二目标 信息抽取线程的信息抽取线程触发条件, 确定该已放行信息采集策略与该后一阶段的信息 采集策略之间的信息抽取线程关联情况; 其中, 所述第一 目标信息抽取线程为该已放行信 息采集策略中的目标信息抽取线程, 第二目标信息抽取线程为该后一阶段的信息采集策略权 利 要 求 书 1/3 页 2 CN 114637821 A 2中的目标信息抽取线程。 5.如权利要求4所述的方法, 其特征在于, 所述基于该已放行信 息采集策略的信 息采集 策略特征、 第一目标信息抽取线程的信息抽取线程完成条件、 第一 目标信息抽取线程的信 息抽取线程视觉引导以及第二目标信息抽取线程的信息抽取线程触发条件, 确定该已放行 信息采集策略与该后一阶段的信息采集策略之间的信息抽取线程关联情况, 包括: 基于该已放行信 息采集策略的信 息采集策略特征、 第 一目标信 息抽取线程的信 息抽取 线程完成条件以及第二目标信息抽取线程的信息抽取线程触发条件, 确定第一目标信息抽 取线程的线程终止状态与所述第二目标信息抽取线程的线程激活状态之间的信息传递轨 迹描述; 其中, 所述信息传递轨迹描述为以所述第一 目标信息抽取线程的线程终止状态为 第一轨迹单元, 以所述第二目标信息抽取线程的线程激活状态为第二轨迹单元的信息索引 轨迹与设定轨迹的比较结果, 所述信息采集策略特征为信息采集策略的信息读取轨迹与所 述设定轨迹的比较结果; 基于所述信 息传递轨迹描述、 该已放行信 息采集策略的信 息采集策略特征以及所述第 一目标信息抽取线程的信息抽取线程视觉引导, 确定该已放行信息采集策略与该后一阶段 的信息采集策略之间的信息抽取线程关联情况。 6.如权利要求5所述的方法, 其特征在于, 所述基于所述信息传递轨迹描述、 该已放行 信息采集策略的信息采集策略特征以及所述第一目标信息抽取线程的信息抽取线程视觉 引导, 确定该已放行信息采集策略与该后一阶段的信息采集策略之 间的信息抽取线程关联 情况, 包括: 在符合如下其中一个要求的前提下, 确定该已放行信息采集策略与该后一阶段 的信息采集策略之间信息抽取线程存在关联: 所述第一目标信 息抽取线程的信 息抽取线程视觉引导为串行抽取指示, 且所述信 息传 递轨迹描述匹配于该已放行信息采集策略的信息采集策略特 征; 所述第一目标信 息抽取线程的信 息抽取线程视觉引导为优先抽取指示, 且所述信 息传 递轨迹描述优先于该已放行信息采集策略的信息采集策略特征, 以及所述信息传递轨迹描 述与该已放行信息采集策略的信息采集策略特 征的差异化分析 结果满足第一设定条件; 所述第一目标信 息抽取线程的信 息抽取线程视觉引导为非优先抽取指示, 且所述信 息 传递轨迹描述滞后于该已放行信息采集策略的信息采集策略特征, 以及该已放行信息采集 策略的信息采集策略特 征与所述信息传递轨 迹描述的差异化分析 结果满足第一设定条件; 所述第一目标信 息抽取线程的信 息抽取线程视觉引导为 回滚抽取指示, 且所述信 息传 递轨迹描述与该已放行信息采集策略的信息采集策略特征的差异化分析结果满足第二设 定条件。 7.如权利要求1 ‑6任一项所述的方法, 其特征在于, 所述利用第一目标信息集、 第二目 标信息集和所述已放行信息采集策略之 间的信息抽取线程关联情况, 确定目标信息采集方 式, 包括: 利用第一目标信 息集、 第二目标信 息集和所述已放行信 息采集策略之间的信 息抽取线 程关联情况, 确定所述第一目标信息集与所述第二目标信息集之间的备用信息采集方式; 基于所述备用信 息采集方式的采集方式差异度, 以及备用信 息采集方式的算法影响系 数, 从所述备用信息采集方式中确定目标信息采集方式; 其中, 备用信息采集方式的算法影 响系数基于备用信息采集方式 中信息采集 算法的配置数据确定 。权 利 要 求 书 2/3 页 3 CN 114637821 A 3

.PDF文档 专利 基于数字化的大数据用户信息采集方法及大数据服务器

文档预览
中文文档 27 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共27页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于数字化的大数据用户信息采集方法及大数据服务器 第 1 页 专利 基于数字化的大数据用户信息采集方法及大数据服务器 第 2 页 专利 基于数字化的大数据用户信息采集方法及大数据服务器 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 00:04:13上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。