全网唯一标准王
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202210920138.8 (22)申请日 2022.08.02 (65)同一申请的已公布的文献号 申请公布号 CN 114996622 A (43)申请公布日 2022.09.02 (73)专利权人 北京弘玑信息技 术有限公司 地址 100000 北京市朝阳区望京东园四区 13号楼-4至 33层101内20层202室 (72)发明人 余浩 王健  (74)专利代理 机构 北京超凡宏宇专利代理事务 所(特殊普通 合伙) 11463 专利代理师 钟扬飞 (51)Int.Cl. G06F 16/958(2019.01) G06F 9/445(2018.01)G06F 16/951(2019.01) G06F 40/30(2020.01) (56)对比文件 CN 111475750 A,2020.07.31 CN 105161106 A,2015.12.16 CN 112256992 A,2021.01.2 2 US 2012317141 A1,2012.12.13 审查员 赵婷 (54)发明名称 信息获取方法、 值网络模型的训练方法及电 子设备 (57)摘要 本申请提供一种信息获取方法、 值网络模 型 的训练方法及电子设备, 该方法通过语义提取模 型获得第一网页的全局语义信息和第一网页中 每个控制对象的控件语义信息; 根据第一网页的 全局语义信息, 判断第一网页是否包含待获取的 目标内容; 若第一网页不包含待获取的目标内 容, 根据全局语义信息以及每个控制对象的控件 语义信息, 通过值网络模型预测选择每个控制对 象的分值; 对第一网页中分值最高的控制对象执 行操作, 跳转到第二网页, 继续判断第二网页是 否包含待获取的目标内容, 直到获取到目标内 容。 该方案可 以模仿人类进行网页理解, 模拟人 类点击操作进行网页跳转, 从而尽可能快地跳转 到目标内容所在网页, 提高信息获取的便捷性。 权利要求书3页 说明书11页 附图8页 CN 114996622 B 2022.11.11 CN 114996622 B 1.一种信息获取 方法, 其特 征在于, 包括: 加载第一网页, 通过语义提取模型获得所述第 一网页的全局语义信 息和所述第 一网页 中每个控制对象的控 件语义信息; 根据所述第一网页的全局语义信息, 判断所述第一网页是否包 含待获取的目标内容; 若所述第一网页不包含所述待获取的目标内容, 根据全局语义信 息以及每个控制对象 的控件语义信息, 通过值网络模型 预测选择每 个控制对象的分值; 对所述第一网页中所述分值最高的控制对象执行操作, 跳转到第二网页, 继续判断所 述第二网页是否包 含待获取的目标内容, 直到获取到所述目标内容。 2.根据权利要求1所述的方法, 其特 征在于, 所述加载第一网页, 包括: 根据输入的网站入口地址, 加载 所述网站入口地址对应的网站首页; 通过语义提取模型获得所述网站首页的全局语义信息和所述网站首页中每个控制对 象的控件语义信息; 根据所述网站首页的全局语义信息以及所述网站首页中每个控制对象的控件语义信 息, 通过值网络模型 预测选择每 个控制对象的分值; 对所述网站首页中所述分值最高的控制对象执行操作, 从所述网站首页跳转到第 一网 页。 3.根据权利要求1所述的方法, 其特征在于, 所述根据所述第一网页的全局语义信息, 判断所述第一网页是否包 含待获取的目标内容, 包括: 计算所述第一网页的全局语义信息与所述目标内容之间的第一相似度; 根据所述第一相似度的大小, 确定所述第一网页是否包 含所述目标内容。 4.根据权利要求1所述的方法, 其特征在于, 在所述通过语义提取模型获得所述第 一网 页的全局语义信息和所述第一网页中每个控制对象的控件语义信息之前, 所述方法还包 括: 获取样本内容以及样本网址; 根据所述样本内容和样本网址, 对初始值网络进行训练, 获得由所述初始值网络训练 得到的值网络模型。 5.根据权利要求4所述的方法, 其特征在于, 所述根据所述样本内容和样本网址, 对初 始值网络进行训练, 获得由所述初始值网络训练得到的值网络模型, 包括: 根据所述样本内容和样本网址, 对预训练模型和初始值网络进行交替训练, 获得由所 述预训练模型训练得到的语义 提取模型以及由所述初始值网络训练得到的值网络模型。 6.根据权利要求4所述的方法, 其特征在于, 所述根据所述样本内容和样本网址, 对初 始值网络进行训练, 获得由所述初始值网络训练得到的值网络模型, 包括: 加载所述样本网址对应的样本网站首页, 通过预训练模型获得所述样本网站首页的全 局语义信息和所述样本网站首页中每 个控制对象的控 件语义信息; 根据所述样本网站首页的全局语义信息以及所述样本网站首页中每个控制对象的控 件语义信息, 通过初始值网络预测选择每 个控制对象的分值; 从所述样本网站首页中按照第 一预设概率选取分值最高的控制对象, 对选取的控制对 象执行操作, 从所述样本网站首页跳转到新网页; 根据所述新网页与所述样本内容之间的语义相似度, 对所述初始值网络进行更新, 继权 利 要 求 书 1/3 页 2 CN 114996622 B 2续从所述新网页中进行控制对 象的选择和网页跳转, 直到达到训练目标, 获得由所述初始 值网络训练得到的值网络模型。 7.根据权利要求6所述的方法, 其特征在于, 所述根据所述新网页与 所述样本 内容之间 的语义相似度, 对所述初始值网络进行 更新, 包括: 通过所述预训练模块提取所述新网页的全局语义信 息, 计算所述新网页的网页语义信 息与所述样本内容之间的语义相似度; 根据所述新网页的网页语义信 息与所述样本内容之间的语义相似度, 确定对选取的控 制对象执 行操作的奖励值; 根据所述奖励值, 更新损失函数并调整所述初始值网络的参数。 8.根据权利要求5所述的方法, 其特征在于, 所述根据所述样本内容和样本网址, 对预 训练模型和初始值网络进行交替训练, 包括: 加载所述样本网址对应的样本网站首页, 通过预训练模型获得所述样本网站首页的全 局语义信息和所述样本网站首页中每 个控制对象的控 件语义信息; 根据所述样本网站首页的全局语义信息以及所述样本网站首页中每个控制对象的控 件语义信息, 通过初始值网络预测选择每 个控制对象的分值; 从所述样本网站首页中按照第 一预设概率选取分值最高的控制对象, 对选取的控制对 象执行操作, 从所述样本网站首页跳转到新网页; 根据所述样本网站首页和所述样本网站首页中选取的控制对象, 预测下一个状态的网 页内容; 根据所述新网页和所述下一个状态的网页内容之间的语义相似度, 更新所述预训练模 型; 基于更新后的预训练模型重新对样本网站首页进行语义信息的提取, 对所述初始值网 络进行训练。 9.根据权利要求8所述的方法, 其特征在于, 所述基于更新后的预训练模型重新对样本 网站首页进行语义信息的提取, 对所述初始值网络进行训练, 包括: 通过更新后的预训练模型获得所述样本网站首页的全局语义信息和所述样本网站首 页中每个控制对象的控 件语义信息; 根据所述样本网站首页的全局语义信息以及所述样本网站首页中每个控制对象的控 件语义信息, 通过初始值网络预测选择每 个控制对象的分值; 从所述样本网站首页中按照第 一预设概率选取分值最高的控制对象, 对选取的控制对 象执行操作, 从所述样本网站首页跳转到新网页; 根据所述新网页与所述样本内容之间的语义相似度, 对所述初始值网络进行更新, 继 续从所述新网页中进 行控制对象的选择和网页跳转, 对所述更新后的预训练模型进行再次 更新, 直到 达到训练目标。 10.一种值网络模型的训练方法, 其特征在于, 所述值网络模型用于从网站中获取目标 内容, 所述方法包括: 加载样本网址对应的样本网站首页, 通过预训练模型获得所述样本网站首页的全局语 义信息和所述样本网站首页中每 个控制对象的控 件语义信息; 根据所述样本网站首页的全局语义信息以及所述样本网站首页中每个控制对象的控 件语义信息, 通过初始值网络预测选择每 个控制对象的分值;权 利 要 求 书 2/3 页 3 CN 114996622 B 3

PDF文档 专利 信息获取方法、值网络模型的训练方法及电子设备

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 信息获取方法、值网络模型的训练方法及电子设备 第 1 页 专利 信息获取方法、值网络模型的训练方法及电子设备 第 2 页 专利 信息获取方法、值网络模型的训练方法及电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:14:20上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。