全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210351897.7 (22)申请日 2022.04.02 (71)申请人 南通奥普科技有限公司 地址 226001 江苏省南 通市崇川区幸福新 城11幢328室 (72)发明人 温杨馨 王淑芸  (51)Int.Cl. G06F 21/64(2013.01) G06F 11/30(2006.01) G06F 11/34(2006.01) G06F 16/33(2019.01) G06F 16/35(2019.01) G06F 40/30(2020.01) (54)发明名称 基于人工智能的科技成果转化数据智能监 测方法及系统 (57)摘要 本发明涉及人工智能技术领域, 具体涉及基 于人工智能的科技成果转化数据智能监测方法 及系统。 该方法包括: 采集历史转化数据, 随机遮 挡历史转化数据中的某一词项, 计算遮挡后的转 化数据与历史转化数据之间的语义差异度, 选取 第一遮挡词; 将第一遮挡词向两侧扩张, 直至语 义差异度大于预设阈值得到第一遮挡区域; 增加 第一遮挡词的词项, 直至最小的语义差异度大于 预设阈值, 得到第二遮挡区域; 根据第一遮挡区 域和第二遮挡区域的交并比构建第一结构向量; 将所有第一结构向量分组; 并获取历史转化数据 的关键词; 获取当前转化数据的第二结构向量, 选取与其最相似的组, 判断当前转化数据是否异 常。 本发明实施例能够实现转化数据的内容异常 监测。 权利要求书2页 说明书7页 附图1页 CN 115525927 A 2022.12.27 CN 115525927 A 1.基于人工智能的科技成果转化数据智能监测方法, 其特征在于, 该方法包括以下步 骤: 采集历史成果转化文件的历史转化数据, 随机遮挡所述历史转化数据中的某一词项, 计算遮挡后的转化数据与所述历史转化数据之 间的语义差异度, 以最小的语义差异度对应 的词项作为第一遮挡词; 将所述第一遮挡词向两侧扩张, 再对所述历史转化数据进行遮挡, 直至语义差异度大 于预设阈值, 以此时的遮挡词作为第一遮挡区域; 增加所述第一遮挡词的词项, 并对所述历史转化数据进行遮挡, 增加词项时遍历未遮 挡词项, 进而选取出第二遮挡词, 继续将所述第二遮挡词进 行遍历词项的扩张, 直至最小的 语义差异度大于所述预设阈值, 以此时的遮挡词作为第二遮挡区域; 根据所述第 一遮挡区域和所述第 二遮挡区域的交并比构建第 一结构向量; 将所有所述 历史转化数据的所述第一结构向量通过聚类分为多组; 在每个所述历史转化数据中去除所 述第一结构向量包 含的词项, 得到所述历史转 化数据的关键词; 获取当前转化数据的第二结构向量, 选取与所述第二结构向量最相似的组; 将所述当 前转化数据的关键词 与该组内每个所述第一结构向量对应的关键词进 行对比, 当对比得出 的最大相似度在相似度阈值以下时, 当前转 化数据为异常数据。 2.根据权利要求1所述的方法, 其特 征在于, 所述历史转 化数据的采集 步骤包括: 建立科技成果转化的历史文件库, 以每个文件的主题文字作为该文件的标识, 以所述 标识对应的词向量作为所述历史转 化数据。 3.根据权利要求1所述的方法, 其特 征在于, 所述语义差异度的计算过程包括: 通过自编码器将遮挡词项后的历史转化数据进行重构, 得到遮挡后的转化数据, 计算 所述历史转化数据以及所述遮挡后的转化数据对应词向量之间的欧氏距离作为所述语义 差异度。 4.根据权利要求1所述的方法, 其特 征在于, 所述第一遮挡区域的获取步骤 包括: 以所述第一遮挡词为中心, 以所述第 一遮挡词的词项长度作为扩 张尺寸向两侧扩 张得 到第一扩张词项, 利用所述第一扩张词项遮挡 所述历史转化数据得到第一转化数据, 计算 所述历史转化数据和所述第一转化数据 的词向量之间的语义差异度, 将其与预设阈值相 比, 当该语义差异度不大于预设阈值时, 以所述第一扩张词项为中心继续根据所述扩张尺 寸向两侧扩张, 直至语义差异度大于所述预设阈值, 得到所述第一遮挡区域。 5.根据权利要求1所述的方法, 其特 征在于, 所述第二遮挡区域的获取步骤 包括: 对所述第一遮挡词随机增加一个词项将其扩 张为第二扩张词项, 利用所述第 二扩张词 项遮挡所述历史转化数据得到第二转化数据, 计算所述历史转化数据和所述第二转化数据 的词向量之间的语义差异度, 遍历未遮挡词, 以语义差异度的最小值对应的遮挡词作为第 二遮挡词, 当其不大于预设阈值时, 对 所述第二遮挡词继续进 行随机增加一个词项的扩张, 直至语义差异度大于所述预设阈值, 得到所述第二遮挡区域。 6.根据权利要求1所述的方法, 其特 征在于, 所述第一结构向量的构建步骤 包括: 根据所述第一遮挡区域和所述第二遮挡区域对应的词项数量计算所述交并比; 获取所述第 一遮挡区域和所述第 二遮挡区域的交集与并集的差异词 项的差异位置, 根 据所述差异位置和所述交并比构建所述第一结构向量。权 利 要 求 书 1/2 页 2 CN 115525927 A 27.根据权利要求1所述的方法, 其特征在于, 所述将所有所述历史转化数据的所述第 一 结构向量 通过聚类分为多组, 包括: 预设聚类的初始类别数量, 对所有所述第一结构向量进行聚类, 得到多个初始类别, 计 算每个所述初始类别中的所述第一结构向量的差异, 进而获取所有初始类别差异之 间的类 别差异; 逐步增加所述初始类别数量, 依次计算所述类别差异, 选取最小的类别差异对应的类 别数量作为理想数量, 以所述理想数量对应的聚类结果作为分组结果。 8.根据权利要求1所述的方法, 其特征在于, 所述选取与所述第二结构向量最相似的 组, 包括: 获取每组中处于几何中心的中心结构向量, 分别计算每个中心结构向量与 所述第二结 构向量之间的相似度, 以相似度最大值对应的组作为与所述第二结构向量 最相似的组。 9.基于人工智能的科技成果转化数据智能监测系统, 包括存储器、 处理器以及存储在 所述存储器中并可在所述处理器上运行 的计算机程序, 其特征在于, 所述处理器执行所述 计算机程序时实现如权利要求1~8任意 一项所述方法的步骤。权 利 要 求 书 2/2 页 3 CN 115525927 A 3

.PDF文档 专利 基于人工智能的科技成果转化数据智能监测方法及系统

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于人工智能的科技成果转化数据智能监测方法及系统 第 1 页 专利 基于人工智能的科技成果转化数据智能监测方法及系统 第 2 页 专利 基于人工智能的科技成果转化数据智能监测方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:48:47上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。