全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210218074.7 (22)申请日 2022.03.08 (71)申请人 徐工汉云技 术股份有限公司 地址 221122 江苏省徐州市徐州经济技 术 开发区科技路6号 (72)发明人 陈辛明  (74)专利代理 机构 南京纵横知识产权代理有限 公司 32224 专利代理师 韩红莉 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/35(2019.01) G06F 16/33(2019.01) G06Q 50/04(2012.01) (54)发明名称 一种基于LSA的工业知识数据分类与关联方 法及其系统 (57)摘要 本发明公开了一种基于LSA的工业知识数据 分类与关联方法及其系统, 接收用户输入的用于 分类号查询的关键词; 将接收到的关键词输入构 建的潜在语义空间矩阵, 计算关键词和分类号查 询向量之间的相关度, 将相关度按照降序排序后 输出, 并展 示给用户。 构建潜在语义空间矩阵: 统 计关键词和分类号的共现频次, 并生成关键词 ‑ 分类号矩阵, 构建潜在语义空间矩阵; 将历史分 类号查询向量投影到潜在语义空间中, 计算关键 词和历史分类号查询向量的相关度; 相关度经 LSA算法计算降序排序后获得关键词排序结果, 将关键词排序结果和工业知识数据相关度的实 际值进行比对, 更新潜在语义空间矩阵。 本发明 用于对工业知识的精准匹配、 高效查询和结构性 关联。 权利要求书2页 说明书5页 附图1页 CN 114637854 A 2022.06.17 CN 114637854 A 1.一种基于LSA的工业知识数据分类与关联 方法, 其特 征在于, 包括: 接收用户输入的用于分类号 查询的关键词; 将接收到的关键词输入构建的潜在语义空间矩阵, 计算关键词和分类号查询向量之间 的相关度, 将相关度按照降序排序后输出, 并展示给用户。 2.根据权利要求1所述的一种基于LSA的工业知识数据分类与关联 方法, 其特 征在于, 构建潜在语义空间矩阵的方法, 包括: 1) 获取工业知识数据的关键词和分类号, 并进行分隔预处 理; 2) 逐个统计关键词和分类号的共现频次, 并生成关键词 ‑分类号矩阵; 3) 基于关键词 ‑分类号矩阵, 构建潜在语义空间矩阵; 4) 收集历史用户关键词和对应的历史分类号查询向量, 将该历史分类号查询向量投影 到潜在语义空间中, 计算关键词和历史分类号 查询向量的相关度; 5) 相关度经LSA算法计算降序排序后获得关键词排序结果, 将关键词排序结果和工业 知识数据相关度的实际值进行比对, 更新潜在语义空间矩阵。 3.根据权利要求2所述的一种基于LSA的工业知识数据分类与关联 方法, 其特 征在于, 分隔预处 理, 包括: 删除没有分类号只有关键词的工业知识数据; 将工业知识数据中的关键词与分类号分离,  以表格形式记录关键词与分类号的对应 关系。 4.根据权利要求2所述的一种基于LSA的工业知识数据分类与关联 方法, 其特 征在于, 步骤2) 逐个统计关键词和分类号的共现频次, 并生成对应矩阵, 包括: 切分关键词和分类号, 生成关键词集 合和分类号 集合; 逐个统计关键词与分类号共现的次数; 基于关键词与每 个分类号之间的共现频次, 生成关键词 ‑分类号矩阵。 5.根据权利要求2所述的一种基于LSA的工业知识数据分类与关联 方法, 其特 征在于, 步骤4) 中, 包括: 基于余弦公式, 计算关键词历史分类号 查询向量的相关度。 6.根据权利要求5所述的一种基于LSA的工业知识数据分类与关联 方法, 其特 征在于, 步骤5) , 相关度经LSA算法计算降序排序后获得关键词排序结果, 将关键词排序结果 和工业知识数据相关度的实际值进行比对, 更新潜在语义空间矩阵, 包括: 判断工业知识数据相关度的实际值中是否出现关键词排序 结果中的关键词, 若出现关 键词排序结果中的关键词, 则在潜在语义空间矩阵中通过新增一个非  0 的分量表示该关 键词排序结果中的关键词, 更新潜在语义空间矩阵。 7.根据权利要求2所述的一种基于LSA的工业知识数据分类与关联 方法, 其特 征在于, 步骤1) 中, 对于已经标引至三位数字甚至更细的分类号,  将该分类号的标引控制在三 位数字以内, 不足三 位数字的分类号保持原分类深度。 8.一种基于LSA的工业知识数据分类与关联系统, 其特征在于, 用于执行权利要求1所 述的方法, 包括: 用户查询模块, 用于 接收用户输入的用于分类号 查询的关键词; 相关度计算模块, 用于将接收到的关键词输入构建的潜在语义空间矩阵, 计算关键词权 利 要 求 书 1/2 页 2 CN 114637854 A 2和分类号 查询向量之间的相关度, 将相关度按照降序排序后输出, 并展示给用户。 9.根据权利要求8所述的一种基于LSA的工业知识数据分类与关联系统, 其特征在于, 包括: 数据分隔处 理模块, 用于获取工业知识数据的关键词和分类号, 并进行分隔预处 理; 关键词矩阵模块, 用于逐个统计关键词和分类号的共现频次, 并生成关键词 ‑分类号矩 阵; 奇异值分解模块, 用于基于关键词 ‑分类号矩阵, 构建潜在语义空间矩阵; 语义空间分析模块, 用于将历史分类号 查询向量投影到潜在语义空间矩阵中。权 利 要 求 书 2/2 页 3 CN 114637854 A 3

.PDF文档 专利 一种基于LSA的工业知识数据分类与关联方法及其系统

文档预览
中文文档 9 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于LSA的工业知识数据分类与关联方法及其系统 第 1 页 专利 一种基于LSA的工业知识数据分类与关联方法及其系统 第 2 页 专利 一种基于LSA的工业知识数据分类与关联方法及其系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:51:45上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。