全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210310617.8 (22)申请日 2022.03.28 (71)申请人 天津大学 地址 300350 天津市津南区海河教育园雅 观路135号天津大 学北洋园校区 (72)发明人 潘思哲 侯凯旋 牛占文 邵宏宇  王磊  (74)专利代理 机构 天津市北洋 有限责任专利代 理事务所 12 201 专利代理师 程毓英 (51)Int.Cl. G06F 16/36(2019.01) G06F 40/279(2020.01) (54)发明名称 一种基于多元异构数据挖掘的供应链在线 知识图谱构建方法 (57)摘要 本发明涉及一种基于多元异构数据挖掘的 供应链在线知识图谱构建方法, 包括下列步骤: 知识图谱构建框架; 知识图谱的模式层构建, 将 承载在线评论的平台分为电商网站、 社交媒体以 及专业网站, 结合在线评论知识图谱的需求分 析, 将在线评论的描述维度分为信源特征、 内容 特征及形式特征三个维度; 数据层构建主要基于 已经构建的模式层, 抽取和融合多源在线评论数 据中相应的内容, 识别相应的实例 、 属性和关系; 知识图谱的存 储和绘制。 权利要求书1页 说明书6页 附图2页 CN 114706996 A 2022.07.05 CN 114706996 A 1.一种基于多元异构数据 挖掘的供应链在线知识图谱构建方法, 包括下列步骤: 步骤1, 知识图谱构建框架, 构建企业设计资源本体库, 从多个层次建立设计需求和设 计资源的规范化描述; 步骤2, 知识图谱的模式层构建, 将承载在线评论的平台分为电商网站、 社交媒体以及 专业网站, 结合在线评论知识图谱的需求分析, 将在线评论的描述 维度分为信源 特征、 内容 特征及形式特 征三个维度, 方法如下: 步骤2.1, 信源特征用来描述评论的外在信息; 内容特征用来描述评论中涉及到的用户 对商品及服 务的态度和满意度, 字数、 观点数、 评论时间都属于 评论的形式特 征; 步骤2.2, 设置7个核心大类, 具体包括评论、 评论 内容、 特征观点、 用户、 评论对象、 平台 以及商品; 其中评论对 象概念下又划分了服务和商品两个子概念, 同时通过属 性定义更加 丰富的描述类的数据特 征; 步骤2.3, 将定义好的类和关系进行知识建模, 并进行模式层可视化, 以评论类为中心, 向外出发构建实体间的关系; 步骤3, 数据层构建主要基于已经构建的模式层, 抽取和融合多源在线评论数据中相应 的内容, 识别相应的实例、 属性和关系; 步骤3.1, 将电商网站手机评论、 相关术语百科、 评测及新闻内容作为数据源, 抓取手机 评论数据与百 科数据、 评测新闻数据作为词向量训练的语料库; 步骤3.2, 通过构建专业语料库, 并基于word2vec进行词向量训练完成对产品特征词的 抽取和分类; 步骤3.3, 基于word2Vec的词向量模型通过神经网络算法训练语料库, 然后将词语转化 为词向量, 并映射到高维空间, 依据当前词预测周围词语的概 率; 步骤3.4, 获得词语的向量表示, 词语之间的相似度通过余弦距离来衡量, 将模式层中 定义的概念作为种子词, 将相关词按照相似度进行排序, 并进行 人工筛选和归类; 步骤3.5, 对评论文本进行 特征‑观点对抽取; 步骤4, 知识图谱的存 储和绘制。 2.根据权利要求1所述的一种基于多元异构数据挖掘的供应链在线知识图谱构建方 法, 其特征在于, 步骤1具体包括: 步骤1.1, 通过分析在线评论的存在方式以及具体数据, 进行 数据爬取; 步骤1.2, 通过分析在线评论的信源特征、 内容特征和形式特征来设计模式层的概念、 关系及属性; 步骤1.3, 基于模式层的构建基础, 采用Word2vec词向量训练、 观点抽取、 情感分析进行 实体、 关系 、 属性的抽取; 步骤1.4, 将处理后的结构化的在线评论数据进行整合处理, 并存入图数据库中, 通过 图数据库查询语言完成知识图谱的可视化、 语义检索以及深度 挖掘。权 利 要 求 书 1/1 页 2 CN 114706996 A 2一种基于多元异构数据 挖掘的供应链在线知识图谱构建 方法 技术领域 [0001]本发明涉及有关于知识图谱领域, 尤其涉及一种基于多元异构数据挖掘的供应链 在线知识图谱方法。 背景技术 [0002]大数据时代, 从海量数据中发掘和利用竞争情报以支持决策是企业和个人面临的 重要问题。 互联网上积累的海量在线评论数据是消费者和商家获取信息的重要数据源。 目 前, 在线评论呈现出多元异构分布、 数据量巨大、 冗杂且不支持检索的特点, 给大数据环境 下的在线评论信息组织和利用带来了极大 的挑战; 并且用户有不同的信息需求, 有些用户 关注价格, 有 些用户关注性能, 当前在线评论展示方式、 评论有用性排序相关研究默认用户 的需求是一致的, 没有考虑用户的个性化需求; 此外, 人工智能时代对于智能信息服务需求 愈加迫切, 现有的在线评论研究不够深入, 缺 乏对多元异构在线评论领域知识进行系统化 的表示和建模。 [0003]知识图谱是一种 非常重要的信息组织方式, 一方面可以将结构各异、 分布广泛的 商品信息和评论信息进行动态关联; 另一方面, 知识图谱可以提升在线评论的信息组织程 度, 解决信息过载的问题, 用一种高效的数据管理模式处理碎片化、 冗余的在线评论信息; 此外知识图谱可以从语义的角度 组织在线评论数据, 进而进行智能搜索, 为在线评论的深 层次应用及用户的个性化信息需求提供解决方案。 网络技术的不断发展促使多元异构数据 迅速生成, 挖掘处理复杂的多 元异构数据, 能够有效获取数据潜在信息和规律。 聚类分析属 于机器学习、 数据挖掘以及统计学等领域的交叉性学科, 不仅能够起到有效演示的作用, 即 确定事物的分类标准或类别准则, 而且聚类的作用就是归纳, 不需要确定 分类的标准、 分析 数据对象, 因此有效地挖掘和分析复杂的多元异构数据具有重要意 义。 发明内容 [0004]本发明针对在线评论呈现多元异构分布、 数据量巨大、 冗杂且不支持检索, 无法被 企业有效利用的问题, 提出了一种基于多元异构数据挖掘的供应链在线知识图谱方法。 本 发明技术方案通过如下步骤实现: [0005]一种基于多元异构数据 挖掘的供应链在线知识图谱构建方法, 包括下列步骤: [0006]步骤1, 知识图谱构建框架, 构建企业设计资源本体库, 从多个层 次建立设计需求 和设计资源的规范化描述; [0007]步骤2, 知识图谱的模式层构建, 将承载在线评论的平台分为电商网站、 社交媒体 以及专业网站, 结合在线评论知识图谱的需求分析, 将在线评论的描述 维度分为信源特征、 内容特征及形式特 征三个维度, 方法如下: [0008]步骤2.1, 信源特征用来描述评论的外在信息; 内容特征用来描述评论中涉及到的 用户对商品及服 务的态度和满意度, 字数、 观点数、 评论时间都属于 评论的形式特 征; [0009]步骤2.2, 设置7个核心 大类, 具体包括评论、 评论内容、 特征观点、 用户、 评论对象、说 明 书 1/6 页 3 CN 114706996 A 3

.PDF文档 专利 一种基于多元异构数据挖掘的供应链在线知识图谱构建方法

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于多元异构数据挖掘的供应链在线知识图谱构建方法 第 1 页 专利 一种基于多元异构数据挖掘的供应链在线知识图谱构建方法 第 2 页 专利 一种基于多元异构数据挖掘的供应链在线知识图谱构建方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:52:17上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。