说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210584768.2 (22)申请日 2022.05.26 (71)申请人 上海麦开信息科技有限公司 地址 202172 上海市崇明区新村乡耀洲路 741号2幢497室 (上海新村经济小区) (72)发明人 尹莉丽 (74)专利代理 机构 北京中索 知识产权代理有限 公司 11640 专利代理师 朱晓丹 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/36(2019.01) (54)发明名称 一种知识图谱构建方法及构建系统 (57)摘要 本发明涉及知识图谱 领域, 尤其涉及一种知 识图谱构建方法及构建系统。 系统包括数据挖掘 模块、 逻辑连接建立模块、 体系连接模块和应用 模块。 本发 明中的知识图谱构建系统从海量数据 中挖掘相关领域、 相关行业的用户信息以及产品 信息, 通过第一次的信息提取、 合并, 建立, 结构 化数据集和非结构化数据集, 第二次的信息提 取、 合并, 完成信息在模式上的连接与数据上的 连接, 以SPO三元组形式形成完整的数据库。 再对 不同实体的要素进行信息融合、 修正, 形成知识 图谱。 实现对信息关系的深度挖掘 、 连接, 信息融 合的高, 关联性强, 使得特定领域的垂直行业信 息分析更具有准确性、 高效性和智能性, 增强用 户感受, 提升 搜索转化率。 权利要求书2页 说明书3页 附图1页 CN 114925171 A 2022.08.19 CN 114925171 A 1.一种知识图谱构建系统, 其特征在于, 包括数据挖掘模块、 逻辑连接建立模块、 体系 连接模块和应用模块; 数据挖掘模块包括信 息挖掘单元和分类单元, 采用集成爬取工具对用户信 息挖掘以及 产品信息的挖掘, 得到相关信息点, 将信息点分类为实体(实体1、 实体2...实体n)和属性 (属性1、 属性2. ..属性n); 逻辑连接建立模块包括数据库建立单元、 数据整合单元和信息抽取单元, 通过对实体 和属性进 行信息提取、 合并, 得到结构化数据集和非结构化数据集, 再分别对两个数据集进 行数据整合和信息抽取, 提取出相关联的实体、 关系、 属性信息, 并以SPO三元 组形式形成完 整的数据库; 体系连接模块包括信息融合单元、 信息更新单元和知识图谱构建单元, 通过在同一框 架规范下进行信息的异构数据整合, 对不同实体的要素进行信息融合, 消除实体、 关系、 属 性与事实对象之间的歧义, 达 到信息融合的目的, 最终形成知识图谱; 应用模块包括输入单 元、 智能搜索单 元、 语音搜索单 元和输出 单元。 2.根据权利要求1所述的一种知识图谱构建系统, 其特征在于, 用户信 息包括商家的背 景信息、 作品风格、 销售策略和市场评价。 3.根据权利要求1所述的一种知识图谱构建系统, 其特征在于, 产品信息包括产品特 点、 受众群 体、 市场反馈和销售记录 。 4.根据权利要求1所述的一种知识图谱构建系统, 其特征在于, 逻辑连接建立模块包括 模式连接与数据连接; 数据连接主由一系列的事实组成, 而信息点将以事实为单位进行存 储; 模式连接构建在数据连接上, 通过最终的数据库来 规范数据连接的一系列事实表达 。 5.根据权利要求1所述的一种知识图谱构建系统, 其特征在于, 信 息抽取单元主要是面 向开放的链接数据, 通过自动化的技术抽取出可用的信息单元, 有三个主要工作: 实体抽 取、 关系抽取和 属性抽取。 6.根据权利要求1所述的一种知识图谱构建系统, 其特征在于, 实体抽取是从结构化数 据集和非结构化数据集中自动识别出命名实体。 由于实体是知识图谱中的最基本元素, 其 抽取的完整性、 准确、 召回率 等将直接影响到知识库的质量。 7.根据权利要求1所述的一种知识图谱构建系统, 其特征在于, 关系抽取通过提前建立 关系模型, 设置预定义的语法与规则, 解决实体间语义链接的问题。 8.根据权利要求1所述的一种知识图谱构建系统, 其特征在于, 知识图谱构建单元需要 进行实体对齐, 将其相关属 性进行交叉连接, 做出修正后, 再完成本体构建; 同时知识图谱 通过知识更新单 元定期进行自我修 正。 9.根据权利要求1所述的一种知识图谱构建系统, 其特征在于, 应用与 特定领域的垂直 行业信息分析。 10.一种包括权利要求1 ‑9任一项所述的知识图谱构建方法, 其特 征在于, 步骤如下: 。 S1、 采用集成爬取工具对用户信息挖掘以及产品信 息的挖掘, 得到相关信息点, 将信息 点分类为实体(实体1、 实体2. ..实体n)和 属性(属性1、 属性2. ..属性n); S2、 通过对实体和属性进行信息提取、 合并, 得到结构化数据集和 非结构化数据集, 再 分别对两个数据集进行数据整合和信息抽取, 提取出相关联的实体、 关系、 属 性信息, 完成 模式连接与数据连接, 以S PO三元组形式形成完整的数据库;权 利 要 求 书 1/2 页 2 CN 114925171 A 2S3、 通过在同一框架规范下进行信息的异构数据整合, 对不同实体的要素进行信息融 合, 消除实体、 关系、 属性与事实对象之间的歧义, 达到信息融合的目的, 最终形成知识图 谱。权 利 要 求 书 2/2 页 3 CN 114925171 A 3
专利 一种知识图谱构建方法及构建系统
文档预览
中文文档
7 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共7页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 10:55:50
上传分享
举报
下载
原文档
(379.2 KB)
分享
友情链接
GB-T 42706.2-2023 电子元器件 半导体器件长期贮存 第2部分:退化机理.pdf
专利 一种反诈宣传方法、系统、电子设备以及存储介质.PDF
GB-T 25098-2010 绝缘体带电清洗剂使用导则.pdf
GB-T 43436-2023 智能工厂 面向柔性制造的自动化系统 通用要求.pdf
系统安全管理制度.pdf
GB-T 32608-2016 羽毛球拍及部件的物理参数和试验方法.pdf
AQ 2003-2018 轧钢安全规程.pdf
GB-T 39583-2020 既有建筑节能改造智能化技术要求.pdf
GB-T 40327-2021 轮式移动机器人导引运动性能测试方法.pdf
GB-T 33511-2017 机械振动 桥梁动态测试与检测测量结果的评估.pdf
T-CIECCPA 010—2020 节能诊断数据结构化处理规范.pdf
GB-T 33482-2016 党政机关电子公文系统建设规范.pdf
DB14-T 2736—2023 池塘养殖尾水处理规范 山西省.pdf
DB65-T 4536.4—2022 电子政务外网建设规范第4部分:IP域名规划 新疆维吾尔自治区.pdf
GB-T 32385.1-2015 光纤预制棒 第1部分:总规范.pdf
T-JSJTQX 38—2023 节段梁短线法智能匹配预制施工 技术规程.pdf
DL-T 5783-2019 水电水利地下工程地质超前预报技术规程.pdf
GB 29440-2012 炭黑单位产品能源消耗限额.pdf
GB-T 28534-2012 高压开关设备和控制设备中六氟化硫(SF6)气体的释放对环境和健康的影响.pdf
GB-T 13217.7-2023 油墨附着力检验方法.pdf
1
/
3
7
评价文档
赞助2.5元 点击下载(379.2 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。