全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210429483.1 (22)申请日 2022.04.22 (71)申请人 江南大学 地址 214000 江苏省无锡市滨湖区蠡湖大 道1800号 (72)发明人 孟磊 刘渊 潘莹莹 周明磊  任辉 陆钧怡  (74)专利代理 机构 无锡承果知识产权代理有限 公司 32373 专利代理师 肖昂 (51)Int.Cl. G06F 16/28(2019.01) G06F 16/25(2019.01) G06F 16/36(2019.01) G06F 16/38(2019.01) (54)发明名称 一种基于知识图谱的青铜文物数据构建方 法及系统 (57)摘要 本发明公开了一种基于知识图谱的青铜文 物数据构建方法及其系统, 包括以下步骤: 步骤 一、 构建元数据库, 元数据库包括第一数据、 第二 数据和第三数据, 第一数据为标准文物数据, 第 二数据为网络抓取数据, 第三数据为事件数据; 步骤二、 构建元数据模型, 使用第三数据分别筛 选第一数据和第二数据, 一个第三数据与其筛选 得到的第一数据和第二数据组合成为一个元数 据模型, 第一数据、 第二数据和第三数据两两之 间的共用词设为关键词; 步骤三、 将步骤二中生 成的所有元数据模型导入知识图谱应用软件中, 生成第一图数据库; 步骤四、 建立事件功能并分 析事件功能得到关键词, 将关键词调入第一图数 据库, 筛选得到第二图数据库。 权利要求书1页 说明书4页 附图1页 CN 114756631 A 2022.07.15 CN 114756631 A 1.一种基于知识图谱的青铜文物数据构建方法, 其特 征在于, 所述方法包括以下步骤: 步骤一、 构建元数据库, 所述元数据库包括第一数据、 第二数据和第三数据, 所述第一 数据为标准文物数据, 所述第二数据为网络抓取 数据, 所述第三数据为事 件数据; 步骤二、 构建元数据模型, 使用所述第三数据分别筛选所述第一数据和第 二数据, 一个 第三数据与其筛选得到的第一数据和第二数据组合成为一个元数据模型, 所述第一数据、 第二数据和第三数据两 两之间的共用词设为关键词; 步骤三、 将步骤二中生成的所有元数据模型导入知识图谱应用软件中, 生成第一图数 据库; 步骤四、 建立事件功能并分析所述事件功能得到关键词, 将关键词调入第 一图数据库, 筛选得到第二图数据库。 2.根据权利要求1所述的一种基于知识图谱的青铜文物数据构建方法, 其特征在于: 步 骤一中, 所述第一数据由标准化结构数据转化而来, 所述第一数据为图数据, 所述第一数据 包括节点数据和边数据, 所述节点数据包括第一本体和第二本体, 所述第一本体为青铜器 类, 所述第一本体包括多个第一 实体, 每个所述第一 实体为一个青铜器文物名称, 所述第二 本体为活动类, 所述第二本体包括多个第二 实体, 每个所述第二 实体为一个文物活动名称, 所述边数据包括属性和关系。 3.根据权利要求1所述的一种基于知识图谱的青铜文物数据构建方法, 其特征在于: 步 骤一中, 所述第二数据通过爬虫软件在网页上获取, 获取第二数据的方法为: 爬虫软件搜索 含青铜器文物的网页, 记录和解析网页内容, 解析内容包括青铜器文物名称及时间、 地点、 活动名称和活动信息数据。 4.根据权利要求1所述的一种基于知识图谱的青铜文物数据构建方法, 其特征在于: 步 骤一中, 所述第三数据包括人员活动名称、 类别和人员信息, 所述第三数据为录入数据, 录 入方式包括人工 录入和软件录入。 5.根据权利要求1所述的一种基于知识图谱的青铜文物数据构建方法, 其特征在于: 步 骤二中, 所述关键词至少包括青铜器文物名称、 时间、 地 点、 活动名称和人员信息中的一个。 6.根据权利要求1所述的一种基于知识图谱的青铜文物数据构建方法, 其特征在于: 步 骤四中, 事件功能中产生的新数据会更新所述元数据库, 事件功 能中产生的新数据会并入 所述步骤一中的事 件数据。 7.一种基于知识图谱的青铜文物数据构建系统, 其特征在于: 所述系统包括元数据模 块和知识图谱模块, 所述元数据模块包括数据转换组件和数据搜查组件, 所述数据转换组 件用于导入不同类型文件并转化为图数据, 所述数据搜查组件用于联网搜索, 所述数据搜 查组件包括爬虫软件; 所述知识图谱模块用于将图数据转化为知识图谱; 所述系统还包括 交互软件和自学习组件, 所述交互软件用于实现事件数据的录入, 所述自学习组件用于数 据迭代更新。 8.一种基于知识图谱的青铜文物数据构建设备, 其特征在于: 所述设备用于运行权利 要求7所述的系统, 所述设备包括一个或多个处理器以及一个或多个存储介质, 所述存储介 质用于存放指令, 所述指令用于执 行权利要求1 ‑6中任一所述的方法。 9.一种存储介质, 其特征在于: 其上存储有指令, 当由一个或多个处理器执行时, 使得 设备执行如权利要求1 ‑6中任一所述的方法。权 利 要 求 书 1/1 页 2 CN 114756631 A 2一种基于知识图谱的青铜文物数据构建 方法及系统 技术领域 [0001]本发明涉及大数据技术领域, 特别涉及一种基于知识图谱的青铜文物数据构建方 法及系统。 背景技术 [0002]青铜器文物是研究世界历史发展的重要文物遗产, 目前世界各国通过建立博物馆 或研究院用以展示、 保护和研究青铜器文物。 传统的实体博物馆通过展示文物和介绍相应 的数据达到信息传递的效果, 随着网络科技的发展, 线上博物馆利用数据信息和多媒体技 术将实体文物通过 各种形式的终端 进行展示。 [0003]目前, 现有技术中的线上博物馆里青铜文物的数据信息大多采用标准数据库进行 存储, 数据结构也是以物为中心, 数据构建方法依 托于文物数据标准, 这种构建方法得到的 数据呈现为树状结构, 优点是存储容易, 但是数据间联系性低, 与人 的互动性也不足, 在进 行系统分析研究时, 采用这种 方式的数据构建方法查询数据步骤繁琐, 且数据间关联信息 不能得到有效的存 储。 [0004]此外, 也有部分研究院或博物馆利用知识图谱技术以图数据的形式存储青铜器文 物信息, 知识图谱技术是在语义网络的基础上发展起来的, 是一种知识库表示方式, 是实现 人工智能的重要手段。 但是,这些图数据的构建方式依然是依托于树状数据结构。 发明内容 [0005]本发明的目的是提供一种基于知识图谱的青铜文物数据构建方法及系统, 以解决 上述现有技 术存在的问题。 [0006]本发明的上述 技术目的是通过以下技 术方案得以实现的: [0007]一种基于知识图谱的青铜文物数据构建方法, 所述方法包括以下步骤: [0008]步骤一、 构建元数据库, 所述元数据库包括第一数据、 第二数据和第三数据, 所述 第一数据为标准文物数据, 所述第二数据为网络抓取 数据, 所述第三数据为事 件数据; [0009]步骤二、 构建元数据模型, 使用所述第三数据分别筛选所述第一数据和第二数据, 一个第三数据与其筛选得到的第一数据和 第二数据组合成为一个元数据模 型, 所述第一数 据、 第二数据和第三数据两 两之间的共用词设为关键词; [0010]步骤三、 将步骤二中生成的所有元数据模型导入知识图谱应用软件中, 生成第一 图数据库; [0011]步骤四、 建立事件功能并分析所述事件功能得到关键词, 将关键词调入第一图数 据库, 筛选得到第二图数据库。 [0012]在进一步的实施例中, 步骤一中, 所述第一数据由标准化结构数据转化而来, 所述 第一数据为图数据, 所述第一数据包括节点数据和边数据, 所述节点数据包括第一本体和 第二本体, 所述第一本体为青铜器类, 所述第一本体包括多个第一 实体, 每个所述第一 实体 为一个青铜器文物名称, 所述第二本体为活动类, 所述第二本体包括多个第二 实体, 每个所说 明 书 1/4 页 3 CN 114756631 A 3

.PDF文档 专利 一种基于知识图谱的青铜文物数据构建方法及系统

文档预览
中文文档 7 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共7页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于知识图谱的青铜文物数据构建方法及系统 第 1 页 专利 一种基于知识图谱的青铜文物数据构建方法及系统 第 2 页 专利 一种基于知识图谱的青铜文物数据构建方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:53:18上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。