(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210793531.5
(22)申请日 2022.07.07
(71)申请人 无锡芯领域 微电子有限公司
地址 214000 江苏省无锡市滨湖区建 筑西
路777号A3幢7层71 1-716
(72)发明人 许鸿舟
(74)专利代理 机构 江苏无锡苏汇 专利代理事务
所(普通合伙) 32593
专利代理师 沈彬彬
(51)Int.Cl.
G06F 16/36(2019.01)
G06F 16/34(2019.01)
(54)发明名称
一种对零散文本数据的可视化知识图谱处
理方法
(57)摘要
本发明属于数据处理技术领域, 提供了一种
对零散文本数据的可视化知识图谱处理方法, 包
括: 数据整理, 通过收集不同个体的各个特征及
属性, 通过脚本整理成可视化软件 所需的三元关
系组数据格式; 可视化显示,通过可视化软件将
文本数据图形化排列, 依据任一个体、 特征或属
性找到不同深度相关性的对象。 本设计具有将零
碎文本数据可视化显示、 展示不同个体间联系的
紧密程度以及查找拥有同一特性或属性的不同
个体等功能, 能够提高对枯燥的文字信息的提取
速度, 发掘不同个体间的联系, 以及为供货方与
需求方提供便利的数据交换桥梁。
权利要求书1页 说明书6页 附图4页
CN 115238089 A
2022.10.25
CN 115238089 A
1.一种对零散文本数据的可视化知识图谱处 理方法, 其特 征在于, 包括:
数据整理, 通过收集不同个体的各个特征及属性, 通过脚本整理成可视化软件所需的
三元关系组数据格式;
可视化显示,通过可视化软件将文本数据图形化排列, 依据任一个体、 特征或属性找到
不同深度相关性的对象。
2.根据权利要求1所述的一种对零散文本数据的可视化知识图谱处理方法, 其特征在
于: 所述数据整理为芯片生产流 程中涉及的各个步骤中使用到的设备的相关属性。
3.根据权利要求1所述的一种对零散文本数据的可视化知识图谱处理方法, 其特征在
于: 所述数据整理内容包括分区、 设备名称、 性能指标、 国外供应商、 国内供应商、 关键零部
件、 性能指标 方面。
4.根据权利要求1所述的一种对零散文本数据的可视化知识图谱处理方法, 其特征在
于: 所述三元关系组用于描述两个对象间的关系。
5.根据权利要求4所述的一种对零散文本数据的可视化知识图谱处理方法, 其特征在
于: 所述三元关系组根据整理出来的表格 格式, 分为 点表格和边表格。
6.根据权利要求5所述的一种对零散文本数据的可视化知识图谱处理方法, 其特征在
于: 所述点表格是编写脚本自动生成给表格中每个对 象编号的表格; 边表格是覆盖所有对
象关系的用对象编号表示两者间关系的三元关系组数据表格。权 利 要 求 书 1/1 页
2
CN 115238089 A
2一种对零散文本数据的可视化知识图谱 处理方法
技术领域
[0001]本发明属于数据处理技术领域, 尤其涉及 一种对零散文本数据的可视化知识图谱
处理方法。
背景技术
[0002]随着现代社会的飞速发展, 信息量的日益扩增, 数字化的数据处理方式得到了越
来越广泛的运用。 通过依据个体特征类型, 描述个体及属性的三元关系组数据, 从而生 成知
识图谱的方法是数据 处理中的一种常用手段。 知识图谱, 是用可视化技术描述知识资源及
其载体, 挖掘、 分析、 构建、 绘制和显示知识及它们之间的相互联系, 是通过将应用数学、 图
形学、 信息可视化技术、 信息科学等学科的理论与方法与计量学引文分析、 共现分析等方法
结合, 并利用可视化的图谱形象地展示学科的核心结构、 发展历史、 前沿领域以及整体知识
架构达到多学科融合目的 的现代理论。
[0003]常见的知识图谱一般只局限于针对某一个对象, 列举属于该对象的属性特征, 这
样虽然也能实现数据的可视化显示, 以及提高信息获取效率, 但是并不利于找到不同独立
个体间的相关性。
发明内容
[0004]本发明的目的是克服现有的缺陷, 提供一种对零散文本数据的可视化知识图谱处
理方法, 保证快速找到不同个 体的相关性。
[0005]为了解决上述 技术问题, 本发明提供了如下的技 术方案:
[0006]一种对零散文本数据的可视化知识图谱处 理方法, 包括:
[0007]数据整理, 通过收集不 同个体的各个特征及属性, 通过脚本整理成可视化软件所
需的三元关系组数据格式;
[0008]可视化显示,通过可视化软件将文本数据图形化排列, 依据任一个体、 特征或属性
找到不同深度相关性的对象。
[0009]进一步地, 所述数据整理为芯片生产流程中涉及的各个步骤中使用到的设备的相
关属性。
[0010]进一步地, 所述数据整理内容包括分区、 设备名称、 性能指标、 国外供应商、 国内供
应商、 关键零部件、 性能指标 方面。
[0011]进一步地, 所述三元关系组用于描述两个对象间的关系。
[0012]进一步地, 所述三元关系组根据整理出来的表格 格式, 分为 点表格和边表格。
[0013]进一步地, 所述点表格是编写脚本自动生成给表格中每个对象编号的表格; 边表
格是覆盖所有对象关系的用对象编号表示两者间关系的三元关系组数据表格。
[0014]有益效果:
[0015]本设计具有将零碎文本数据可视化显示、 展示不同个体间联系的紧密程度以及查
找拥有同一特性或属 性的不同个体等功 能, 能够提高对枯燥的文字信息的提取速度, 发掘说 明 书 1/6 页
3
CN 115238089 A
3
专利 一种对零散文本数据的可视化知识图谱处理方法
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 10:54:51上传分享