(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210914614.5
(22)申请日 2022.08.01
(71)申请人 洛阳师范学院
地址 471934 河南省洛阳市伊滨区吉庆路6
号
(72)发明人 张斌斌 张永新 沈家全 徐国梁
朱海龙
(74)专利代理 机构 北京睿智保诚专利代理事务
所(普通合伙) 11732
专利代理师 杜娟
(51)Int.Cl.
G06F 16/36(2019.01)
G06F 16/35(2019.01)
G06F 16/28(2019.01)
G06F 16/2458(2019.01)G06F 40/295(2020.01)
G06N 3/04(2006.01)
(54)发明名称
一种基于Neo4j的智慧农业知识图谱构建方
法及系统
(57)摘要
本发明公开了一种基于Neo4j的智慧农业知
识图谱构建方法及系统, 包括以下步骤: 根据农
业实体属性的异同对实体类型进行划分, 对各层
次实体类型关系给定约束定义; 利用Lattice ‑
LSTM修正模型对农业领域信息进行命名实体和
实体关系抽取; 将抽取到的农业领域信息以图结
构存放到Neo4j开放型数据库中, 实现农业领域
大规模知 识存储; 在Neo4j开放型数据库中, 基于
Spark的并行朴素贝叶斯 分类算法进行查询问题
分类, 完成农业领域知识图谱的构建。 本发明构
建了一个以农业用户为主体、 以农学体系为核
心、 以产销学研一体化为引领的农业领域知识
库, 推动未来农业的智慧化建 设进程。
权利要求书1页 说明书6页 附图2页
CN 115269872 A
2022.11.01
CN 115269872 A
1.一种基于Neo 4j的智慧农业知识图谱构建方法, 其特 征在于, 包括以下步骤:
根据农业实体属性的异同对实体类型进行划分, 对各层次实体类型关系给定约束定
义;
利用Lattice‑LSTM修正模型对农业领域信息进行命名实体和实体关系抽取;
将抽取到的农业领域信息以图结构存放到Neo4j开放型数据库中, 实现农业领域大规
模知识存 储;
在Neo4j开放型数据库中, 基于Spark的并行朴素贝叶斯分类算法进行查询问题分类,
完成农业领域知识图谱的构建。
2.根据权利要求1所述的一种基于Neo4j的智慧农业知识图谱构建方法, 其特征在于,
利用Latt ice‑LSTM修正模 型对农业领域信息进行命名实体和实体 关系抽取, 具体包括以下
步骤:
对农业领域信息进行 预处理, 划分、 切割 、 清洗得到的农业领域语料 数据;
对农业领域语料 数据进行 数据集特 征序列标注和词向量网络预训练;
利用Lattice‑LSTM修正模型实现命名实体和实体关系抽取。
3.根据权利要求1所述的一种基于Neo4j的智慧农业知识图谱构建方法, 其特征在于,
Neo4j开放型数据库将知识实体存储为节点, 用节点标签表 示所属实体类, 通过同时赋予多
个标签来表示交叉类型的知识实体。
4.根据权利要求1所述的一种基于Neo4j的智慧农业知识图谱构建方法, 其特征在于,
Spark的并行朴素贝叶斯分类算法还 包括对贝叶斯公式进行改进, 改进后的贝叶斯公式为:
式中Q表示训练样本集, ai表示分类项的第i个特征, Labels为分类数, L为分类类别标
签, λ值为常数。
5.根据权利要求1所述的一种基于Neo4j的智慧农业知识图谱构建方法, 其特征在于,
基于Spark的朴素贝叶斯分类算法可以表述 为:
aj表示分类项的第j个特 征, Li为分类类别标签, 表示第i个分类 类别。
6.一种基于Neo 4j的智慧农业知识图谱构建系统, 其特 征在于, 包括:
实体类型划分模块: 用于根据农业实体属性的异同对农业实体类型进行划分, 对各层
次实体类型关系给定约束定义;
Lattice‑LSTM模型模块: 用于利用Lattice ‑LSTM修正模型对农业领域信息进行命名实
体和实体关系抽取;
Neo4j开放型数据库模块: 用于将抽取到的农业领域信息以图结构存放到Neo4j开放型
数据库中, 优化设计适用于农业用户和农科体系的知识融合、 知识推论 规则;
农业领域知识图谱构建模块: 用于在Neo4j开放型数据库中, 基于Spark的并行朴素贝
叶斯分类算法进行查询问题分类, 完成农业领域知识图谱的构建。权 利 要 求 书 1/1 页
2
CN 115269872 A
2一种基于N eo4j的智慧农业知识图谱构建 方法及系统
技术领域
[0001]本发明涉及农业领域, 更具体的说是涉及一种基于Neo4j的智慧农业知识图谱构
建方法及系统。
背景技术
[0002]2012年, Google公司基于语义网与大数据技术提出 “知识图谱(Knowledge
Graph)”概念, 希望借助 “实体、 关系、 属性 ”三元组来表示现实生活中的事物及其之间关系。
“知识图谱 ”技术具体包含: 从万维网或应用领域中提取知识, 以节点和边的形式整合关联
的实体与概念, 以图的形式构建实体关系网络, 方便研究者从 “实体‑关系”的视角出发分析
和解决问题。
[0003]知识图谱体系中一般存有具备动态(Velocity)、 多源(Variety)、 海量(Volume)、
异构(Variability)等4V特征的大规模知识数据。 传统的SQL或NoSQL数据库以数据表为存
储方式, 难以实现高性能、 可扩展存储、 查询等操作, 严重限制了知识图谱技术的应用潜力
和性能。 而与 “表”数据库相比, Neo4j图数据库以图结构为存储单元, 不仅支持复杂的非结
构、 半结构化数据图模型存储, 且能高效处理海量实体数据的复杂 “关系”以及实现多种图
算法的快速遍历, 可以较好 地满足知识图谱的各种需求。
[0004]知识图谱技术是对语义网标准与技术的一次扬弃与升华, 从提出至今, 其热度有
增无减, 有逐渐发展和演进为智能机器的大脑知识库之趋势。 目前, 知识图谱已经在电商、
金融、 矿业、 媒体、 医药、 教育等众多垂 直领域得到广泛应用, 但在智慧农业领域的应用尚处
于萌芽状态, 个别学者单单关注运用知识图谱概念对农业文献进行可视化分析, 并未通过
建立领域数据库的方式来实现智慧农业知识图谱的系统构建。
[0005]近年来, 以自动化、 大型化、 智能化为核心的农业机械化建设取得了长足进展, 以
物联网、 云计算、 电子商务等为代表的新时代信息技术在农业发展中得到广泛应用, 使农业
产业得到提升, 农业用户可以更加高效、 便捷地进 行生产劳作与经营管理。 但是我国智慧农
业仍处于探索阶段, 存在以下主 要问题制约智慧农业的发展:
[0006]现代农业信息技术及设施装备是解决现代农业发展中问题的 “利器”, 随着物联
网、 云计算、 大数据、 第五代移动通信网络和人工智能等现代化信息技术的迅猛发展和日益
普及, 基于传统机械化的生产模式已经无法满足现代农业发展需求。 智慧农业的概念于
2014年提出, 通过数字信息化技术与农业领域的融合应用, 逐步引领我国迈入 “农业4.0”时
代, 即智慧农业发展的新阶段。
[0007]针对新型智慧农业领域存在的劳动力人口及结构劣化、 劳动从业人员文化水平偏
低、 专业技术人才匮乏、 建设和运行管理主体不明确、 信息化技术融合应用和数据挖掘能力
不足等问题, 本发明提出一种利用Neo4j图数据库构建智慧农业知识图谱系统的新方法。 基
于网络文献和语料, 通过对涉农领域相关数据的采集、 抽取、 存储和共享利用, 将现代农业
领域碎片化的半结构化和非结构化数据进行有机整合, 建立起具备产、 销、 学、 研完整结构
的农业知识库。 本发明对于推动我国智慧农业长远发展和加快新一代信息技术为农业服务说 明 书 1/6 页
3
CN 115269872 A
3
专利 一种基于Neo4j的智慧农业知识图谱构建方法及系统
安全报告 >
其他 >
文档预览
中文文档
10 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-17 23:38:02上传分享