(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211057227.0
(22)申请日 2022.08.31
(71)申请人 上海海洋大学
地址 201306 上海市浦东 新区沪城环路9 99
号
(72)发明人 陈明 朱珏樟 席晓桃
(74)专利代理 机构 深圳市韦恩肯知识产权代理
有限公司 4 4375
专利代理师 李华双
(51)Int.Cl.
G06F 16/36(2019.01)
G06F 16/901(2019.01)
G06F 40/295(2020.01)
(54)发明名称
一种基于知识图谱的花卉病虫害的本体建
模方法和建模系统
(57)摘要
本发明公开一种基于知识图谱的花卉病虫
害的本体建模 方法。 该本体建模 方法通过研究领
域相关文献, 构建了能够满足基本花卉病虫害防
治要求的本体模型, 相比其他目前已有的本体,
额外考虑到了环境对花卉病虫害防治的影响, 环
境因素对于花卉病虫害的防治上不仅着重于治
疗, 更注重于防范, 及时防范病虫害能够进一步
减小花卉的损害。 采用RDF图存储本体结构, 根据
自定义RDF2PG映射方法, 将抽取出的三元组不经
过其他存储 方式, 直接按照本体模 型的结构存储
进Neo4j数据库中, 规范了 所管理的知 识, 提高了
存储效率及自动构建图谱能力。
权利要求书2页 说明书8页 附图3页
CN 115495585 A
2022.12.20
CN 115495585 A
1.一种基于知识图谱的花 卉病虫害的本体建模方法, 其特 征在于, 包括以下步骤:
从文本中提取花 卉病虫害领域的多个属性要素;
构建所述 花卉病虫害领域的本体模型, 其中, 所述本体模型包括 三元组单 元;
分别对所述 三元组单 元中的头 部实体数组和尾部实体数组进行 标注;
构建基于所述头部实体数组、 所述尾部实体数组以及所述头部实体数组与 所述尾部实
体数组之间的关系的联合抽取框架模型;
使用预训练的语言表征模型建立基于知识图谱的知识抽取框架;
将所述三元组单元中的资源描述框架转换成属性 图, 并将所述属性 图存储在Neo4j图
形数据库中。
2.根据权利要求1所述的基于知识图谱的花卉病虫害的本体建模方法, 其特征在于, 所
述三元组单 元的属性包括数据属性和对象属性。
3.根据权利要求1所述的基于知识图谱的花卉病虫害的本体建模方法, 其特征在于, 所
述分别对所述 三元组单 元中的头 部实体数组和尾部实体数组进行 标注具体包括以下步骤:
对所述头部实体数组 的头部起始位置和头部结束位置分别标注第 一标记, 对所述头部
起始位置与所述头部结束位置之间的字符标注第二标记, 其中所述第一标记与所述第二标
记不同;
对所述尾部实体数组 的尾部起始位置和尾部结束位置分别标第 三标记, 对所述尾部起
始位置与所述尾部结束位置之 间的字符标注第四标记, 其中所述第三标记与所述第四标记
不同。
4.根据权利要求3所述的基于知识图谱的花卉病虫害的本体建模方法, 其特征在于, 所
述构建基于所述头部实体数组、 所述尾部实体数 组以及所述头部实体数组与所述尾部实体
数组之间的关系的联合抽取框架模型 具体包括以下步骤:
对于输入的文本中的每个字符向量, 分别计算所述头部起始位置和所述头部结束位
置, 其计算公式为:
其中, ci为所述文本中的单个字符向量,
和
分别表示头部起始位置的可能位
置和头部结束位置的可能位置, σ 为S型函数, Wstart和Wend分别表示起始训练权重和结束训练
权重, bstart和bend分别表示 起始训练偏置和结束训练偏置 。
5.根据权利要求4所述的基于知识图谱的花卉病虫害的本体建模方法, 其特征在于, 所
述建模方法还 包括以下步骤:
将每个所述头部实体数组与每个关系特定标注器建立起映射, 计算各关系的尾部实体
数组的尾部起始位置和尾部结束位置,其计算公式为:
其中, r为关系类型,
是第k个头实体特征向量
的第i个字符向量表示,
和权 利 要 求 书 1/2 页
2
CN 115495585 A
2分别表示尾部起始位置的可能位置与尾部结束位置的可能位置,posi表示第i个字符
所在词的词性向量。
6.根据权利要求5所述的基于知识图谱的花卉病虫害的本体建模方法, 其特征在于, 所
述使用预训练的语言表征模型建立基于知识图谱的知识抽取框架具体包括以下步骤:
使用结巴分词工具进行词性标注并嵌入词性向量, 将头部实体字符 向量和包含句子信
息的字符序列向量进 行融合以得到与所述头部实体字符位置不同处的字符的向量, 其计算
公式如下:
其中, ci表示第i个字符的预训练的语言表征模型的编码字符向量。
7.根据权利要求1所述的基于知识图谱的花卉病虫害的本体建模方法, 其特征在于, 所
述将所述三元组单元中的资源描述框架转换成属性图, 并将所述属性图存储在Neo4j图形
数据库中具体包括以下步骤:
使用Jena应用程序接口对所述文本进行读取和推理, 使用Neo4j图形数据库作为所述
属性图的存 储工具。
8.根据权利要求7所述的基于知识图谱的花卉病虫害的本体建模方法, 其特征在于, 所
述将所述三元组单元中的资源描述框架转换成属性图, 并将所述属性图存储在Neo4j图形
数据库中具体包括以下步骤:
抽取三元组;
使用所述Jena应用程序接口读取 所述本体模型;
获取实体概念信息, 遍历所述三元组, 在所述本体模型中查找所述三元组中的三元组
关系所对应的头 部实体概念和尾部实体概念;
获取实体属性信 息, 根据所述头部实体概念和所述尾部实体概念在所述本体模型中查
找对应的属性名称和 属性类型;
生成密码语句, 存 储所述三元组。
9.一种基于知识图谱的花卉病虫害的本体建模系统, 其特征在于, 所述建模系统通过
权利要求1 ‑8中任一项所述的基于知识图谱的花 卉病虫害的本体建模方法实现。权 利 要 求 书 2/2 页
3
CN 115495585 A
3
专利 一种基于知识图谱的花卉病虫害的本体建模方法和建模系统
安全报告 >
其他 >
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-17 23:39:06上传分享