全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210460177.4 (22)申请日 2022.04.28 (71)申请人 浙江工业大 学 地址 310014 浙江省杭州市拱 墅区朝晖六 区 (72)发明人 陆佳炜 李端倪 张元鸣 王琪冰  徐俊 肖刚 方静雯 郑嘉弘  (74)专利代理 机构 杭州浙科专利事务所(普通 合伙) 33213 专利代理师 汤明 (51)Int.Cl. G06F 16/901(2019.01) G06F 16/9032(2019.01) G06F 16/906(2019.01) G06F 40/279(2020.01)G06F 40/30(2020.01) (54)发明名称 一种基于自然语言语义转化的图数据库查 询语句构建方法 (57)摘要 本发明公开了一种基于自然语言语义转化 的图数据库查询语句构建方法, 包括以下步骤: 1)按节点标签对图数据库节点进行分类, 对分类 结果进行 实体抽取, 建立抽象实体集E; 2)利用同 义词挖掘将抽象实体具化为语料实体, 建立语料 实体集C; 3)定义基础图数据库查询语句模板; 借 助知识库选取自然语义, 并将自然语义转化为形 式语义; 4)按顺序遍历语义实体集Q, 构建查询子 句pql; 本发明提出了一种基于自然语言语义转 化的图数据库检索服务构建方法, 能够适用于多 种不同类型的图数据库, 泛用性良好。 权利要求书5页 说明书11页 附图4页 CN 115329137 A 2022.11.11 CN 115329137 A 1.一种基于自然语言语义转化的图数据库查询语句构建方法, 其特征在于, 包括以下 步骤: 1)按节点标签对图数据库节点进行分类, 对分类结果进行实体抽取, 建立抽象实体集 E; 2)利用同义词挖掘将抽象实体具化 为语料实体, 建立语料实体集C; 3)定义基础图数据库查询语句模板; 借助知识库选取自然语义, 并将自然语义转化为 形式语义; 根据自然语义和形式语义之间的映射关系来建立语义映射表, 并依托语义映射 表从自然语言描述的查询语句NQL中提取邻接查询语义; 将 语料实体语义转化为语义 实体, 建立语义 集Q; 4)按顺序遍历语义实体集Q, 构 建查询子句 pql, 将基础图数据库 查询语句模板BQT与 查 询子句pql相结合, 通过子句拼接生成目标图数据库查询语句。 2.根据权利要求1所述的一种基于自然语言语义转化的图数据库查询语句构建方法, 其特征在于, 所述 步骤1)具体步骤如下: 1.1)节点: 节点是图数据库中的基本存 储单元, 用n表示节点; 所述步骤1.1)中, 节点包 含以下信息: 1.1.1)节点名na: 节点的名称, 用于唯一标识 节点; 1.1.2)标签label: 用于将节点分类, 具有相同标签的节点属于同一类; 1.1.3)属性 np: 节点所 具有的某种性质的名称。 节点可能有 多个不同属性; 1.1.4)属性 值nv: 节点所 具有的某种性质的具体描述。 节点可能有 多个不同的属性 值; 1.2)节点 集: 节点集由图数据库中的所有节点组成, 用符号 N表示, N=[n1, n2, ..., nn]; 1.3)抽象实体: 抽象实体是对标签相同节点的抽象, 抽象实体是一个节点模版, 用于描 述一类节点的属性和状态, 用符号e表示; 所述步骤1.3)中, 抽象实体包 含以下信息: 1.3.1)抽象实体名en: 抽象实体的名称, 用于唯一标识抽象实体; 1.3.2)抽象属性ep: 抽象实体所具有 的某种性质的名称, 抽象实体可能有多个不同的 属性; 1.4)分类: 分类由若干个标签label相同的节点组成, 用符号p表示; 1.5)分类集: 分类集由若干个不同分类组成, 用符号P表示, P=[p1, p2, ..., pn]; 1.6)抽象实体集: 抽象实体集由若干个个抽象实体组成, 用符号E表示, E=[e1, e2, ..., en], ei代表E中的第i个抽象实体; 1.7)节点分类: 根据节点的标签label, 对节点 集N进行划分, 划分的结果 为分类集P; 所述步骤1.7)中, 节点分类处 理过程如下: 1.7.1)创建 分类集P, 最初分类集P为空; 1.7.2)按顺序遍历节点 集N, 记i次取到的节点 为ni; 1.7.3)如果 ni的标签为空, 则舍去ni; 1.7.4)如果ni的标签非空, 则遍历分类集P, 检查P中是否有分类pe, 其成员的标签与ni 的标签相同; 如果分类pe不存在, 则跳转至步骤1.7.5); 如果pe存在, 则跳转至步骤1.7.6); 1.7.5)创建新的分类p, 将节点 ni加入p, 并p加入分类集P; 1.7.6)将节点 ni加入pe;权 利 要 求 书 1/5 页 2 CN 115329137 A 21.7.7)若ni是N的最后一个节点, 则遍历结束; 1.8)实体抽取: 遍历分类集P, 创建抽象实体, 从分类节点中抽取出共有属性作为抽象 实体的属性; 所述步骤1.8)中, 实体抽取处 理过程如下: 1.8.1)创建抽象实体集E, 最初E为空; 1.8.2)按顺序遍历分类集P, 记i次取到的分类为pi; 1.8.3)创建一个抽象实体e, 将pi中的节点标签label作为抽象实体名en, 将pi中的所有 节点共有的属性名作为抽象实体的抽象属性ep; 1.8.4)将抽象实体e加入抽象实体集E; 1.8.5)记录抽象实体e和分类pi的一对一映射关系, 称e和pi是关联的; 1.8.6)若pi是P的最后一个分类, 则遍历结束。 3.根据权利要求2所述的一种基于自然语言语义转化的图数据库查询语句构建方法, 其特征在于, 所述 步骤2)具体步骤如下: 2.1)同义词挖掘: 通过常见的同义词挖掘方法来找出给定词汇的同义词, 同义词挖掘 是自然语言处 理领域的一种常见 方法; 2.2)同义词库: 称词汇的同义词挖掘结果 为同义词库, 用符号syn表示; 2.3)语料实体: 语料实体是抽象属性具体化的抽象实体, 用符号cor表示语料实体; 对 于抽象实体的抽象属性, 语料实体以同义词库的方式规定抽象属性的取值范围; 2.4)语料实体集: 语料实体集由若干个语料实体组成, 用符号C表示, C=[cor1, cor2, ..., corn], cori代表C中的第i条语料; 2.5)语料具体化: 遍历抽象实体集E, 找到与抽象实体相 关联的分类, 对分类进行同义 词挖掘, 将挖掘结果作为抽象实体的抽象属性取值范围; 所述步骤2.5)中, 语料 具体化处 理过程如下: 2.5.1)创建语料实体集C, 最初C不包 含任何成员; 2.5.2)按顺序遍历抽象实体集E, 记i次取到的抽象实体为ei; 2.5.3)根据步骤1.8.5)所记录的映射关系, 找到ei对应的分类pi; 2.5.4)按顺序遍历ei的所有抽象属性, 记i次取到的抽象属性 为epi; 2.5.5)在pi的所属节点中, 若节点的属性名和epi相等, 则记录该节点属性值, 所有被记 录的属性 值构成集 合ep_seti; 2.5.6)对ep_seti进行同义词挖掘, 其结果构成同义词库syni, 将ep_seti的成员并入 syni, 把syni作为epi的取值范围; 2.5.7)当epi是ei的最后一项属性时, ei的所有抽象属性都和对应的syni建立了一一映 射关系, 此时称ei被具体化 为cori, 将cori加入语料实体集C; 2.5.8)若ei已是E的最后一个分类, 则遍历结束。 4.根据权利要求1所述的一种基于自然语言语义转化的图数据库查询语句构建方法, 其特征在于, 所述 步骤3)具体步骤如下: 3.1)基础图数据库查询语句模版: 基础图数据库查询语句模版给出了基础查询语句并 规定了目标图数据库查询语句的表达形式, 用符号BQT表 示, BQT包含类型描述符type、 基础 查询语句bql和查询子句集pql_set;权 利 要 求 书 2/5 页 3 CN 115329137 A 3

.PDF文档 专利 一种基于自然语言语义转化的图数据库查询语句构建方法

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于自然语言语义转化的图数据库查询语句构建方法 第 1 页 专利 一种基于自然语言语义转化的图数据库查询语句构建方法 第 2 页 专利 一种基于自然语言语义转化的图数据库查询语句构建方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:45:50上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。