全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211028365.6 (22)申请日 2022.08.25 (71)申请人 安徽省地质调查院 (安徽省地质科 学研究所) 地址 230001 安徽省合肥市宁国路19号 (72)发明人 陈忠良 王翔 吴衡 方懿  孙书婕  (74)专利代理 机构 北京维正专利代理有限公司 11508 专利代理师 张伟 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/35(2019.01) G06F 16/36(2019.01) G06F 40/295(2020.01)G06K 9/62(2022.01) (54)发明名称 岩石描述文本的质检方法、 装置、 设备及介 质 (57)摘要 本申请公开了一种岩石描述文本的质检方 法、 装置、 设备及介质, 其中, 该方法包括: 获取待 检测岩石描述文本; 将待检测岩石描述文本输入 岩石知识提取模 型, 用于获取岩石类型信息和岩 石知识三元组; 基于岩石知识图谱, 对岩石知识 三元组进行一致性比对, 获取岩石知识比对结 果; 若岩石知识比对结果为比对结果一致, 则基 于岩石知识图谱, 获取同时具备岩石类型信息中 记载的所有特征的岩石类型匹配数目; 若岩石类 型匹配数目的结果为一, 则确认待检测岩石描述 文本为质检合格文本; 若所述岩石类型匹配数目 的结果大于一, 则推送匹配岩石类型间的鉴定知 识。 该方法可有效保障岩石观 察描述文本的完整 性和准确性。 权利要求书3页 说明书12页 附图5页 CN 115374248 A 2022.11.22 CN 115374248 A 1.一种岩石 描述文本的质检方法, 其特 征在于, 包括: 获取待检测岩石 描述文本; 将所述待检测岩石描述文本输入岩石知识提取模型, 用于获取岩石类型信 息和岩石知 识三元组; 基于岩石知识图谱, 对所述岩石知识三元组进行一 致性比对, 获取岩石知识比对结果; 若所述岩石知识比对结果为比对结果一致, 则基于所述岩石知识图谱, 获取同时具备 所述岩石类型信息中记载的所有特 征的岩石类型匹配数目; 若所述岩石类型匹配数目的结果为一, 则确认所述待检测岩石描述文本为质检合格文 本; 若所述岩石类型匹配数目的结果大于一, 则推送匹配岩石类型间的鉴定知识。 2.根据权利要求1所述的一种岩石描述文本的质检方法, 其特征在于, 在所述获取岩石 类型信息和岩石知识三元组之前, 还 包括: 获取所述岩石知识提取模型输出的待检测岩石命名实体信息; 基于所述待检测岩石命名实体信息, 对所述待检测岩石描述文本进行实体位置标记, 获取实体位置标记结果; 将所述待检测岩石描述文本和所述实体位置标记结果输入实体间关系分类模型, 用于 获取待检测命名实体间关系信息 。 3.根据权利要求2所述的一种岩石描述文本的质检方法, 其特征在于, 所述实体间关系 分类模型包括基于增强BERT的已训练关系分类模型; 在所述将所述待检测岩石描述文本和所述实体位置标记结果输入实体间关系分类模 型之前, 还 包括: 获取第一训练集, 所述第一训练集包括输入岩石描述语料和实体间预期关系分类结 果; 将所述的第 一训练集中的输入岩石描述语料输入待训练关系分类模型中, 用于获取所 述关系分类模型响应输出的关系分类预测结果; 通过第一损失函数比较所述预测关系分类结果和所述实体间预期关系分类结果是否 一致; 迭代调整所述待训练关系分类模型各节点的可训练参数, 直至所述第 一损失函数达到 最小值时结束, 用于获取 所述已训练关系分类模型。 4.根据权利要求1所述的一种岩石描述文本的质检方法, 其特征在于, 所述将所述待检 测岩石描述文本 输入岩石知识提取模型, 用于获取岩石类型信息和岩石知识三元组, 包括: 将所述待检测岩石描述文本输入岩石知识提取模型, 用于获取待检测岩石命名实体信 息; 基于所述待检测岩石命名实体信息, 获取待检测命名实体间关系信息; 将所述待检测岩石命名实体信 息进行复杂实体分离和基于字典的实体信 息过滤, 获取 信息过滤结果; 将所述信 息过滤结果与所述待检测命名实体间关系信 息进行重组, 形成所述待检测岩 石描述文本的所述岩石类型信息和所述岩石知识三元组。 5.根据权利要求4所述的一种岩石描述文本的质检方法, 其特征在于, 所述将所述待检权 利 要 求 书 1/3 页 2 CN 115374248 A 2测岩石命名实体信息进行复杂实体分离, 包括: 确定所述待检测岩石命名实体信息的构造实体 类型, 获取确认结果; 若所述确认结果为双构造实体, 则将所述待检测岩石命名实体信 息通过基于规则的复 杂实体分离方法进行双构造实体分离; 若所述确认结果为多结构 实体, 则将所述待检测岩石命名实体信 息通过所述复杂实体 分离方法进行多结构实体分离 。 6.根据权利要求1所述的一种岩石描述文本的质检方法, 其特征在于, 所述岩石知识提 取模型包括: 基于BERT的已训练序列标注模型; 在所述获取待检测岩石 描述文本之前, 还 包括: 获取第二训练集, 所述第二训练集包括: 用于输入模型的岩石描述语料和实体序列预 期标注结果; 将所述的第 二训练集中的岩石描述语料输入待训练序列标注模型, 用于获取所述待训 练序列标注模型响应输出的实体序列预测标注结果; 通过第二损失函数比较所述实体序列预期标注结果和所述实体序列预测标注结果是 否一致; 迭代调整所述待训练序列 标注模型各节点的可训练参数, 直至所述第 二损失函数达到 最小值时结束, 用于获得已训练序列标注模型作为所述岩石知识提取模型。 7.根据权利要求1所述的一种岩石描述文本的质检方法, 其特征在于, 在所述获取岩石 知识比对结果之后, 还 包括: 若存在一条以上所述岩石知识三元组不存在, 则确定所述待检测岩石描述文本为质检 不合格; 当所述待检测岩石 描述文本为质检不 合格时, 推送非标岩石知识三元组。 8.根据权利要求1所述的一种岩石描述文本的质检方法, 其特征在于, 在所述岩石知识 比对结果 为比对结果 一致之后, 还 包括: 根据所述待检测岩石描述文本, 提取所述岩石类型信息对应的新鲜色、 所具结构、 所具 构造、 主要矿物和次要矿物等描述特 征。 9.一种岩石 描述文本的质检装置, 其特 征在于, 包括: 获取描述文本模块, 用于获取待检测岩石 描述文本; 获取知识三元组模块, 用于将所述待检测岩石描述文本输入岩石知识提取模型, 用于 获取岩石类型信息和岩石知识三元组; 获取知识比对结果模块, 用于基于岩石知识图谱, 对所述岩石知识三元组进行一致性 比对, 获取岩石知识比对结果; 获取匹配数目模块, 用于若所述岩石知识比对结果为比对结果一致, 则基于所述岩石 知识图谱, 获取同时具 备所述岩石类型信息中记载的所有特 征的岩石类型匹配数目; 确认质检合格模块, 用于若所述岩石类型匹配数目的结果为一, 则确认所述待检测岩 石描述文本为质检合格文本; 鉴定知识推荐模块, 用于若所述岩石类型匹配数目的结果大于一, 则推送匹配岩石类 型间的鉴定知识。 10.一种计算机设备, 包括存储器、 处理器以及存储在所述存储器中并可在所述处理器权 利 要 求 书 2/3 页 3 CN 115374248 A 3

.PDF文档 专利 岩石描述文本的质检方法、装置、设备及介质

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 岩石描述文本的质检方法、装置、设备及介质 第 1 页 专利 岩石描述文本的质检方法、装置、设备及介质 第 2 页 专利 岩石描述文本的质检方法、装置、设备及介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-17 23:43:20上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。