全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 20221017151 1.4 (22)申请日 2022.02.24 (71)申请人 医渡云 (北京) 技 术有限公司 地址 100089 北京市海淀区花园北路3 5号9 号楼8层801 (72)发明人 柯昆 康波  (74)专利代理 机构 北京乐知新创知识产权代理 事务所(普通 合伙) 11734 专利代理师 周伟 (51)Int.Cl. G06F 40/295(2020.01) G06F 40/242(2020.01) G06F 16/36(2019.01) G06N 20/00(2019.01) G16H 10/60(2018.01)G16H 80/00(2018.01) (54)发明名称 一种基于AC自动机的实体识别方法、 装置及 电子设备 (57)摘要 本公开提供了基于AC自动机的实体识别方 法, 具体实现方案为: 基于维度结构、 解剖位置、 影像学发现、 核心词和特征词构建字典树; 基于 所述字典树识别医疗数据中的解剖位置、 核心 词、 特征词、 影像学发现和维度结构中至少之一; 其中, 所述维度结构包括: 维度词、 维度属性、 定 量词和累及状态中至少之一; 所述核心词包括与 疾病相关的影像学发现和/或症状词; 所述特征 词包括对所述核心词的修饰词; 所述维度词和维 度属性包括与体征信息相关的影像学发现; 所述 解剖位置包括体征信息; 所述定量词包括定量名 称、 定量值、 定量单位和至少两个体征信息之间 的相对关系; 所述累及状态包括疾病对体征的影 响状态, 如此, 可 以提升医疗数据中实体识别的 准确性。 权利要求书2页 说明书10页 附图3页 CN 114580414 A 2022.06.03 CN 114580414 A 1.一种基于AC自动机的实体识别方法, 其特 征在于, 所述方法包括: 基于维度结构、 解剖位置、 影 像学发现、 核心词和特 征词构建字典树; 基于所述字典树识别医疗数据中的解剖位置、 核心词、 特征词、 影像学发现和维度 结构 中至少之一; 其中, 所述维度结构包括: 维度词、 维度属性、 定量词和累及状态中至少之一; 所述核心 词包括与疾病相关的影像学发现和/或症状词; 所述特征词包括对所述核心词的修饰词; 所 述维度词和维度属 性包括与体征信息相关的影像学发现; 所述解剖位置包括体征信息; 所 述定量词包括定量名称、 定量值、 定量单位和至少两个体征信息之间的相对关系; 所述累及 状态包括疾病对体征的影响状态。 2.根据权利要求1所述的方法, 其特征在于, 所述基于维度结构、 解剖位置、 影像学发 现、 核心词和特 征词构建字典树, 包括: 以所述解剖位置作为所述字典树的父节点, 所述维度结构、 所述影像学发现作为所述 字典树的子节点; 以所述解剖位置作为所述字典树的父节点, 所述核心词和所述特征词作为所述字典树 的子节点; 基于所述字典树的父节点和所述字典树的子节点之间的关系, 构建所述字典树。 3.根据权利要求2所述的方法, 其特征在于, 所述基于维度结构、 解剖位置、 影像学发 现、 核心词和特 征词构建字典树, 包括: 以所述解剖位置作为所述字典树的父节点, 所述维度结构作为所述解剖位置的子节 点, 所述影像学发现作为所述 维度结构的子节点; 或者, 以所述解剖位置作为所述字典树的 父节点, 所述影像学发现为所述解剖位置的子节点, 所述维度结构作为所述影像学发现的 子节点; 以所述解剖位置作为所述字典树的父节点, 所述核心词作为所述解剖位置的子节点, 所述特征词作为所述核心词的子节点; 基于所述父节点和子节点之间的关系, 构建所述字典树。 4.根据权利要求1所述的方法, 其特征在于, 所述基于维度结构、 解剖位置、 影像学发 现、 核心词和特 征词构建字典树, 包括: 以所述核心词作为所述字典树的父节点, 所述维度 结构和所述特征词作为所述字典树 的子节点, 构建所述字典树。 5.根据权利要求4所述的方法, 其特征在于, 所述基于维度结构、 解剖位置、 影像学发 现、 核心词和特 征词构建字典树, 包括: 以所述核心词作为父节点, 所述维度结构作为所述核心词的子节点, 所述特征词和所 述核心词作为所述维度结构的子节点, 所述解剖位置作为所述维度结构的子节点, 构建所 述字典树。 6.根据权利要求1所述的方法, 其特征在于, 所述基于维度结构、 解剖位置、 影像学发 现、 核心词和特 征词构建字典树, 包括: 以所述影 像学发现作为父节点, 所述特 征词作为所述影 像学发现的子节点; 或者, 以所述影 像学发现和所述特 征词互相作为对方的父节点; 基于所述父节点和子节点之间的关系, 构建所述字典树。权 利 要 求 书 1/2 页 2 CN 114580414 A 27.根据权利要求2所述的方法, 其特征在于, 所述基于所述字典树识别医疗数据中的解 剖位置、 核心词、 特 征词、 影像学发现和维度结构中至少之一, 包括: 基于所述字典树中的解剖位置, 识别所述医疗数据中的解剖位置; 基于所述字典树中的解剖位置的子节点, 识别所述医疗数据中的维度 结构和影像学发 现; 基于所述字典树中的解剖位置的子节点, 识别所述医疗数据中的核心词和特 征词。 8.根据权利要求4所述的方法, 其特征在于, 所述基于所述字典树识别医疗数据中的解 剖位置、 核心词、 特 征词、 影像学发现和维度结构中至少之一, 包括: 基于所述字典树中的核心词, 识别所述医疗数据中的核心词; 基于所述字典树中的核心词的子节点, 识别所述医疗数据中的维度结构和特 征词; 和/或, 基于所述字典树中的维度结构的子节点, 识别所述医疗数据中的解剖位置 。 9.根据权利要求6所述的方法, 其特征在于, 所述基于所述字典树识别医疗数据中的解 剖位置、 核心词、 特 征词、 影像学发现和维度结构中至少之一, 包括: 基于所述字典树中的影 像学发现, 识别所述医疗数据中的影 像学发现; 基于所述字典树中所述影 像学发现的子节点, 识别所述医疗数据中的特 征词; 或者, 基于所述字典树中的特 征词发现, 识别所述医疗数据中的特 征词; 基于所述字典树中所述特 征词的子节点, 识别所述医疗数据中的影 像学发现。 10.根据权利要求1所述的方法, 其特征在于, 所述基于所述字典树识别医疗数据中的 核心词、 特 征词、 影像学发现和维度结构之后, 所述方法还 包括: 将识别到的所述核心词、 所述特征词、 所述影像学发现和所述维度 结构, 按照第 一模板 中所述核心词、 所述特征词、 所述影像学发现和所述 维度结构的位置进 行合并, 生成所述医 疗数据对应的实体。 11.一种基于AC自动机的实体识别装置, 其特 征在于, 所述装置包括: 构建单元, 用于基于维度结构、 解剖位置、 影 像学发现、 核心词和特 征词构建字典树; 识别单元, 用于基于所述字典树识别医疗数据中的解剖位置、 核心词、 特征词、 影像学 发现和维度结构中至少之一; 其中, 所述维度结构包括: 维度词、 维度属性、 定量词和累及状态中至少之一; 所述核心 词包括与疾病相关的影像学发现和/或症状词; 所述特征词包括对所述核心词的修饰词; 所 述维度词和维度属 性包括与体征信息相关的影像学发现; 所述解剖位置包括体征信息; 所 述定量词包括定量名称、 定量值、 定量单位和至少两个体征信息之间的相对关系; 所述累及 状态包括疾病对体征的影响状态。 12.一种电子设备, 包括: 至少一个处 理器; 以及 与所述至少一个处 理器通信连接的存 储器; 其中, 所述存储器存储有可被所述至少一个处理器执行的指令, 所述指令被所述至少一个处 理器执行, 以使所述至少一个处 理器能够执 行权利要求1 ‑10中任一项所述的方法。 13.一种存储有计算机指令的非瞬时计算机可读存储介质, 其中, 所述计算机指令用于 使所述计算机执 行根据权利要求1 ‑10中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114580414 A 3

.PDF文档 专利 一种基于AC自动机的实体识别方法、装置及电子设备

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于AC自动机的实体识别方法、装置及电子设备 第 1 页 专利 一种基于AC自动机的实体识别方法、装置及电子设备 第 2 页 专利 一种基于AC自动机的实体识别方法、装置及电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:51:41上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。