全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210417248.2 (22)申请日 2022.04.20 (71)申请人 深圳市医未医疗科技有限公司 地址 518000 广东省深圳市福田区福保街 道福保社区红柳道2号顺丰工业城辅 助楼二层 (72)发明人 王思伦  (74)专利代理 机构 深圳市诺正鑫泽知识产权代 理有限公司 4 4689 专利代理师 颜燕红 (51)Int.Cl. G06Q 10/10(2012.01) G06Q 50/22(2018.01) G16H 10/60(2018.01) G06F 16/31(2019.01)G06F 16/34(2019.01) G06F 16/36(2019.01) G06F 40/126(2020.01) G06F 40/284(2020.01) G06F 40/205(2020.01) (54)发明名称 一种基于电子病历的临床数据录入方法及 录入装置 (57)摘要 本申请适用于数据录入的技术领域, 提供了 一种基于电子病历 的临床数据录入方法, 包括: 提取电子病历中的结构化数据和非结构化数据; 将所述结构化数据的首列字段, 分别 与所述词库 进行匹配; 提取所述相同的首列字段对应的下一 列文本信息; 基于多个所述列名称, 在所述非结 构化数据中, 匹配与所述词库相同的索引词汇; 基于自然语言处理, 提取位于所述索引词汇之后 的与所述索引词汇对应的目标文本信息; 将所述 目标文本信息录入至第二列名 称对应的第二待 录入列单元中, 得到录入后的所述待录入数据列 表。 上述方案, 可针对不同的电子病历进行信息 提取, 并实现基于电子病历的临床数据录入, 无 需人工进行录入, 解决了无法将电子病历自动录 入临床数据的技 术问题。 权利要求书3页 说明书14页 附图5页 CN 114912887 A 2022.08.16 CN 114912887 A 1.一种基于电子病历的临床数据录入方法, 其特征在于, 所述临床数据录入方法, 包 括: 获取临床数据对应的待录入数据列表中的多个列名称以及多个所述列名称各自对应 的词库; 所述词库是指所述列名称对应的近义词; 提取电子病历中的结构化数据和非结构化数据; 将所述结构化数据的首列字段, 分别与所述词库进行匹配; 若存在与所述词库相同的首列字段, 则提取所述相同的首列字段对应的下一列文本信 息, 并将所述下一列文本信息录入至第一列名称对应的第一待录入列单元中; 所述第一列 名称是指与首列字段相同的列名称; 基于多个所述列名称, 在所述非结构化数据中, 匹配与所述词库相同的索引词汇; 所述 索引词汇包括姓名、 白细胞计数、 血小板计数、 甲胎蛋白计数、 诊断结果、 科室以及诊疗方 案; 基于自然语言处理, 提取位于所述索引词汇之后的与 所述索引词汇对应的目标文本信 息; 将所述目标文本信 息录入至第 二列名称对应的第 二待录入列 单元中, 得到录入后的所 述待录入数据列表; 所述第二列名称是指与索引词汇相同的列名称。 2.如权利要求1所述的录入方法, 其特征在于, 所述获取临床数据对应的待录入数据列 表中的多个列名称以及多个所述列名称各自对应的词库, 包括: 提取所述电子病历中的医院信息, 获取 所述医院信息对应的预设词库; 获取所述临床数据对应的待录入数据列表中的多个所述列名称; 在所述预设词库, 获取多个所述列名称各自对应的词库; 其中, 不同医院信息对应不同 的预设词库。 3.如权利要求1所述的录入方法, 其特征在于, 在所述基于自然语言处理, 提取位于所 述索引词汇之后的与所述索引词汇对应的目标文本信息之后, 还 包括: 若所述目标文本信 息的字符数量不大于 阈值, 则执行所述将所述目标文本信 息录入至 第二列名称对应的第二待录入列单 元中, 得到 录入后的所述待录入数据列表的步骤; 若所述目标文本信息的字符数量大于所述阈值, 则根据目标识别模型, 识别所述目标 文本信息是否正确; 若确定所述目标文本信 息正确, 则执行所述将所述目标文本信 息录入至第 二列名称对 应的第二待录入列单 元中, 得到 录入后的所述待录入数据列表的步骤。 4.如权利要求3所述的录入方法, 其特征在于, 所述若所述目标文本信 息的字符数量大 于所述阈值, 则根据目标识别模型, 识别所述目标文本信息是否正确, 包括: 将所述目标文本信息进行分词处 理, 得到所述目标文本信息对应的目标分词数据; 将所述目标分词数据进行编码处理, 得到所述目标分词数据对应的目标编码数据; 其 中, 不同的词语均预设有不同的编码值; 将所述目标编码数据按照预设方式排列, 得到目标编码矩阵; 获取多个预先训练的识别模型, 在多个所述识别模型中, 选择索引词汇对应的目标识 别模型; 将所述目标编码矩阵输入至所述目标识别模型中, 通过所述目标识别模型进行卷积处权 利 要 求 书 1/3 页 2 CN 114912887 A 2理, 得到由所述目标识别模型输出的目标识别结果; 根据所述目标识别结果, 确定所述目标文本信息是否正确。 5.如权利要求4所述的录入方法, 其特征在于, 在所述将所述目标文本信 息进行分词处 理, 得到所述目标文本信息对应的目标分词数据之前, 还 包括: 基于自然语言处 理, 提取所述目标文本信息中的摘要 文本信息; 将所述摘要文本信 息作为所述目标文本信 息, 执行所述将所述目标文本信 息进行分词 处理, 得到所述目标文本信息对应的目标分词数据的步骤以及后续 步骤。 6.如权利要求4所述的录入方法, 其特征在于, 在所述若所述目标文本信 息的字符数量 大于所述阈值, 则根据目标识别模型, 识别所述目标文本信息是否正确之前, 还 包括: 针对每个索引词汇, 分别经 过如下步骤, 得到每 个索引词汇对应的目标识别模型: 获取多个初始文件信息; 将所述初始文件信息进行分词处 理, 得到所述初始文本信息对应的训练分词数据; 将所述训练分词数据进行编码处 理, 得到所述训练分词数据对应的训练编码数据; 将所述训练编码矩阵输入至初始识别模型中, 通过所述初始识别模型进行卷积处理, 得到由所述初始 识别模型输出的训练识别结果; 根据所述训练识别结果以及所述索引词汇, 计算所述初始 识别模型的损失值; 根据所述损失值, 调整所述初始 识别模型的参数, 得到调整后的初始 识别模型; 将所述初始识别模型替换成所述调整后的初始识别模型, 返回执行所述将所述训练编 码矩阵输入至初始识别模型中, 通过所述初始识别模型进行卷积处理, 得到由所述初始识 别模型输出的训练识别结果的步骤以及后续 步骤, 得到所述目标识别模型。 7.如权利要求4所述的录入方法, 其特征在于, 所述将所述目标编码数据按照预设方式 排列, 得到目标编码矩阵, 包括: 根据所述目标分词数据在所述目标文本信 息中的原始排列顺序, 将所述目标编码数据 按照从左至右, 且从上至下的方式进行依次排列, 得到所述目标编码矩阵。 8.一种基于电子病历的临床数据录入装置, 其特征在于, 所述临床数据录入装置, 包 括: 第一获取单元, 用于获取临床数据对应的待录入数据列表中的多个列名称以及多个所 述列名称各自对应的词库; 所述词库是指所述列名称对应的近义词; 第一提取单元, 用于提取电子病历中的结构化数据和非结构化数据; 第一匹配单 元, 用于将所述结构化数据的首列字段, 分别与所述词库进行匹配; 第二提取单元, 用于若存在与所述词库相同的首列字段, 则提取所述相同的首列字段 对应的下一列文本信息, 并将所述下一列文本信息录入至第一列名称对应的第一待录入列 单元中; 所述第一列名称是指与首列字段相同的列名称; 第二匹配单元, 用于基于多个所述列名称, 在所述非结构化数据中, 匹配与所述词库相 同的索引词汇; 所述索引词汇包括姓名、 白细胞计数、 血小板计数、 甲胎蛋白计数、 诊断结 果、 科室以及诊疗方案; 第三提取单元, 用于基于自然语言处理, 提取位于所述索引词汇之后的与所述索引词 汇对应的目标文本信息; 录入单元, 用于将所述目标文本信息录入至第二列名称对应的第二待录入列单元中,权 利 要 求 书 2/3 页 3 CN 114912887 A 3

.PDF文档 专利 一种基于电子病历的临床数据录入方法及录入装置

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于电子病历的临床数据录入方法及录入装置 第 1 页 专利 一种基于电子病历的临床数据录入方法及录入装置 第 2 页 专利 一种基于电子病历的临床数据录入方法及录入装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:52:38上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。