全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210377803.3 (22)申请日 2022.04.06 (71)申请人 中电通商数字技 术 (上海) 有限公司 地址 200000 上海市浦东 新区中国(上海) 自由贸易试验区奥纳路188号1幢楼5 层536室 (72)发明人 徐辉 吴鹏 秦浩 张城铭泽   (74)专利代理 机构 南京中盟科创知识产权代理 事务所 (特殊普通合伙) 32279 专利代理师 张靖尧 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/35(2019.01) G06F 40/247(2020.01)G06F 40/284(2020.01) G16H 40/20(2018.01) (54)发明名称 基于不同应用场景的医学影像检查项目名 称标准化方法及系统 (57)摘要 本发明公开了基于不同应用场景的医学影 像检查项目名称标准化方法及系统, 该方法包括 以下步骤: 基于实际应用场景中的源数据情况、 人力资源、 时间资源、 准确率要 求、 硬件资源及泛 化能力需求, 选择对应的医学影像检查项目名称 标准化方法; 采集各条历史检查数据中的检查部 位及检查方法相关字段, 利用医学影像检查项目 名称标准化方法将采集的字段映射为对应的标 准检查项目名称。 本发明可以选择适合的标准化 方法实现对医学影像数据中复杂多样的检查部 位、 检查方法相关字段进行识别、 治理, 并最终与 标准检查项目名称对应起来, 以便医学影像数据 在医疗、 科研、 教学、 医保、 大数据应用等各个领 域得以利用。 权利要求书5页 说明书15页 附图1页 CN 114780738 A 2022.07.22 CN 114780738 A 1.基于不同应用场景的医学影像检查项目名称标准化方法, 其特征在于, 该方法包括 以下步骤: S1、 基于实际应用场景中的源数据情况、 人力资源、 时间资源、 准确率要求、 硬件资源及 泛化能力需求, 选择对应的医学影 像检查项目名称标准 化方法; S2、 采集各条历史检查数据中的检查部位及检查方法相关字段, 并利用医学影像检查 项目名称标准 化方法将采集的字段映射 为对应的标准检查项目名称。 2.根据权利要求1所述的基于不同应用场景的医学影像检查项目名称标准化方法, 其 特征在于, 所述医学影像检查项目名称标准化方法包括第一医学影像检查项目名称标准化 方法、 第二医学影像检查项目名称标准化方法、 第三医学影像检查项目名称标准化方法及 第四医学影 像检查项目名称标准 化方法中的一种。 3.根据权利要求1所述的基于不同应用场景的医学影像检查项目名称标准化方法, 其 特征在于, 所述源数据为采集到的需要进 行标准化处理的各条历史检查数据中的检查部位 及检查方法相关字段, 所述检查部位及检查方法相关字段包括申请单中的检查部位及检查 项目字段、 检查报告中的影像所见及检查结果字段、 Dicom影像文件提取出的检查部位及检 查描述字段。 4.根据权利要求2所述的基于不同应用场景的医学影像检查项目名称标准化方法, 其 特征在于, 采集各条历史检查数据中的检查部位及检查方法相关字段, 并利用所述第一医 学影像检查项目名称标准化方法将采集的字段映射为对应的标准检查项目名称包括以下 步骤: S21、 结合基于词典的分词算法及基于统计的机器学习算法对各条源数据中的字段进 行分词处 理, 并对字段中的无用信息进行清洗; S22、 利用编码器分别对清洗后的各条源数据中的每个字段进行编码, 并通过TF ‑IDF、 word2vec、 GCN或GCSTS模型将编码结果 转化为对应的词向量; S23、 利用编码器分别对每个标准检查项目名称进行编码, 并通过TF ‑IDF、 word2vec、 GCN或GCSTS模型将编码结果 转化为对应的词向量; S24、 分别计算清洗后的各条源数据中字段对应的词向量与每个标准项目名称对应的 词向量间的文本相似度, 并将相似度最高的标准项目名称与该 条源数据进行对应。 5.根据权利要求4所述的基于不同应用场景的医学影像检查项目名称标准化方法, 其 特征在于, 所述基于词典的分词算法为按照预定的策略将预先建立的分词词典中所有词语 与各条源数据中的字段逐一进行匹配, 识别出字段中包含的属于分词词典的词语, 并将识 别到的词语作为有用信息返回; 所述基于统计的机器学习算法为利用机器学习模型通过序列标注的方式对各条源数 据中的字段进行分词, 并将识别到的词语作为清洗后的有用信息返回。 6.根据权利要求1所述的基于不同应用场景的医学影像检查项目名称标准化方法, 其 特征在于, 所述标准检查项目名称由标准检查部位名称及标准检查方法名称组成, 且所述 标准检查项目名称为区域卫生医疗机构明确 规定或结合影像设备特点及专家知识预先制 定的标准的项目名称。 7.根据权利要求2所述的基于不同应用场景的医学影像检查项目名称标准化方法, 其 特征在于, 采集各条历史检查数据中的检查部位及检查方法相关字段, 并利用所述第二医权 利 要 求 书 1/5 页 2 CN 114780738 A 2学影像检查项目名称标准化方法将采集的字段映射为对应的标准检查项目名称包括以下 步骤: S21’、 结合基于词典的分词算法及基于统计的机器学习算法对各条源数据中的字段进 行分词处 理, 并对字段中的无用信息进行清洗; S22’、 医学影像专家利用专家知识对清洗后预设数量的源数据进行标准检查项目名称 的对应标注; S23’、 将预设数量的源数据及其对应的标注结果作为构建模型的样本数据集, 并将该 样本数据集划分为训练集和验证集; S24’、 基于所述样本数据集构建文本分类机器学习模型, 并进行初始化处 理; S25’、 利用所述训练集结合预先设定的分批处理数量、 损失函数阈值及最大迭代次数 对文本分类机器学习模型进行训练; S26’、 将所述验证集中的源数据输入训练后的文本分类机器学习模型, 得到与验证集 中各条源数据相对应的检查项目名称; S27’、 结合得到的与验证集中各条源数据相对应的检查项目名称与验证集中各条源数 据对应的标注结果计算评价指标; S28’、 判断评价指标值是否达到预设阈值, 若是, 则判断训练后的文本分类机器学习模 型通过验证, 并执行S29 ’, 若否, 则判断训练后的文本分类机器学习模型未通过验证, 并调 整模型对应的超参数、 层结构或计算节点、 训练集后重复执行S25 ’ ‑S28’, 直至评价指标值 达到预设阈值 为止; S29’、 利用训练后的文本分类机器学习模型对清洗后剩余的各条源数据进行映射, 得 到对应的标准检查项目名称。 8.根据权利要求7所述的基于不同应用场景的医学影像检查项目名称标准化方法, 其 特征在于, 所述文本分类机器学习模型包括基于词嵌入向量化的word2vec或FastText、 基 于卷积神经网络特征提取的Text ‑CNN或Char ‑CNN、 基于上下文机制的Text ‑RNN或BiRNN或 RCNN、 基于记忆存储机制的EntNet或DMN、 基于注意力机制的HAN、 基于集 成学习的普通DT或 优化DT。 9.根据权利要求7所述的基于不同应用场景的医学影像检查项目名称标准化方法, 其 特征在于, 所述评价指标包括micro ‑F1、 marco ‑F1; 所述超参数包括分批处理数量、 损失函数阈值、 最大迭代次数、 输入词向量表征、 卷积 核大小、 feature  map特征图个数、 激活函数、 正则化项; 所述层结构或计算节点包括构建并初始化的文本分类深度神经网络模型对应的输入 层、 隐藏层、 输出层或池化层的结构或计算节点; 所述训练集的调整指在训练集中增加医学专用同义词映射关系表后再对文本分类机 器学习模型进行训练。 10.根据权利要求2所述的基于不同应用场景的医学影像检查项目名称标准化方法, 其 特征在于, 采集各条历史检查数据中的检查部位及检查方法相关字段, 并利用所述第三医 学影像检查项目名称标准化方法将采集的字段映射为对应的标准检查项目名称包括以下 步骤: S21”、 结合基于词典的分词算法及基于统计的机器学习算法对各条源数据中的字段进权 利 要 求 书 2/5 页 3 CN 114780738 A 3

.PDF文档 专利 基于不同应用场景的医学影像检查项目名称标准化方法及系统

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于不同应用场景的医学影像检查项目名称标准化方法及系统 第 1 页 专利 基于不同应用场景的医学影像检查项目名称标准化方法及系统 第 2 页 专利 基于不同应用场景的医学影像检查项目名称标准化方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:56:34上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。