(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210980851.1
(22)申请日 2022.08.16
(65)同一申请的已公布的文献号
申请公布号 CN 115080751 A
(43)申请公布日 2022.09.20
(73)专利权人 之江实验室
地址 311121 浙江省杭州市余杭区之江实
验室南湖总部
(72)发明人 李劲松 俞紫怡 杨宗峰 田雨
周天舒
(74)专利代理 机构 北京志霖恒远知识产权代理
有限公司 1 1435
专利代理师 戴莉
(51)Int.Cl.
G06F 16/35(2019.01)
G06F 16/34(2019.01)
G06F 16/338(2019.01)
G06F 16/33(2019.01)G06F 40/30(2020.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
G16H 10/60(2018.01)
(56)对比文件
CN 105574103 A,2016.0 5.11
CN 114330309 A,202 2.04.12
CN 114692620 A,202 2.07.01
CN 109446340 A,2019.0 3.08
CN 113657109 A,2021.1 1.16
CN 113436698 A,2021.09.24
CN 105069124 A,2015.1 1.18
WO 202023 3256 A1,2020.1 1.26
US 2021375404 A1,2021.12.02
李扬等.医学术语数据库 与标准化术语名称
建立思路. 《江苏卫 生事业管理》 .2016,(第04
期),99-100,134页.
审查员 崔倩倩
(54)发明名称
一种基于通用模型的医学标准术语管理系
统及方法
(57)摘要
本发明公开了一种基于通用模型的医学标
准术语管理系统及方法, 包括术语信息处理模
块, 术语关系网络构建模块, 术语库自扩增模块,
可视化管理模块; 步骤S1: 通过术语信息处理模
块对开源 标准术语数据进行梳理整合, 并通过构
建的序列标注模型拆分得到所述细分属性名 称
对应的细分属性内容; 步骤S2: 建立标准化映射
关系, 完成术语关系网络的搭建; 步骤S3: 进行自
增推荐, 完成术语关系网络的扩展; 步骤S4: 利用
可视化管 理模块对所述术语库进行可视化管理。
本发明所构建的医学标准术语库可满足不同的
科研及业务使用场景, 兼容 或可溯源至不同平台
及权威机构的医学标准术语, 所设计的结构体可
支持术语的各种组合扩 展。
权利要求书3页 说明书12页 附图1页
CN 115080751 B
2022.11.11
CN 115080751 B
1.一种基于通用模型的医学 标准术语管理系统, 其特 征在于, 包括:
术语信息处理模块, 用于对开源标准术语数据进行梳理整合, 对所述开源标准术语数
据的定义及术语含义进行术语分类, 得到术语类别以及术语类别对应的细分属 性名称, 并
通过构建的序列标注模型对病历文本进行拆分得到病历文本细分属 性名称对应的细分属
性内容, 每种所述 术语类别都包 含一种主 要细分属性名称和多种次要细分属性名称;
术语关系网络构建模块, 用于在所述细分属性内容中寻找语义相似度最大的语义标准
词建立标准化映射关系, 并对所述标准化映射关系进行校正及补充, 完成术语关系网络的
搭建;
所述术语关系网络构建模块的具体过程包括以下步骤:
通过所述序列标注模型对病历文本进行拆分得到病历文本细分属性, 利用术语关系网
络构建模块在所述标准词中寻找任意语义标准词, 通过算法得到病历文本细分属性和所述
任意语义标准词的语义相似度, 选取语义相似度最高的标准词, 建立标准 化映射关系;
通过算法拆分得到的次要细 分属性, 若在当前病历文本中存在可定义描述类型的父节
点, 且所拆 分得到的主要细分属性未包含类型信息, 则对主要细分属性进 行信息补充, 校正
为信息对应的细颗粒度子节点, 完成标准 化映射关系的校正;
若单个术语类别包含多个类型的次要细分属性, 导致修正后的主要细分属性存在多
个, 则选择存在最多的主 要细分属性在病历文本中的父节点作为 最后的主 要细分属性;
当算法拆分得到的结果为各维度信息存在缺失, 数据来源本身存在层级结构, 则通过
所述术语类别的父节点拆分结果进行信息补全, 完成术语关系网络的搭建;
术语库自扩增模块, 用于对不同的所述术语类别进行自增推荐, 完成术语关系 网络的
扩展, 得到 完整的术语库;
所述术语库自扩增模块具体为通过语义相似度判断标准化映射的有 效性, 若标准化映
射有效, 则直接作为映射结果; 若 标准化映射无效, 则重新计算从所述病历文本细分属性到
所述标准词中其他可能的细分属性类别和语义标准词的标准化映射, 作为算法推荐的、 需
要人工审核的映射结果, 对不同的术语类别进行自增推荐, 完成术语关系网络的扩展, 得到
完整的术语库;
可视化管理模块, 用于对所述 术语库进行 可视化管理。
2.如权利要求1所述的一种基于通用模型的医学标准术语管理系统, 其特征在于, 所述
可视化管理模块包括:
医学标准术语查询单元, 用于提供用户预览数据, 进行标准术语的可视化查询, 基于不
同维度的筛选条件, 筛选出对应的术语, 同时提供用户登陆界面入口和术语管 理界面入口,
展示包含以下维度的标准术语信息, 包括: 标准术语的顶级类别、 同义词、 父节 点术语、 子节
点术语和/或属性信息, 同时提供进入相关术语详情界面的入口;
术语编辑单元, 用于提供用户通过可视化界面进行术语实体编辑, 包括: 标准术语的新
增、 删除和/或修改, 标准 术语同义词的新增 和/或删除, 标准 术语的属性信息修改;
术语审核单元, 用于提供术语审核人员进行第二方审核, 提供审核人员进行术语审核
结果判定;
术语映射单元, 用于提供用户对不同来源的医学数据进行标准化映射, 对于无法映射
的数据, 构建推荐队列, 保证术语管理人员进行术语的一键映射和推荐队列的形成。权 利 要 求 书 1/3 页
2
CN 115080751 B
23.一种基于通用模型的医学 标准术语管理方法, 其特 征在于, 包括以下步骤:
步骤S1: 通过术语信息处理模块对开源标准术语数据进行梳理整合, 对所述开源标准
术语数据的定义及术语含义进 行术语分类, 得到术语类别以及术语类别对应的细分属性名
称, 并通过构建的序列标注模型拆分得到所述细分属 性名称对应的细分属 性内容, 所述细
分属性内容即为标准词, 每种所述术语类别都包含一种主要细分属性名称和多种次要细分
属性名称;
步骤S2: 通过所述序列标注模型对病历文本进行拆分得到病历文本细分属性, 利用术
语关系网络构建模块在所述标准词中寻找语义相似度最大的语义标准词建立标准化映射
关系, 并对所述标准 化映射关系进行 校正及补充, 完成术语关系网络的搭建;
步骤S21: 通过所述序列标注模型对病历文本进行拆分得到病历文本细分属性, 利用术
语关系网络构建模块在所述标准词中寻找任意语义标准词, 通过算法得到病历文本细分属
性和所述任意语义标准词的语义相似度, 选取语义相似度最高的标准词, 建立标准化映射
关系;
步骤S22: 通过算法拆分得到的次要细分属性, 若在当前病历文本 中存在可定义描述类
型的父节点, 且所拆分得到的主要细分属 性未包含类型信息, 则对主要细分属 性进行信息
补充, 校正 为信息对应的细颗粒度子节点, 完成标准 化映射关系的校正;
步骤S23: 若单个术语类别包含多个类型的次要细分属性, 导致修正后的主要细分属性
存在多个, 则选择存在最多的主要细分属性在病历文本中的父节点作为最后的主要细分属
性;
步骤S24: 当算法拆分得到的结果为各维度信息存在缺失, 数据来源本身存在层级结
构, 则通过 所述术语类别的父节点拆分结果进行信息补全, 完成术语关系网络的搭建;
步骤S3: 通过术语库自扩增模块对不同的术语类别进行自增推荐, 完成术语关系网络
的扩展, 得到 完整的术语库;
所述步骤S3具体为通过语义相似度判断标准化映射的有效性, 若标准化映射有效, 则
直接作为映射结果; 若标准化映射无效, 则重新计算从所述病历文本细分属 性到所述标准
词中其他可能的细分属 性类别和语义标准词的标准化映射, 作为算法推荐的、 需要人工审
核的映射结果, 对不同的术语类别进 行自增推荐, 完成术语关系网络的扩展, 得到完整的术
语库;
步骤S4: 利用可视化管理模块对所述术语库进行可视化管理, 所述可视化管理包括医
学标准术语查询单 元、 术语编辑单 元、 术语审核单 元和术语映射单 元。
4.如权利要求3所述的一种基于通用模型的医学标准术语管理方法, 其特征在于, 所述
步骤S1具体包括以下子步骤:
步骤S11: 通过术语信息处理模块对开源标准术语数据进行梳理整合, 对所述开源标准
术语数据的定义及术语含义进 行术语分类, 保留原始 术语的层级关系、 关联关系和/或编码
信息, 并打上来源标签, 得到术语 类别以及术语 类别对应的细分属性名称;
步骤S12: 利用预训练语言模型构建序列 标注模型, 并通过所述序列标注模型将开源标
准术语数据拆分得到细分属性内容。
5.如权利要求4所述的一种基于通用模型的医学标准术语管理方法, 其特征在于, 所
专利 一种基于通用模型的医学标准术语管理系统及方法
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:14:10上传分享