全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 20221019018 8.5 (22)申请日 2022.02.28 (71)申请人 京东方科技 集团股份有限公司 地址 100015 北京市朝阳区酒仙桥路10号 (72)发明人 陈雪 柳锦女 李玉德 张希颖  张振中 周莉  (74)专利代理 机构 北京润泽恒知识产权代理有 限公司 1 1319 专利代理师 李娜 (51)Int.Cl. G16H 50/70(2018.01) G06K 9/62(2022.01) G06F 40/30(2020.01) G06F 40/295(2020.01) G06F 40/242(2020.01)G06F 16/36(2019.01) (54)发明名称 医疗数据处 理方法、 装置及存 储介质 (57)摘要 本公开提供了一种医疗 数据处理方法、 装置 及存储介质, 涉及数据处理技术领域。 该方法包 括: 获取病历数据, 并执行目标过程以获得疾病 分析向量, 目标过程包括: 生成病历数据的病历 语义向量; 对于预设疾病集合中的每个预设疾 病, 根据病例语义向量, 确定病历数据因预设疾 病产生的第一可能性权重, 以获得第一权重向 量; 根据病历数据中的各病历症状和各病历疾 病, 从预设知识图谱中确定可能产生病历数据的 候选疾病, 其中, 预设知识图谱中包括与预设疾 病相关的实体和关系, 候选疾病属于预设疾病集 合; 确定病历数据因候选疾病产生的第二可能性 权重, 以获得第二权重向量; 将第一权重向量与 第二权重向量融合, 得到病历数据对应的疾病分 析向量。 权利要求书4页 说明书19页 附图6页 CN 114550946 A 2022.05.27 CN 114550946 A 1.一种医疗数据处 理方法, 其特 征在于, 所述方法包括: 获取病历数据, 并执行目标过程以获得所述病历数据对应的疾病分析向量, 其中, 所述 目标过程包括: 生成所述病历数据的病历语义向量; 对于预设疾病集合中的每个预设疾病, 根据所述病例语义向量, 确定所述病历数据因 所述预设疾病产生的第一可能性权 重, 以获得第一权 重向量; 根据所述病历数据中的各个病历症状和各个病历疾病, 从预设知识图谱中确定可能产 生所述病历数据的候选疾病, 其中, 所述预设知识图谱中包括与所述预设疾病相关的实体 和关系, 所述 候选疾病属于所述预设疾病集 合; 确定所述病历数据因所述 候选疾病产生的第二可能性权 重, 以获得第二权 重向量; 将所述第一权重向量与所述第 二权重向量进行融合, 得到所述病历数据对应的疾病分 析向量。 2.根据权利要求1所述的方法, 其特征在于, 所述病历数据包括文本数据和数值数据, 所述生成所述病历数据的病历语义向量, 包括: 将所述文本数据编码为文本语义向量; 将所述数值数据转 化为向量, 得到数值向量; 将所述文本语义向量与所述数值向量进行拼接, 得到拼接向量; 通过多头自注意力机制, 对所述拼接向量进行编码, 得到所述病历数据的病历语义向 量。 3.根据权利要求1所述的方法, 其特征在于, 所述根据所述病历数据中的各个病历症状 和各个病历疾病, 从预设知识图谱中确定可能产生所述病历数据的候选疾病, 包括: 对于所述病历数据中的每个病历症状, 确定所述病历症状在预设知识图谱中对应的图 谱疾病子集, 形成图谱 疾病集合; 根据所述病历数据中的各个病历疾病形成的病历疾病集合, 以及所述图谱疾病集合, 确定可能产生所述病历数据的候选疾病集 合。 4.根据权利要求3所述的方法, 其特征在于, 所述根据所述病历数据中的各个病历疾病 形成的病历疾病集合, 以及所述图谱疾病集合, 确定可能产生所述病历数据的候选疾病集 合, 包括: 对于所述病历疾病集合中的每个所述病历疾病, 若所述病历疾病的负因子系数为预设 最小值, 则将所述病历疾病从所述病历疾病集合中删除, 删除所述病历疾病后的所述病历 疾病集合形成目标病历疾病集 合; 对于所述病历疾病集合中的每个所述病历疾病, 若所述病历疾病的负因子系数为所述 预设最小值, 且所述病历疾病存在于所述图谱疾病集合中, 则将所述病历疾病从所述图谱 疾病集合中删除, 删除所述病历疾病后的所述图谱 疾病集合形成初始候选疾病集 合; 对于所述目标病历疾病集合中包括的每个目标病历疾病, 若所述目标病历疾病不存在 于所述初始候选疾病集合中, 则将所述 目标病历疾病 添加至所述初始候选疾病集合中, 形 成可能产生所述病历数据的候选疾病集 合。 5.根据权利要求4所述的方法, 其特征在于, 所述确定所述病历数据因所述候选疾病产 生的第二可能性权 重, 以获得第二权 重向量, 包括:权 利 要 求 书 1/4 页 2 CN 114550946 A 2根据每个所述病历症状的负因子系数、 每个所述病历症状与 所述候选疾病的联合发生 概率、 所述候选疾病 所属的所述图谱疾病子集中的疾病 数量, 以及所述候选疾病集合中的 疾病数量, 确定所述病历数据因所述 候选疾病产生的初始第二可能性权 重; 若所述候选疾病 满足预设条件, 则将所述候选疾病 对应的初始第 二可能性权重确定为 所述候选疾病对应的第二可能性权重, 其中, 所述预设条件为所述候选疾病存在于所述初 始候选疾病集 合但不存在于所述病历疾病集 合; 若所述候选疾病不满足所述预设条件, 则对所述候选疾病 对应的初始第 二可能性权重 进行修正, 得到所述 候选疾病对应的第二可能性权 重。 6.根据权利要求5所述的方法, 其特征在于, 所述若所述候选疾病不满足所述预设条 件, 则对所述候选疾病对应的初始第二可能性权重进行修正, 得到所述候选疾病对应的第 二可能性权 重, 包括: 若所述候选疾病同时存在于所述病历疾病集合和所述初始候选疾病集合, 则根据每个 所述候选疾病的发生概率, 对所述候选疾病对应的初始第二可能性权重进行修正, 得到所 述候选疾病对应的第二可能性权 重; 若所述候选疾病 存在于所述病历疾病集合但不存在于所述初始候选疾病集合, 则根据 所述候选疾病的负因子系数、 预设超参数, 以及所述候选疾病集合中的疾病数量, 对所述候 选疾病对应的初始第二可能性权 重进行修 正, 得到所述 候选疾病对应的第二可能性权 重。 7.根据权利要求6所述的方法, 其特征在于, 所述根据所述病历数据中的各个病历症状 和各个病历疾病, 从预设知识图谱中确定可能产生所述病历数据的候选疾病之前, 还 包括: 根据所述病历数据中位于所述病历症状之前位置的第一相邻词语对所述病历症状的 否定程度, 确定所述病历症状的负因子系数, 其中, 所述病历症状的负因子系数与所述第一 相邻词汇对所述病历症状的否 定程度呈负相关; 根据所述病历数据中位于所述病历疾病之前位置的第二相邻词语对所述病历疾病的 否定程度, 确定所述病历疾病的负因子系数, 其中, 所述病历疾病的负因子系数与所述第二 相邻词汇对所述病历疾病的否 定程度呈负相关。 8.根据权利要求5所述的方法, 其特征在于, 所述若所述候选疾病不满足所述预设条 件, 则对所述候选疾病对应的初始第二可能性权重进行修正, 得到所述候选疾病对应的第 二可能性权 重之后, 还 包括: 对于不属于所述候选疾病集合的所述预设疾病, 将所述预设疾病 对应的第 二可能性权 重确定为0; 对每个所述预设疾病对应的所述第二可能性权重进行归一化处理, 得到第二权重向 量。 9.根据权利要求5所述的方法, 其特征在于, 所述确定所述病历数据因所述候选疾病产 生的第二可能性权 重, 以获得第二权 重向量之前, 还 包括: 从所述预设知识图谱中获取每 个所述病历症状与所述 候选疾病的联合发生 概率。 10.根据权利要求6所述的方法, 其特征在于, 所述若所述候选疾病不满足所述预设条 件, 则对所述候选疾病对应的初始第二可能性权重进行修正, 得到所述候选疾病对应的第 二可能性权 重之前, 还 包括: 从所述预设知识图谱中获取每 个所述候选疾病的发生 概率。权 利 要 求 书 2/4 页 3 CN 114550946 A 3

.PDF文档 专利 医疗数据处理方法、装置及存储介质

文档预览
中文文档 30 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共30页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 医疗数据处理方法、装置及存储介质 第 1 页 专利 医疗数据处理方法、装置及存储介质 第 2 页 专利 医疗数据处理方法、装置及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:56:19上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。