全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211282263.7 (22)申请日 2022.10.19 (71)申请人 清华大学 地址 100084 北京市海淀区双清路3 0号 (72)发明人 吴及 刘喜恩 苏新鹏  (74)专利代理 机构 北京集佳知识产权代理有限 公司 11227 专利代理师 张珊珊 (51)Int.Cl. G06Q 40/08(2012.01) G16H 10/60(2018.01) G16H 40/20(2018.01) G16H 70/20(2018.01) G16H 70/40(2018.01) G06N 5/02(2006.01)G06N 5/04(2006.01) G06K 9/62(2022.01) (54)发明名称 医疗档案数据中异常数据的检测方法、 装置 和电子设备 (57)摘要 本发明提供了一种医疗档案数据中异常数 据的检测方法、 装置及电子设备。 方法包括: 获取 多位患者各自的医疗档案数据; 医疗档案数据均 包括: 患者标识、 结算数据和就诊数据; 采用基于 数据驱动的判断方式对多组结算数据进行异常 核验处理, 得到多组结算数据对应的核验结果数 据, 以及确定核验结果数据中核验异常数据对应 的第一患者标识数据; 将多组就诊数据分别与预 设医疗知识库中的库数据进行比较处理, 得到多 组就诊数据对应的比较结果数据, 以及确定比较 结果数据中 比对异常数据对应的第二患者标识 数据; 当第一患者标识数据与第二患者标识数据 具有相同的患者标识时, 则确定医疗档案数据中 存在异常数据。 能够提高异常数据的检测效率和 准确性。 权利要求书2页 说明书11页 附图2页 CN 115545955 A 2022.12.30 CN 115545955 A 1.一种医疗档案数据中异常数据的检测方法, 其特 征在于, 包括: 获取多位患 者各自的医疗档 案数据; 所述多位患 者中的每位患 者的医疗档案数据均包 括: 患者标识、 结算数据和就诊数据; 采用基于数据驱动的判断方式对多组所述结算数据进行异常核验处理, 得到多组所述 结算数据对应的核验结果数据, 以及确定所述核验结果数据中核验异常数据对应的第一患 者标识数据; 将多组所述就诊数据分别与 预设医疗知识库中的库数据进行比较处理, 得到多组所述 就诊数据对应的比较结果数据, 以及确定所述比较结果数据中比对异常数据对应的第二患 者标识数据; 当所述第一患 者标识数据与 所述第二患者标识数据 具有相同的患 者标识时, 则确定所 述医疗档案数据中存在异常数据。 2.根据权利要求1所述的方法, 其特征在于, 所述采用基于数据驱动的判断方式对多组 所述结算数据进行异常核验处 理, 包括: 基于预先训练的随机森林模型对每组所述结算数据进行分类处理, 得到该组所述结算 数据对应的标签; 其中, 所述标签用于表征 结算数据是否为真实数据。 3.根据权利要求1或2所述的方法, 其特征在于, 所述采用基于数据驱动的判断方式对 多组所述结算数据进行异常核验处 理, 包括: 采用主成分 分析法对多组所述结算数据进行 数据降维处 理得到多组降维数据; 采用基于密度的聚类算法对多组所述降维数据进行聚类处理得到离群数据和聚类数 据。 4.根据权利要求3所述的方法, 其特征在于, 在所述采用基于密度的聚类算法对多组所 述降维数据进行聚类处 理的步骤之后, 还 包括: 分别抽取所述离群数据中部分离群数据和所述聚类数据中部分聚类数据, 并利用抽取 到的所述部分离群数据和所述部分聚类数据形成迭代数据; 采用基于密度的聚类算法对所述迭代数据进行聚类处理得到迭代离群数据和迭代聚 类数据。 5.根据权利要求3所述的方法, 其特征在于, 所述采用基于数据驱动的判断方式对多组 所述结算数据进行异常核验处 理, 包括: 统计多组所述结算数据中各组所述结算数据的总体资源信息数据; 计算各组所述结算数据中每个维度的维度数据与总体资源信息数据之间的相关性系 数; 确定大于预设系数值的相关性系数 所对应的目标维度数据; 采用最小二乘法对多组所述目标维度数据进行拟合处 理得到拟合曲线; 确定拟合曲线的置信区间以及通过所述置信区间对所述多组所述结算数据进行分类 处理。 6.根据权利要求1所述的方法, 其特征在于, 在所述获取多位患 者各自对应的医疗档 案 数据的步骤之后, 还 包括: 对多组所述医疗档案数据进行筛选处理并对筛选处理后的筛选数据进行缺省维度的权 利 要 求 书 1/2 页 2 CN 115545955 A 2补齐处理。 7.根据权利要求1所述的方法, 其特征在于, 在所述确定所述医疗档案数据中存在异常 数据的步骤之后, 还 包括: 将所述第一患者标识数据与所述第二患者标识数据中相同的患者标识对应的医疗档 案数据确定为异常数据。 8.一种医疗档案数据中异常数据的检测装置, 其特 征在于, 包括: 采集单元, 用于获取多位患者各自对应的医疗档案数据; 每位患者的医疗档案数据均 包括: 结算数据和就诊数据; 核验单元, 用于采用基于数据驱动的判断方式对多组所述结算数据进行异常核验处理 并得到多组所述结算数据对应的核验结果数据, 以及确定所述核验结果数据中核验异常数 据对应的第一患者名单 数据; 比较单元, 用于将多组所述就诊数据分别与预设医疗知识库中的库 数据进行比较处理 得到多组所述就诊数据对应的比较结果数据, 以及确定所述比较结果数据中比对异常数据 对应的第二患者名单 数据; 检测单元, 用于确定所述第一患者名单数据与所述第二患者名单数据出现数据重合, 则确定所述医疗档案数据中存在异常数据。 9.一种电子设备, 其特征在于, 包括处理器以及存储器, 所述存储器存储有计算机可读 取指令, 当所述计算机可读取指 令由所述处理器执行时, 运行如权利要求 1‑7任一项所述的 方法。 10.一种计算机可读存储介质, 所述计算机可读存储介质上存储有计算机程序, 其特征 在于, 所述计算机程序被处 理器运行时执 行上述权利要求1 ‑7任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 115545955 A 3

.PDF文档 专利 医疗档案数据中异常数据的检测方法、装置和电子设备

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 医疗档案数据中异常数据的检测方法、装置和电子设备 第 1 页 专利 医疗档案数据中异常数据的检测方法、装置和电子设备 第 2 页 专利 医疗档案数据中异常数据的检测方法、装置和电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 07:42:58上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。