全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111664224.9 (22)申请日 2021.12.31 (71)申请人 天津开心生活科技有限公司 地址 301800 天津市宝坻区天津宝坻节能 环保工业区海关大厦2 20-41 (72)发明人 王伟  (74)专利代理 机构 北京律智知识产权代理有限 公司 11438 代理人 王辉 阚梓瑄 (51)Int.Cl. G16H 50/20(2018.01) G16H 50/70(2018.01) G06K 9/62(2022.01) (54)发明名称 辅助分析方法和装置、 计算机可读存储介 质、 电子设备 (57)摘要 本公开是关于一种辅助分析方法和装置、 计 算机可读存储介质、 电子设备, 涉及机器学习技 术领域, 该方法包括: 获取阳性样本以及阴性样 本, 对所述阴性样本数据进行补充, 得到样本集; 对所述样 本集中的用户数据进行预处理, 得到特 征数据, 对所述特征数据进行筛选, 得到目标特 征字段; 获取所述样本集中的训练集, 利用所述 训练集中与所述目标特征字段对应的目标特征 数据对预设分类器进行训练, 得到目标分类器; 通过所述目标分类器得到目标用户的分析结果。 本公开提高了对罕见病的分析效率。 权利要求书2页 说明书14页 附图5页 CN 114334138 A 2022.04.12 CN 114334138 A 1.一种辅助分析 方法, 其特 征在于, 包括: 获取阳性样本以及阴性样本, 对所述阴性样本数据进行补充, 得到样本集; 对所述样本集中的用户数据进行预处理, 得到特征数据, 对所述特征数据进行筛选, 得 到目标特征字段; 获取所述样本集中的训练集, 利用所述训练集中与所述目标特征字段对应的目标特征 数据对预设 分类器进行训练, 得到目标分类 器; 通过所述目标分类 器得到目标用户的分析 结果。 2.根据权利要求1所述的辅助分析方法, 其特征在于, 获取阳性样本以及阴性样本, 对 所述阴性样本数据进行补充, 得到样本集, 包括: 获取并将病历数据库中诊断结果 为确诊目标疾病的用户数据作为阳性样本; 获取并将所述病历数据库中诊断结果 为疑似目标疾病的用户数据作为阴性样本; 在确定所述阴性样本的数量少于预设样本数量 时, 获取诊断结果为确诊第 二疾病的用 户数据; 通过所述阳性样本、 所述阴性样本以及所述诊断结果为确诊第二疾病的用户数据, 得 到样本集。 3.根据权利要求2所述的辅助分析方法, 其特征在于, 获取并将所述病历数据库中诊断 结果为疑似目标疾病的用户数据作为阴性样本数据, 包括: 获取所述病历数据库中包括的诊断结果 为疑似目标疾病的第一用户; 获取所述第一用户的家系成员, 在确定所述第一用户的家系成员未确诊目标疾病时, 将所述第一用户的用户数据作为阴性样本数据。 4.根据权利要求1所述的辅助分析方法, 其特征在于, 对所述样本集中的用户数据进行 预处理, 得到特 征数据, 包括: 获取所述样本集中包括的用户数据; 在确定所述用户数据中包括结构化数据时, 通过预设关键词对所述结构化数据进行筛 选, 得到筛选结果; 在确定所述用户数据中包括非结构化数据时, 通过自然语言处理对所述非结构化数据 进行提取, 得到提取 结果; 获取所述用户数据中包括的诊断结果, 根据国际疾病分类对所述诊断结果进行统一, 得到目标疾病的统一名称; 获取预设的病历报告表, 基于所述病例报告表中包括的特征字段, 通过所述筛选结果、 所述提取结果以及所述目标疾病的统一名称得到特 征数据。 5.根据权利要求4所述的辅助分析方法, 其特征在于, 对所述特征数据进行筛选, 得到 目标特征字段, 包括: 获取所述病例报告表中与每一特 征字段对应的特 征数据; 通过卡方检验, 得到所述病历报告中与每一特征字段对应的特征数据和所述目标疾病 阳性变量的卡方值, 以及所述 卡方值的概 率值; 当所述卡方值的概率值大于预设概率值时, 过滤掉与所述卡方值对应的特征字段, 得 到目标特征字段。 6.根据权利要求1所述的辅助分析方法, 其特征在于, 获取所述样本集中的训练集, 包权 利 要 求 书 1/2 页 2 CN 114334138 A 2括: 通过K折交叉验证或者样本的年份对所述样本集进行划分, 得到训练集以及测试集。 7.根据权利要求6所述的辅助分析方法, 其特征在于, 利用所述训练集中与 所述目标特 征字段对应的目标 特征数据对预设 分类器进行训练, 得到目标分类 器, 包括: 获取所述训练集中与 所述目标特征字段对应的目标特征数据, 通过所述目标特征数据 对所述预设 分类器进行训练得到 辅助分类 器; 将所述测试集中包括的与所述目标特征字段对应的目标特征数据输入至所述辅助分 类器, 得到预测结果, 通过 所述测试 结果对所述辅助分类 器进行评价; 在确定所述辅助分类器的评价指标高于预设评价指标时, 将所述辅助分类器作为所述 目标分类 器。 8.一种辅助分析装置, 其特 征在于, 包括: 样本集确定模块, 用于获取阳性样本以及阴性样本, 对所述阴性样本数据进行补充, 得 到样本集; 目标特征字段确定模块, 用于对所述样本集中的用户数据进行预处理, 得到特征数据, 对所述特 征数据进行筛 选, 得到目标 特征字段; 分类器训练模块, 用于获取所述样本集中的训练集, 利用所述训练集中与所述目标特 征字段对应的目标 特征数据对预设 分类器进行训练, 得到目标分类 器; 分析结果生成模块, 用于通过 所述目标分类 器得到目标用户的分析 结果。 9.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序被 处理器执行时实现权利要求1 ‑7任一项所述的辅助分析 方法。 10.一种电子设备, 其特 征在于, 包括: 处理器; 以及 存储器, 用于存 储所述处 理器的可 执行指令; 其中, 所述处理器配置为经由执行所述可执行指令来执行权利要求1 ‑7任一项所述的 辅助分析 方法。权 利 要 求 书 2/2 页 3 CN 114334138 A 3

.PDF文档 专利 辅助分析方法和装置、计算机可读存储介质、电子设备

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 辅助分析方法和装置、计算机可读存储介质、电子设备 第 1 页 专利 辅助分析方法和装置、计算机可读存储介质、电子设备 第 2 页 专利 辅助分析方法和装置、计算机可读存储介质、电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 22:46:00上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。