全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111313579.3 (22)申请日 2021.11.08 (71)申请人 成都四方伟业软件股份有限公司 地址 610041 四川省成 都市高新区科园三 路4号1栋2层 (72)发明人 雷丽 赵红军  (51)Int.Cl. G16H 50/20(2018.01) G16H 50/30(2018.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06N 20/00(2019.01) (54)发明名称 一种脂肪肝患病风险预测方法及装置 (57)摘要 本发明公开了一种脂肪肝患病风险预测方 法, 主要解决现有技术中存在的健康纵向体检数 据利用效率较低, 且尚无针对脂肪肝患病风险预 测的精确方法的问题。 该方法包括以下步骤: 采 集纵向体检数据, 建立纵向队列, 进行数据清洗, 提升数据质量; 采用随机森 林算法筛选出脂肪肝 影响因素; 选择出适合用于时间动态过程预测的 LSTM机器学习算法; 将循环神经网络LS TM算法与 时依Cox生存函数结合建立LSTM ‑Joint联合模 型。 本发明针对纵向队列数据中纵向过程和生存 结果之间关联强弱进行建模, 改进了估计效率, 从而得到更好的预测结果。 权利要求书1页 说明书5页 附图1页 CN 114188016 A 2022.03.15 CN 114188016 A 1.一种脂肪肝患病风险预测方法, 其特 征在于, 包括以下步骤: S1、 采集纵向体 检数据, 建立纵向队列, 然后对纵向队列的数据进行清洗; S2、 从步骤S1中清洗后的纵向队列中筛 选出脂肪肝影响因素; S3、 根据步骤S2的脂肪肝影响因素建立 LSTM机器学习算法; S4、 将步骤S3的LSTM机器学习算法与生存函数结合建立LSTM ‑Joint联合模型对脂肪肝 患病风险进行 预测。 2.根据权利要求1所述的一种脂肪肝患病风险预测方法, 其特征在于, 步骤S1中纵向 队 列的数据中每 个变量包含不同时间的检测数据。 3.根据权利要求1所述的一种脂肪肝患病风险预测方法, 其特征在于, 步骤S1中数据清 洗的具体过程为: 对异常值的处理方法为错误值采用记空值法; 离群值采用前后平均数替 换法或四分位数盖帽法; 对缺失值的处理方法为稳定指标采用末次推进法; 非稳定指标采 用XGBoost算法填补法。 4.根据权利要求1所述的一种脂肪肝患病风险预测方法, 其特征在于, 步骤S2中脂肪肝 影响因素筛 选的方法为随机森林法。 5.根据权利要求1所述的一种脂肪肝患病风 险预测方法, 其特征在于, 步骤S4中LSTM ‑ Joint联合模型通过模拟实验方法增 加模型的稳定性和拟合效果。 6.根据权利 要求1所述的一种脂肪肝患病风险预测方法, 其特征在于, 步骤S3中将LSTM 机器学习算法用于预测纵向队列的纵向过程, 通过纵向队列建立纵向亚模型。 7.根据权利要求1所述的一种脂肪肝患病风险预测方法, 其特征在于, 步骤S4中生存函 数为通过时依Cox生存 模型建立的生存亚模型。 8.一种脂肪肝患病风险预测装置, 其特 征在于, 包括 存储器: 用于存 储可执行指令; 处理器: 用于执行所述存储器 中存储的可执行指令, 实现如权利要求1 ‑7任一项所述的 一种脂肪肝患病风险预测方法。权 利 要 求 书 1/1 页 2 CN 114188016 A 2一种脂肪肝患病风险预测方 法及装置 技术领域 [0001]本发明涉及一种脂肪肝患病风险预测方法, 具体来说, 是在纵向体检数据的基础 上对脂 肪肝患病风险进行 预测的方法。 背景技术 [0002]纵向体检数据资料是对同一批体检者的多个指标, 在不 同时间, 如年度 内的多次 体检结 果。 多年来健康体检积累了大量的健康队列测量数据, 由于数据不满足独立性假 定, 所以不  能使用常规统计分析 方法进行建模分析。 [0003]近年来随着人们消费结构和生活习惯发生转变, 糖尿病、 超重肥胖等患病率上升, 我国 脂肪肝患病率逐年升高, 达到27%。 目前我国脂肪肝患者近2.5亿 人, 由于人口老龄化 的推 进及肥胖人群的增加, 预计到2030年间国内脂肪肝患病率将持续升高至50%。 脂肪肝 具有潜 伏期长的特点, 经资料调查 发现脂肪肝患病初期临床表现并无明显症状, 但重者可 能会演变 成严重肝病, 如肝硬化、 肝癌等, 临床和经济负担将 变得巨大。 脂肪肝属于可逆转 疾病, 而 目前尚无一种针对脂肪肝的较精确的预测方法, 所以基于纵向数据进 行脂肪肝预 测具有巨大  的医疗价 值和潜在经济价 值。 发明内容 [0004]本发明的目的在于提供一种脂肪肝患病风险预测方法及装置, 以解决现有技术中 存在的 健康纵向体检数据利用效率较低, 且尚无针对脂肪肝患病风险预测的精确方法的 问题。 [0005]为了解决上述问题, 本发明提供如下技 术方案: [0006]一种脂肪肝患病风险预测方法包括以下步骤: [0007]S1、 采集纵向体检数据, 建立纵向队列, 然后对纵向队列的数据进行清洗; 通过对 数据 的清洗提高数据质量; [0008]S2、 从步骤S1中清洗后的纵向队列中筛选出脂肪肝影响因素; 可采用随机森林算 法或 Lasso‑Logistic回归 模型筛选脂肪肝影响因素; [0009]S3、 根据步骤S2的脂肪肝影响因素建立 LSTM机器学习算法; [0010]S4、 将步骤S3的LSTM机器学习算法与生存函数结合建立LSTM ‑Joint联合模型对脂 肪 肝患病风险进行 预测。 [0011]进一步的, 步骤S1中纵向队列的数据 中每个变量包含不同时间的检测数据; 即包 含患者 连续多次的体 检数据。 [0012]进一步的, 步骤S1中数据清洗 的具体过程为: 对异常值的处理方法为错误值采用 记空值 法; 离群值采用前后平均数替换法或四分位数盖帽法; 对缺失值的处理方法为稳定 指标采用  末次推进法; 非稳定指标采用XGBoost算法填补法; 数据清洗一般多为异常值和 缺失值的处  理, 最终目的是 让样本尽可能代 表总体, 减小样本偏差 。 [0013]进一步的, 步骤S2中脂肪肝影响因素筛选的方法为随机森林法; 也可选用其他筛说 明 书 1/5 页 3 CN 114188016 A 3

.PDF文档 专利 一种脂肪肝患病风险预测方法及装置

文档预览
中文文档 8 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种脂肪肝患病风险预测方法及装置 第 1 页 专利 一种脂肪肝患病风险预测方法及装置 第 2 页 专利 一种脂肪肝患病风险预测方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 19:00:55上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。