全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211290674.0 (22)申请日 2022.10.21 (71)申请人 中国医学 科学院北京协和医院 地址 100730 北京市东城区王府井帅府园1 号 (72)发明人 吴南 赵恒强 杜华康 赵森  (74)专利代理 机构 北京预立 生科知识产权代理 有限公司 1 1736 专利代理师 李红伟 (51)Int.Cl. G16B 20/50(2019.01) G06N 20/00(2019.01) G06K 9/62(2022.01) (54)发明名称 基于SIGMA+预测突变致病性分析方法、 系统 及设备 (57)摘要 本发明涉及基于SIGMA+预测突变致病性分 析方法、 系统及设备。 包括: 获取待预测基因的突 变; 将待预测基因的突变映射到待预测基因的蛋 白结构上, 得到映射了突变的蛋白结构; 将映射 了突变的蛋白结构输入SIGMA模型, 得到待预测 基因的结构特征得分; 再将待预测基因的突变输 入预测器, 得到待预测基因的变异效应得分; 将 待预测基因的结构特征得分和变异效应得分输 入分类器, 得到突变为致病突变或良性突变的分 类结果。 本发 明方法旨在基于待预测基因的突变 和映射了突变的蛋白结构信息将SI GMA与其他预 测器相结合, 发掘其对突变致病性的高预测能力 和潜在应用价 值。 权利要求书2页 说明书10页 附图5页 CN 115458054 A 2022.12.09 CN 115458054 A 1.一种基于SIGMA+预测突变的致病性分析 方法, 包括: 获取待预测基因的突变, 所述待预测基因包括野生型基因; 将所述待预测基因输入到蛋白结构生成模型, 得到待预测基因的蛋白结构; 将所述待 预测基因的突变映射到所述待预测基因的蛋白结构上, 得到映射了突变的蛋白结构; 将所述映射了突变的蛋白结构输入SIGMA模型, 得到待预测基因的结构特 征得分; 将所述待预测基因的突变输入预测器, 得到待预测基因的变异效应得分; 将所述待预测基因 的结构特征得分和变异效应得分输入分类器, 得到突变为致病突变 或良性突变的分类结果。 2.根据权利 要求1所述的基于SIGMA+预测突变的致病性分析方法, 其特征在于, 所述预 测器将所述待预测基因的突变进行变异效应预测, 得到待预测基因的变异效应得分; 所述 预测器包括下列软件中的任一一种或几种: Enformer、 PROVEAN、 EVE、 DEOGEN2、 MUTPRED、 MutationAssessor、 SIFT、 ClinPred、 PolyPhen2、 REVEL; 优选的, 所述预测器为PROVEAN、 EVE、 DEOGEN2和MU TPRED。 3.根据权利 要求1所述的基于SIGMA+预测突变的致病性分析方法, 其特征在于, 所述待 预测基因的变异效应得分包括下列得分中的一种或几种: 序列保守性得分、 等位基因突变 频率得分、 错 义突变得分、 移码突变得分、 无义 突变得分、 插 入缺失突变得分; 优选的, 所述待预测基因的变异效应得分包括序列保守性得分、 等位基因突变频率得 分和错义突变得分。 4.根据权利要求1所述的基于SIGMA+预测突变的致病性分析方法, 其特征在于, 所述 SIGMA模型基于机器学习算法实现, 包括特征选择、 特征融合、 特征计算和模 型优化; 所述机 器学习算法包括下列算法中的任一一种 或几种: GBDT、 GBM、 SVM、 RF、 Adaboost、 Apriori算 法; 所述模型优化包括下列方法中的任一 一种或几种: 最速下降法、 Newto n方法、 拟牛 顿法。 5.根据权利要求4所述的基于SIGMA+预测突变的致病性分析方法, 所述特征选择将所 述映射了突变的蛋白结构进行特征提取, 得到突变蛋白结构特征; 所述突变蛋白结构特征 包括热力学特征、 蛋白质体积特征、 二级 结构相关特征、 突变残基的相对溶剂可及性特征和 能确定突变是否对蛋白质结构有显著影响的经验规则特 征。 6.根据权利 要求1所述的基于SIGMA+预测突变的致病性分析方法, 其特征在于, 所述蛋 白结构生成模型包括下列生成模型中的一种或几种: AlphaFold、 Alph aFold2、 ProteoGAN; 优选的, 所述蛋白结构生成模型 是AlphaFo ld2。 7.根据权利 要求1所述的基于SIGMA+预测突变的致病性分析方法, 其特征在于, 所述分 类器采用下列算法中的一种或几种: Boosting、 XGBoost和AdaBoost; 优选的, 所述分类器采 用Boosting。 8.一种基于SIGMA+预测突变的致病性分析设备, 其特征在于, 所述设备包括: 存储器和 处理器; 所述存储器用于存储程序指 令; 所述处理器用于调用程序指 令, 当程序指令被执行 时, 用于执 行实现权利要求1 ‑7任意一项所述基于SIGMA+预测突变的致病性分析 方法。 9.一种基于SIGMA+预测突变的致病性分析系统, 其特征在于, 所述系统包括: 获取模 块, 用于获取待预测基因的突变; 结构生成模块, 用于将所述待预测基因的突变映射到待预测基因的蛋白结构上, 得到 映射了突变的蛋白结构;权 利 要 求 书 1/2 页 2 CN 115458054 A 2结构特征生成模块, 用于将所述映射了突变的蛋白结构输入SIGMA模型, 得到待预测基 因的结构特 征得分; 变异效应特征生成模块, 用于将所述待预测基因的突变输入变异效应预测器, 得到待 预测基因的变异效应得分; 分类模块, 将所述待预测基因的结构特征得分和变异效应得分输入分类器, 得到突变 为致病突变或良性 突变的分类结果。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序 被处理器执行时, 实现权利要求1 ‑7任意一项所述基于SIGMA+预测突变的致病性分析 方法。权 利 要 求 书 2/2 页 3 CN 115458054 A 3

.PDF文档 专利 基于SIGMA+预测突变致病性分析方法、系统及设备

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于SIGMA+预测突变致病性分析方法、系统及设备 第 1 页 专利 基于SIGMA+预测突变致病性分析方法、系统及设备 第 2 页 专利 基于SIGMA+预测突变致病性分析方法、系统及设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 07:43:03上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。