(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211309849.8
(22)申请日 2022.10.25
(71)申请人 黑龙江金域医学检验实验室有限公
司
地址 150000 黑龙江省哈尔滨市高新 技术
产业开发区科技创新城创新创业广场
企业加速器10号楼巨宝 一路508号3单
元1-4层、 2单 元2层
(72)发明人 刘娟 孙明明 段学成 张鹏博
张俊涛 祖爽 张贵英 吴丽
马丽娜
(74)专利代理 机构 深圳市诺正鑫泽知识产权代
理有限公司 4 4689
专利代理师 罗秦(51)Int.Cl.
G16B 30/10(2019.01)
G16B 35/20(2019.01)
G16B 50/00(2019.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
潜在毒力因子的确定方法、 装置、 计算机设
备及存储介质
(57)摘要
本发明实施例公开了一种潜在毒力因子的
确定方法、 装置、 计算机设备及存储介质, 其中方
法包括: 将待筛查基因序列输入第一特征提取单
元提取特征, 得到第一特征; 第二特征是将目标
毒力因子对应的毒力因子拼接数据输入第二特
征提取单元提取得到的特征, 目标毒力因子是毒
力因子库中的任一个毒力因子, 毒力因子拼接数
据是对毒力因子对应的基因序列及保守片段进
行拼接得到的数据; 根据第一特征和第二特征判
断目标毒力因子是否为候选毒力因子; 根据预设
的比对方法和各个候选毒力因子各自对应的基
因序列, 确定待筛查基因序列对应的各个潜在毒
力因子。 从而加快了确定潜在 毒力因子的运算速
度, 基于候选毒力因子的比对有利于提高确定的
潜在毒力因子的准确性。
权利要求书3页 说明书13页 附图3页
CN 115547414 A
2022.12.30
CN 115547414 A
1.一种潜在毒力因子的确定方法, 所述方法包括:
将获取的待筛查基因序列输入预设的第一特 征提取单元提取特征, 得到第一特 征;
获取第二特征, 其中, 所述第二特征是将目标毒力因子对应的毒力因子拼接数据输入
预设的第二特征提取单元提取得到的特征, 所述目标毒力因子是毒力因子库中的任一个毒
力因子, 所述毒力因子拼接数据是对毒力因子对应的基因序列及保守片段进 行拼接得到的
数据;
根据所述第一特 征和所述第二特 征判断所述目标毒力因子是否为 候选毒力因子;
根据预设的比对方法和各个所述候选毒力因子各自对应的所述基因序列, 确定所述待
筛查基因序列对应的各个潜在毒力因子 。
2.根据权利要求1所述的潜在毒力因子的确定方法, 其特征在于, 所述第 一特征提取单
元依次包括: 第一深度神经网络层和第一深层特 征提取层;
所述第二特 征提取单元依次包括: 第二深度神经网络层和第二深层特 征提取层;
所述第一深度神经网络层和所述第二深度神经网络层均是基于深度神经网络得到的
网络层, 并且所述第一深度神经网络层的网络参数和所述第二深度神经网络层的网络参数
不共享;
所述第一深层特 征提取层包括: 卷积层;
所述第二深层特 征提取层依次包括: 卷积网络层和池化层。
3.根据权利要求1所述的潜在毒力因子的确定方法, 其特征在于, 所述根据所述第 一特
征和所述第二特 征判断所述目标毒力因子是否为 候选毒力因子的步骤, 包括:
采用预设的相关度提取单元, 对所述第 一特征和所述第 二特征进行单因子相关度 特征
图提取;
采用预设的分类预测层, 对所述单因子相关度特征图进行分类预测, 得到单因子分类
预测向量;
若所述单因子分类预测向量中的存在向量元素的值大于预设的第 一概率阈值, 则将所
述目标毒力因子作为所述 候选毒力因子 。
4.根据权利要求3所述的潜在毒力因子的确定方法, 其特征在于, 所述采用预设的相关
度提取单元, 对所述第一特 征和所述第二特 征进行单因子相关度特 征图提取的步骤, 包括:
对所述第 二特征进行平铺复制, 得到第三特征, 其中, 所述第三特征的尺寸与所述第一
特征的尺寸相同;
采用基于卷积网络训练得到的所述相关度提取单元, 对所述第 一特征和所述第 三特征
进行所述单因子相关度特 征图提取。
5.根据权利要求3所述的潜在毒力因子的确定方法, 其特征在于, 所述采用预设的分类
预测层, 对所述单因子相关度特征图进行分类预测, 得到单因子分类预测向量的步骤, 包
括:
将所述待筛查基因序列输入预设的分类预测模型进行毒力因子预测, 得到多因子分类
预测向量;
从所述多因子分类预测向量中提取与所述目标毒力因子对应的向量元素值, 作为待处
理概率值;
对所述待处 理概率值和所述单因子相关度特 征图进行融合处 理, 得到处 理后特征图;权 利 要 求 书 1/3 页
2
CN 115547414 A
2采用所述分类预测层, 对所述处理后特征图进行包含所述目标毒力因子的概率的分类
预测, 得到所述单因子分类预测向量。
6.根据权利要求3所述的潜在毒力因子的确定方法, 其特征在于, 所述将 获取的待筛查
基因序列输入预设的第一特 征提取单元提取特征, 得到第一特 征的步骤之前, 还 包括:
获取各个基因序列样本;
根据所述基因序列样本获取与每 个所述毒力因子拼接数据对应的单因子标签;
将任一个所述基因序列样本作为 正向序列样本;
对所述正向序列样本进行反转处 理, 得到反向序列样本;
将各个所述毒力因子拼接数据中的任一个所述毒力因子拼接数据作为目标拼接数据;
将所述正向序列样本、 所述目标拼接数据和与 所述目标拼接数据对应的所述单因子标
签, 作为第一训练样本;
将所述反 向序列样本、 所述目标拼接数据和与 所述目标拼接数据对应的所述单因子标
签, 作为第二训练样本;
将各个所述第一训练样本和各个所述第二训练样本作为训练样本集;
采用所述训练样本集对预设的初始模型进行训练, 将训练结束的所述初始模型作为目
标模型, 其中, 所述目标模 型包括: 所述第一特征提取单元、 所述第二特征提取单元、 所述相
关度提取 单元和所述分类预测层。
7.根据权利要求1所述的潜在毒力因子的确定方法, 其特征在于, 所述根据预设的比对
方法和各个所述候选毒力因子各自对应的所述基因序列, 确定所述待筛查基因序列对应的
各个潜在毒力因子的步骤, 包括:
将各个所述 候选毒力因子中的任一个所述 候选毒力因子作为待分析毒力因子;
从所述待分析毒力因子对应的基因序列中提取基因片段;
根据各个所述基因片段, 对所述待筛查基因序列进行比对, 得到所述待分析毒力因子
的序列覆盖率和保守片段覆盖率;
判断所述序列覆盖率是否大于预设的第一覆盖率阈值, 并且, 所述保守片段覆盖率是
否大于预设的第二覆盖率阈值;
若均为是, 则将所述待分析毒力因子作为所述待筛查基因序列对应的所述潜在毒力因
子。
8.一种潜在毒力因子的确定装置, 其特 征在于, 所述装置包括:
第一特征确定模块, 用于将 获取的待筛查基因序列输入预设的第 一特征提取单元提取
特征, 得到第一特 征;
第二特征确定模块, 用于获取第 二特征, 其中, 所述第 二特征是将目标毒力因子对应的
毒力因子拼接数据输入预设的第二特征提取单元提取得到的特征, 所述目标毒力因子是毒
力因子库中的任一个毒力因子, 所述毒力因子拼接数据是对毒力因子对应的基因序列及保
守片段进行拼接得到的数据;
候选毒力因子确定模块, 用于根据 所述第一特征和所述第 二特征判断所述目标毒力因
子是否为 候选毒力因子;
潜在毒力因子确定模块, 用于根据 预设的比对方法和各个所述候选毒力因子各自对应
的所述基因序列, 确定所述待筛查基因序列对应的各个潜在毒力因子 。权 利 要 求 书 2/3 页
3
CN 115547414 A
3
专利 潜在毒力因子的确定方法、装置、计算机设备及存储介质
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:24:14上传分享