全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210873363.0 (22)申请日 2022.07.22 (71)申请人 水木未来 (北京) 科技有限公司 地址 100089 北京市海淀区西郊北洼路1区 195幢3层102 (72)发明人 刘海宾 郭良越 李盼 刘丙华  郭春龙  (74)专利代理 机构 北京林达刘知识产权代理事 务所(普通 合伙) 11277 专利代理师 刘新宇 (51)Int.Cl. G06V 10/80(2022.01) G06V 10/764(2022.01) G06T 7/73(2017.01) G06T 7/11(2017.01)G16B 30/00(2019.01) (54)发明名称 蛋白质电子密度图处理方法、 装置、 电子设 备和存储介质 (57)摘要 本公开涉及一种蛋白质电子密度图处理方 法、 装置、 电子设备和存储介质。 所述方法包括: 获取待处理蛋白质电子密度图的多个三维图像 块; 确定氨基酸序列片段; 将三维图像块和氨基 酸序列片段输入编码层, 获得第一特征信息; 通 过解码层, 获得第二特征信息; 根据第二特征信 息, 获得原子分类结果和氨基酸分类结果。 根据 本公开的实施例的蛋白质电子密度图处理方法, 可和融合三维图像块和氨基酸序列片段的信息, 建立二者之间的关系, 从而提升模型精度。 并通 过参数相同的编码层和解码层 进行处理, 分别输 出原子分类结果和氨基酸分类结果, 使两个任务 共享参数, 加强两种结果之间的关联性, 提升两 种结果的准确性和鲁棒 性。 权利要求书3页 说明书17页 附图5页 CN 115240044 A 2022.10.25 CN 115240044 A 1.一种蛋白质电子密度图处 理方法, 其特 征在于, 包括: 获取待处 理蛋白质电子密度图的多个三维图像块; 在氨基酸序列中, 确定与所述三维图像块对应的氨基酸序列片段, 其中, 所述氨基酸序 列与所述待处 理蛋白质电子密度图对应; 将所述三维图像块和对应的所述氨基酸序列片段输入图像处理网络模型的编码层, 获 得第一特征信息, 其中, 所述第一特征信息为将所述三维 图像块的特征信息及对应的氨基 酸序列片段的特 征信息融合后的特 征信息; 通过所述图像处理网络模型的解码层, 获得与所述第一特征信息对应的第二特征信 息; 根据所述第 二特征信 息, 分别获得所述三维图像块中各体素的原子分类结果和氨基酸 分类结果, 所述原子分类结果包括所述体素所属的原子的类别识别结果, 所述氨基酸分类 结果包括所述体素 所属的氨基酸的类别识别结果。 2.根据权利要求1所述的方法, 其特征在于, 在氨基酸序列中, 确定与所述三维图像块 对应的氨基酸序列片段, 包括: 根据所述三维图像块, 对所述氨基酸序列进行遍历, 确定与所述三维图像块对应的氨 基酸序列片段。 3.根据权利要求1所述的方法, 其特征在于, 将所述三维图像块和对应的所述氨基酸序 列片段输入图像处 理网络模型的编码层, 获得第一特 征信息, 包括: 根据所述三维图像块和所述三维图像块的第 一位置向量, 获得与所述三维图像块对应 的第三特 征信息, 所述第一 位置向量用于表示所述 三维图像块中的体素的位置信息; 根据所述氨基酸序列片段和所述氨基酸序列片段的第 二位置向量, 获得与 所述氨基酸 序列片段对应的第四特征信息, 所述第二位置向量用于表示所述氨基酸序列片段中的氨基 酸在所述氨基酸序列片段中的位置信息; 根据所述第三特 征信息和所述第四特 征信息, 获得 所述第一特 征信息。 4.根据权利要求3所述的方法, 其特征在于, 根据 所述三维图像块和所述三维图像块的 第一位置向量, 获得与所述 三维图像块对应的第三特 征信息, 包括: 将所述三维图像块 转换为一维向量, 获得第一特 征向量; 将所述第一特 征向量与所述第一 位置向量进行融合, 获得第二特 征向量; 对所述第二特 征向量进行编码处 理, 获得所述第三特 征信息。 5.根据权利要求3所述的方法, 其特征在于, 根据 所述氨基酸序列片段和所述氨基酸序 列片段的第二 位置向量, 获得与所述氨基酸序列片段对应的第四特 征信息, 包括: 将所述氨基酸序列片段进行编码处 理, 获得第三特 征向量; 将所述第三特 征向量与所述第二 位置向量进行融合, 获得第四特 征向量; 对所述第四特 征向量进行编码处 理, 获得所述第四特 征信息。 6.根据权利要求3所述的方法, 其特征在于, 根据 所述第三特征信 息和所述第四特征信 息, 获得所述第一特 征信息, 包括: 根据所述第三特 征信息和所述第四特 征信息, 获取注意力 信息; 根据所述注意力信息, 将所述第三特征信息和所述第 四特征信息进行融合, 获得所述 第一特征信息。权 利 要 求 书 1/3 页 2 CN 115240044 A 27.根据权利要求1所述的方法, 其特征在于, 获取待处理蛋白质电子密度图的多个三维 图像块, 包括: 对所述待处理蛋白质电子密度图进行剪裁处理, 获得所述多个三维图像块, 其中, 相邻 的三维图像块之间至少包括部分重 叠区域。 8.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 根据所述三维图像块中各体素网格的原子分类结果, 对所述体素网格进行聚类处理, 获得聚类中心的位置坐标; 根据所述氨基酸分类结果, 对所述聚类中心的位置坐标进行筛选, 获得蛋白质骨架碳α 原子的位置坐标。 9.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 将样本蛋白质电子密度图的样本图像块, 以及与 所述样本图像块对应的样本氨基酸序 列片段, 输入所述图像处理网络模型, 获得样 本原子分类结果和样本氨基酸分类结果, 所述 样本氨基酸序列片段 具有噪声信息; 根据所述样本原子分类结果和所述样本 蛋白质电子密度图的标注信 息, 确定原子分类 损失; 根据所述样本氨基酸分类结果和所述样本 蛋白质电子密度图的标注信 息, 确定氨基酸 分类损失; 根据所述原子分类损 失和所述氨基酸分类损 失, 训练所述图像处理网络模型, 获得训 练后的图像处 理网络模型。 10.根据权利要求9所述的方法, 其特 征在于, 所述方法还 包括: 在与所述样本 蛋白质电子密度图对应的氨基酸序列中, 确定与 所述样本图像块对应的 第一氨基酸序列片段; 将所述第一氨基酸序列片段之前的预设数量的氨基酸和/或所述第 一氨基酸序列片段 之后的预设数量的氨基酸, 确定为所述噪声信息; 根据所述第一氨基酸序列片段和所述噪声信息, 获得 所述样本氨基酸序列片段。 11.一种蛋白质电子密度图处 理装置, 其特 征在于, 包括: 三维图像块获得模块, 用于获取待处 理蛋白质电子密度图的多个三维图像块; 氨基酸序列片段获得模块, 用于在氨基酸序列中, 确定与所述三维图像块对应的氨基 酸序列片段, 其中, 所述氨基酸序列 与所述待处 理蛋白质电子密度图对应; 第一特征信 息获得模块, 用于将所述三维图像块和对应的所述氨基酸序列片段输入图 像处理网络模型的编 码层, 获得第一特征信息, 其中, 所述第一特征信息为将所述三 维图像 块的特征信息及对应的氨基酸序列片段的特 征信息融合后的特 征信息; 第二特征信息获得模块, 用于通过所述图像处理网络模型的解码层, 获得与所述第一 特征信息对应的第二特 征信息; 结果获得模块, 用于根据所述第二特征信息, 分别获得所述三维图像块中各体素的原 子分类结果和氨基酸分类结果, 所述原子 分类结果包括所述体素所属的原子的类别识别结 果, 所述氨基酸分类结果包括所述体素 所属的氨基酸的类别识别结果。 12.一种电子设备, 其特 征在于, 包括: 处理器;权 利 要 求 书 2/3 页 3 CN 115240044 A 3

.PDF文档 专利 蛋白质电子密度图处理方法、装置、电子设备和存储介质

文档预览
中文文档 26 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共26页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 蛋白质电子密度图处理方法、装置、电子设备和存储介质 第 1 页 专利 蛋白质电子密度图处理方法、装置、电子设备和存储介质 第 2 页 专利 蛋白质电子密度图处理方法、装置、电子设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 12:08:27上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。