SCUBA_D:蛋白质骨架生成与去噪的工作原理解析
该思维导图展示了SCUBA_D的工作原理,包括输入的随机噪声和条件信息。通过将氨基酸序列转换为ESM向量,生成低分辨率蛋白质骨架结构,利用去噪扩散模块进行逐步细化。对抗模块用于评估局部构象的合理性,损失函数则衡量结构和表示的偏差。最终输出符合特定特性和功能的蛋白质骨架结构,可应用于进一步的蛋白质设计和实验验证。
源码
# SCUBA_D
## 输入
- 随机噪声
- 蛋白质骨架生成起点
- 随机性引入多样性
- 条件信息
- 部分序列
- 关键氨基酸段
- 目标功能探索
- 折叠信息
- 预测折叠方式
- 提高最终结构合理性
- 固定功能基序坐标
- 确保特定功能保留
## 序列表示
- 将氨基酸序列转换为ESM向量
- 作为单代表示
- 编码化信息提取
- 指导蛋白质骨架的生成
## 低分辨率去噪模块
- 使用单代表示
- 包含先验知识
- 预测低分辨率的蛋白质骨架结构
- 类似去噪自编码器
- 初步构建蛋白质框架
## 迭代去噪扩散模块
- 使用低分辨率骨架作为非零先验数据
- 参考模型结构
- 通过多个扩散步骤进行迭代去噪
- 逐渐细化蛋白质骨架结构
- 改善几何合理性
## 单代表示去噪
- 单代表示(ESM向量)通过扩散模型进行去噪
- 增强模型正则化
- 降低过拟合风险
- 提升生成效果的稳定性
## 对抗模块
- 打包判别器
- 评估局部空间排列
- 打包质量(紧凑性)
- 局部构象判别器
- 评估连续肽段主链构象
- 局部构象合理性
- 确保链段间相互作用合适
## 损失函数
- 框架对齐点误差(FAPE)损失
- 衡量蛋白质结构偏差
- 促进空间一致性
- 单代表示损失
- 衡量蛋白质序列在ESM表示空间中偏差
- 确保信息完整性
- 对抗损失
- 最小化数据分布错误
- 提升生成结构的真实感
## 输出
- 最终生成蛋白质骨架结构
- 具备所需特性和功能
- 应用于进一步蛋白质设计和实验验证
- 潜在生物医学应用
图片