SCUBA_D:蛋白质骨架生成与去噪的工作原理解析

该思维导图展示了SCUBA_D的工作原理,包括输入的随机噪声和条件信息。通过将氨基酸序列转换为ESM向量,生成低分辨率蛋白质骨架结构,利用去噪扩散模块进行逐步细化。对抗模块用于评估局部构象的合理性,损失函数则衡量结构和表示的偏差。最终输出符合特定特性和功能的蛋白质骨架结构,可应用于进一步的蛋白质设计和实验验证。

源码
# SCUBA_D
## 输入
- 随机噪声
  - 蛋白质骨架生成起点
  - 随机性引入多样性
- 条件信息
  - 部分序列
    - 关键氨基酸段
    - 目标功能探索
  - 折叠信息
    - 预测折叠方式
    - 提高最终结构合理性
  - 固定功能基序坐标
    - 确保特定功能保留

## 序列表示
- 将氨基酸序列转换为ESM向量
  - 作为单代表示
  - 编码化信息提取
  - 指导蛋白质骨架的生成

## 低分辨率去噪模块
- 使用单代表示
  - 包含先验知识
- 预测低分辨率的蛋白质骨架结构
  - 类似去噪自编码器
  - 初步构建蛋白质框架

## 迭代去噪扩散模块
- 使用低分辨率骨架作为非零先验数据
  - 参考模型结构
- 通过多个扩散步骤进行迭代去噪
  - 逐渐细化蛋白质骨架结构
  - 改善几何合理性

## 单代表示去噪
- 单代表示(ESM向量)通过扩散模型进行去噪
  - 增强模型正则化
  - 降低过拟合风险
  - 提升生成效果的稳定性
  
## 对抗模块
- 打包判别器
  - 评估局部空间排列
  - 打包质量(紧凑性)
- 局部构象判别器
  - 评估连续肽段主链构象
  - 局部构象合理性
  - 确保链段间相互作用合适

## 损失函数
- 框架对齐点误差(FAPE)损失
  - 衡量蛋白质结构偏差
  - 促进空间一致性
- 单代表示损失
  - 衡量蛋白质序列在ESM表示空间中偏差
  - 确保信息完整性
- 对抗损失
  - 最小化数据分布错误
  - 提升生成结构的真实感

## 输出
- 最终生成蛋白质骨架结构
  - 具备所需特性和功能
  - 应用于进一步蛋白质设计和实验验证
  - 潜在生物医学应用
图片
SCUBA_D:蛋白质骨架生成与去噪的工作原理解析