推荐一篇发布在Nature Communications上的文章,文章标题“Stable de novo protein design via joint conformational landscape and sequence optimization”。文章的通讯作者是来自MIT的Sergey Ovchinnikov教授和西北大学费恩伯格医学院的Gabriel J. Rocklin教授。其中,Sergey Ovchinnikov课题组主要从事蛋白质设计相关的研究。

生成式蛋白建模极大拓展了蛋白质序列的设计多样性。蛋白质稳定性则是进一步过滤生成序列时需要考虑的关键因素,它源自折叠状态下原子相互作用与非折叠状态下较高构象熵之间的微妙平衡。不稳定的蛋白质易于发生降解与聚集,故难以用于生物学或治疗应用。以往序列设计模型仅优化P(sequence | structure),它无法看到除给定构象外的其他构象。这一策略由于不优化构象本身,因此设计得到的序列有可能折叠成能量较低的非目标结构。蛋白质结构预测模型则优化P(structure | sequence),然而它假设序列本身是良好的,因此难以区分蛋白质稳定与否。本文作者假设通过联合优化P(sequence | structure)和P(structure | sequence)有可能更充分地探索完整的构象-能量景观(energy landscape),从而得到更稳定的蛋白质。

作者研究了四种模型以生成全新的蛋白质结构和序列,TrROS(即TrRosetta)、TrMRF(transform-restrained Markov Random Field)、ProteinMPNN以及联合模型(TrROS+TrMRF)。针对不同模型得到的序列(总共包含13442条序列),利用基于cDNA展示的蛋白质水解方法,测试序列的稳定性。最终使用ΔG(unfold)描述,该值越大表明设计序列中稳定蛋白质的比例越高。
密度分布图表明,联合模型设计的序列具有更高的折叠稳定性。考虑到蛋白质设计中的一种常见场景是利用结构置信度指标(如AF2中的pLDDT)进行过滤,作者也测试了使用过滤条件下生成序列的ΔG(unfold)分布。结果表明,过滤条件能够为两种策略(联合优化、TrMRF & ProteinMPNN)带来更高比例的稳定蛋白,但相比较而言联合优化策略仍表现更优。

后续,作者也分析了联合模型并未将主链改变为完全不同的折叠,RMSD改变较小。并且,作者亦发现联合模型设计的序列中亲水性互作频率更高,可能有助于维持其二级结构。
总而言之,本文作者提出了联合模型(TrRosetta和TrMRF)以实现更稳定的蛋白质设计。
本文作者:ZF
责任编辑:MB
DOI:10.1038/s41467-025-66526-w
原文链接:https://doi.org/10.1038/s41467-025-66526-w













