网站首页/有机动态/有机干货/ACS Cent. Sci.​ | 利用深度学习实现流式肽合成的预测与优化
ACS Cent. Sci.​ | 利用深度学习实现流式肽合成的预测与优化
今天为大家推荐一篇发表ACS. Cent. Sci.上的文章:Deep Learning for Prediction and Optimization of Fast-Flow Peptide Synthesis,文章的通讯作者是来自麻省理工的Bradley L. Pentelute和Rafael Gómez-Bombarelli,Pentelute教授专注的方向是蛋白质工程与药物递送,而Bombarelli教授则是从事计算辅助的合成方法学研究。



固相肽合成(SPPS)是人工合成多肽的重要手段,与基因重组表达相比,SPPS合成的肽不受序列与氨基酸种类的限制,因此使用范围更广。然而,SPPS涉及多个步骤的重复反应,对时间和体力的消耗非常大。近年来,流式化学技术的发展催生了自动合成仪化学平台的设计与使用,作者的实验室就设计了一个自动化的快速流式肽合成仪(AFPS),可以实现高效自动的SPPS。但是,合成过程中出现聚集等副反应的问题仍未得到解决。为了提高产率,作者设想通过算法对自动合成进行实时的优化。

为了实现这一设想,作者需要这种算法可以在合成条件与产率之间建立准确的联系,这一目标可以通过深度学习来实现。但是,有效的深度学习需要大量高质量且标准化的数据,这意味着不能简单地从出版的资料中收集这些数据,因为它们是不同标准的且不一定可重复。为了获得统一标准的高度可重复的数据,作者用AFPS在相同的优化参数下做了大量的脱保护合成步骤,获得了35427个独立的UV-Vis检测数据。作者将每个合成反应中的前体序列和引入的氨基酸都用指纹图谱编码成类似条形码的形式,这些条形码包含氨基酸的侧链、酰胺键和保护基等所有关键亚结构的信息。作者将这些条形码信息和对应的合成参数(包括反应温度、流速、偶联试剂等)作为输入,肽合成中Fmoc去保护的UV-Vis迹线的积分、高度和宽度作为输出,这些变量是衡量反应是否成功的重要标准。作者在用收集到的数据训练了深度神经网络模型后,用该模型预测的UV-Vis迹线与实验所得数据在误差允许范围内是相匹配的。


作者使用该模型预测了聚集与序列的关联性,聚集是SPPS中发生的最重要的副反应之一,但是聚集与肽段序列之间的关系尚不明确。发生聚集的特点是UV-Vis峰变得更平更宽,作者用宽高比对这一特征进行量化定义,并用训练的模型准确判断出了GLP-1在添加Ala18后发生的聚集。为了进一步了解聚集与序列间的关联,作者用该模型预测了PDB中8000余种蛋白质可能的聚集行为,发现芳基和较大侧链的氨基酸最容易导致聚集。作为验证,作者将选定的对待合成肽进行了单点突变并用模型判断了所有突变体的发生聚集的可能性;随后用实验合成了其中几个肽并将产率与模型预测进行了比较,二者是相符的。


最后,作者用该模型的预测结果作为指导去优化了AFPS自动合成过程中的参数,从而对于除了Trp之外的所有氨基酸都获得了一个新的偶联配方。实验证明在优化的条件下大多数氨基酸的偶联产率都提高了,但包括Trp在内的几种氨基酸仍有进一步优化的空间。

综上,作者利用一个深度学习模型对流式肽合成的产率进行了预测并用该模型指导了合成条件的优化。作者希望未来该模型能够实现在合成过程中的实时调控,即根据上一步合成的表征信息自动给出下一步合成的最佳优化条件。


本文作者:TZY

责任编辑:LYP

原文链接:https://pubs.acs.org/doi/abs/10.1021/acscentsci.0c00979

原文引用:DOI:10.1021/acscentsci.0c00979


纳孚服务
  • 化学试剂
  • 提供稀有化学试剂现货

  • 化学试剂定制合成服务
  • 上海纳孚生物科技有限公司提供市场稀缺的化学试剂定制服务

  • 新材料现货
  • 上海纳孚生物科技有限公司代理或自产包含石墨烯产品,类石墨烯产品、碳纳米管、无机纳米材料以及一些高分子聚合物材料

  • 结构设计及定制合成
  • 可以根据客户需求对所需化合物结构进行设计改性,从而定制合成出客户所需分子式结构

  • 联系我们
  • 021-58952328
  • 13125124762
  • info@chemhui.com
  • 关注我们
在线客服
live chat