发布网友 发布时间:2023-03-25 20:22
共1个回答
热心网友 时间:2023-10-19 23:06
MIT团队化学发现落地经验总结
01 自动化和机器学习结合
4. 分子图表征能够系统地捕捉更多信息
02 分子生成
03 分子属性预测器
04 反应路径
一旦选择了分子,需要确定在自动化管道中合成分子的路径
05 分子选择
1. 通过有策略地选择产物,可以找到具有共同节点和多样化功能路径的反应树
06 机器人执行
构建了基于well-plates的批量合成平台
1. 平台中间纯化和高效液相色谱分离的组合用于研究在平台上执行化学反应
2. 基础光谱测量在平台上完成自动化,可以用于表征其他与染料相关的特性
07 实验数据
1. 利用基本光谱测量,导出了其他相关性质,如分配系数和光稳定性
2. 直接光解活化能的测量可以作为用chemprop选择耐光染料的指导分子特性
08 Data from Experiments-->Property Predictors
1. 通过实验实现选定的分子,可以将表征数据反馈到模型中,用于指导额外的迭代
利用属性预测模型和计算机辅助合成规划来驱动自动多属性分子发现平台
01 自动化和机器学习结合
1. 自动化和机器学习的结合可能是实现快速、多样分子化学发现的基础
将传统的高通量实验和机器学习化学发现结合起来,吸收各自优点,弥补不足
传统的高通量实验
优点:快速、自动化、一致、范围窄
缺点:试验设计慢
文献:Santanilla, A.B., et al. Science 2015
机器学习化学发现
优点:快速的试验设计,多样性的
缺点:慢的试验验证
文献:Tkatchenko, A., et al. Nature Comm., 2020
2. MIT在机器学习和机器人技术的界面上自主设计具有多个属性目标的新分子
多属性包括:
(1) Organic Electronics
Singlet-Triplet Splitting、Oscillator Strength、Excited State Lifetime、Spectra
文献:Gomez-Bombarelli, et al. Science, 2016
(2) Reaction Discovery
Structure characterization, Mechanism discovery, substrate scope studies, Process chemistry
文献:Bort, et al., Scientific Reports, 2021
(3) Pharmaceuticals
Bioactivity, Biotoxicity, Solubility, Stability
(4) Energetic Materials
Heat of formation, Detonation pressure, Detonation velocity, Density
文献:Elton, D.C., et al. arXiv, 2018
3. MIT:有多种工具正在积极构建和改进,可用于驱动自主化学发现平台
机器学习模型正在开发应用不同的化学模块
(1) Reaction Discovery(new and /or more efficient pathways)
(2) Process Optimization(describe the yield-condition response surface)
(3) Molecular Discovery(new molecules using know chemical transformation)
4. 化学发现周期从确定目标开始,以评估分子和模型的性能
(1)如何设计针对特定属性的分子
(2)MIT证明所有的部分都可以在非生物系统上工作
(3)对于非生物系统,底层工作流是相同的,但更容易启动
初始的发现任务:
Target -增加数据集的最大吸收
Constraints-约束吸收最大值(FA3),SAScore
Molecule Selection-基于新颖性的分子选择手动过滤器
5. 分子图表征能够系统地捕捉更多信息
02 分子设计
6. 为了生成新的分子,我们可以使用Graph-to-graph Translation,以迭代方式将性能较差的分子推向性能较好的分子
Graph-to-graph Translation
对于多属性目标,分子的各个部分通常会贡献自己的功能
通过提取好的分子片段并以有趣的新方式排列它们来产生新的目标
文献:Jin, W., et al., arXiv preprint arXiv:1812.01070(2018)
代码:https://github.com/wengong-jin/iclr19-graph2graph
7. 使用迭代 使用Graph-to-graph Translation 方法提高目标结构的溶解度
文献:Bilodeau, C., et al., React. Chem. Eng., 2022, 7, 297-309
8.对于分子图生成,通过使用 带有 基序的编码器-解码器来避免逐个原子生成的*
文献:Wengong, J., Barzilay, R., Jaakkola, T., Int. Conf on Machine Learning. PMLR, 2020
9. 基于基序的层次图完成模型可以在不需要逐个原子构建分子的情况下完成包含分子的环
文献:Wengong, J., Barzilay, R., Jaakkola, T., Int. Conf on Machine Learning. PMLR, 2020
10. 生成模型是生成大量待考虑候选分子的通用工具
Graph-to-Graph translation model
文献:Jin, W., et al., arXiv preprint arXiv:1812.01070(2018)
代码:https://github.com/wengong-jin/iclr19-graph2graph
Graph completion model
文献:Wengong, J., Barzilay, R., Jaakkola, T., Int. Conf on Machine Learning. PMLR, 2020
文献:Bilodeau, C., et al., React. Chem. Eng., 2022, 7, 297-309
03 分子属性预测器
11. MIT使用基于消息传递神经网络的Chemprop来设计一般化学性质的空间并建立筛选模型
文献:J.Chem. Inf. Model. 2019, 59,3370-3388
代码:http://chemprop.csail.mit.e/
12. 可以从集成的Chemprop训练模型中获得明显预测确定性的估计
文献:J.Chem.Inf.Model. 2020,60, 2697-2717
13. 对于MIT的测试设计空间,使用了一组Chemprop模型,这些模型是从测量属性的实验数据集训练而来
文献:UV/Vis:Greenman, K.P.,Green, W.H, Gomez-Bombarelli, R., Chem. Sci., 2022,13, 1152-1162
文献:Chung, Y., Vermeire, F.H., Green, W.H., et al., J. Chem. Inf. Model, 2022, 62, 433-446
14. graph-completion生成可合成的分子,可以覆盖目标属性空间的广泛区域
03 反应路径
一旦选择了分子,需要确定在自动化管道中合成分子的路径
15. The Jensen lab and others at MIT已经为有机合成预测开发了ASCKOS工具
文献:https://mlpds.mit.e/papers/
Coley, C.W., et al., ACS Cent. Sci. 2017
askcos.mit.e
16. 使用ASKCOS,借助计算机辅助合成规划软件可以自动生成反应路径
ASKCOS开发团队已经包括了许多软件包,可以对反应和过程化学进行深入分析/预测
05 分子选择
通过有策略地选择产物,可以找到具有共同节点和多样化功能路径的反应树
06 机器人执行
构建了基于well-plates的批量合成平台
(1)得到了吞吐量和灵活性的良好平衡
(2)非常支持基于属性的化学发现
(3)允许我们同时进行化学反应
平台中间纯化和高效液相色谱分离的组合用于研究在平台上执行化学反应
基础光谱测量在平台上完成自动化,可以用于表征其他与染料相关的特性
07 实验数据
利用基本光谱测量,导出了其他相关性质,如分配系数和光稳定性
直接光解活化能的测量可以作为用chemprop选择耐光染料的指导分子特性
08 Data from Experiments-->Property Predictors
通过实验实现选定的分子,可以将表征数据反馈到模型中,用于指导额外的迭代
有多种工具正在积极构建和改进,可用于驱动自主化学发现平台