有机物合成路线的计算机辅助设计

书籍:现代科技综述大辞典上 更新时间:2018-09-11 02:03:32

出处:按学科分类—自然科学总论 北京出版社《现代科技综述大辞典上》第277页(3683字)

就是通常所说的计算机辅助有机合成(Computer Assis-ted Organic Synthesis,CAOS),指由计算机辅助化学家找出目标分子的各种可能的合成路线。

化学反应成千上万,达到该目标化合物的可能合成路线非常多。化学家不可能记住所有的化学反应式,因此所设计的合成路线不一定是最佳的。

能否利用计算机来帮助人们从成千上万的合成路线中找出最佳的或较好的合成路线呢?最早提出这种想法的是G.E.Vleduts,而把理想变成现实的则是美国Harvard大学的E.J.Corey和W.T.Wipke。Corey第1个观察了有机化学家在整个合成工作过程中扮演的角色及其逻辑思维过程,提出有机合成工作的4个阶段:(1)选择要合成的分子(即确定目标产物Target)→(2)作可行性分析,给出初步合成方案→(3)具体进行合成路线设计(选择具体反应原料条件编排反应进行先后次序)→(4)实验操作。

他认为用计算机模拟合成路线的分析过程是可行的。当给定目标分子后,从它出发逆着反应方向倒推出前体,再从这此前体出发推出新的前体,直至前体为原料为止。

于是就形成了如下图1所示的合成树。由此可见,对于给定的目标分子可有多条合成路线供选择,因此必须对合成树进行删剪,只留下合理的枝叉。

在分析过程中虽有一些反应机制理论可用于指导,如考虑反应中心的空间位阻,电子效应,反应活化能,干扰基团,副反应的竞争,单步和总体产率,目标分子的对称性等等,但更多是凭个人经验。要用计算机模拟化学家设计合成路线的思维过程,则必须将这些经验条理化,才能编入程序。

Corey于1967年总结出一些通用的合成策略和实现这些策略所用的分析方式,1969年与W.T. Wipke编写并成功运行了第1个计算机辅助有机合成路线设计程序OCSS(Organic Chemical Synthesis Simulation),标志着计算机辅助有机合成这一交叉学科的诞生。

图1

自此之后,这方面的研究日趋活跃,已建立起的比较有代表性的系统有:

有的系统已得到了实际应用。

从已发表的CAOS系统来看可分为两大类型,一是以Corey为代表的经验型,一是以I.Ugi为代表的理论型。Corey领导开发的LHASA系统是经验型的代表,其主要目标是辅助解决这样的合成问题,即已知要合成的目标分子,如何设计合成路线?

LHASA的设计思想是模拟有机合成化学家分析、设计合成路线的思维过程,模拟有机合成化学家常用的“逆向合成法”(Retro-Synthetic Approach)。他们首先识别要合成目标分子的结构特征,然后由此推导产生一系列该目标分子的可能前体,即从目标分子倒推出一系列的起始反应步骤与反应,并希望这些步骤和反应物有可能通过已知的方法来实现。

其推导合成路线是通过“反应”的检索来实现的。

在反推的过程中,分析的出发点是在目标分子的结构中,找到那些与已知反应的产物结构一致,或近似一致的子结构。Corey等人把合成化学家的经验加以总结归纳,提出了逆合成分析的通用策略以及实现这些策略的规范化流程。

他们用12步分析流程法,概括有机化学家设计合成路线的思维过程:简化目标分子的复杂程度;找出合成子;生成等价合成子;加入控制合成子;切开合成子,生成前级产物(前体);找出切开合成子对应具体反应;把得到的前体当作新的目标分子,继续重复上述过程;一直分析到适当的原料为止;排除结构不合理的前体;检查有没有遗漏的问题;重复以上分析步骤,给出所有可能的合成路线;给各条路线评分。自1969年以来,上述逆合成分析策略及规范化流程经Corey小组的不断修改和补充,已调整为5套针对不同问题的分析策略(Strategy):Transform-Based Strategy;Structure-Goal Strategy;Topological Strategy; Stereochemistry Strategy;Functional Group Based Strategy。

以LHASA为代表的有机合成路线辅助分析程序,是建立在对反应数据库进行信息检索基础之上的,它们给出的结果十分具体、实用,有关反应的条件、产率等信息也较完全,但从另一个角度看,也隐含着缺点:要事先编辑建立一个反应数据库;还要根据合成领域的新进展不断充实和更新数据库中的内容;最致命的是,整个分析过程都局限在数据库所包含的反应范围之内,不可能包含有新的反应步骤。

Ugi所领导的小组建立的CICLOPS是理论型系统的最初模型,其主要目标是解决另一类合成问题,即知道要合成的目标分子,并规定了可选用的合成原料范围和反应步骤的上限,但具体的反应条件不清楚:

CICLOPS的理论基础是化学反应矩阵代数模型,假设任何一个分子中的原子,都是通过化学键相互作用的,化学反应的本质就是原子壳层电子的转移,分子结构可用矩阵来表示。矩阵的每行、或每列分别对应于分子中的一个原子,如果分子中有n个原子,则矩阵为nxn阶方阵,其中非对角线上的元素bij(i≠j),对应于i、j两元素间所形成的价数,而对角线上的元素bii代表i原子上未配对的价电子数,Ugi他们称这种矩阵为价键电子矩阵(Bond Electron Matrix),简记BE矩阵。他们把所有参加反应的分子用一个BE矩阵E来表示,把所有的产物用另一个BE矩阵E′来表示,这两个矩阵之差则对应于反应过程中价电子转移的情况,称之为反应矩阵(Reaction Matrix),简记R矩阵,反应可用下式来表示:

E+R=E′

而且所有的反应都可用R矩阵来归类。

Ugi在总结已知的反应过程中发现:反应只断一根旧键的有5种类型;反应中断掉两根旧键的有12种类型;反应时断掉3根旧键的有21种类型,即总共有38种类型的矩阵。有了这些基本的反应类型,就可以把有机合成路线的分析过程形式化、推理化。后来Ugi又把BE矩阵对角线上的元素bii扩展成一个一维多元向量,不仅用来记录第i原子上未配对的价电子数,还用来记录该原子上所带电荷以及立体化学信息等等。

纵观已有的计算机辅助有机合成路线分析程序,基本上都是追求以下两个目标之一,一是试图建立有机反应机制的逻辑体系,从而更深入地了解化学反应的本质,并预言可能的新反应,启迪化学家的思维。二是力求给化学家一些实用的帮助,如帮助分析找出目标分子可能的合成路线,选择适宜的合成原料,估计反应的产物等等。有的方法侧重于对反应有较好的预测能力,有的则倾向于产生合成路线的全面性,但是两者总是难以兼顾。

CAOS发展到今天,预言它将胜过人的智能还为时过早,但是随着人工神经网络等新技术的引入,CAOS必将有更大的进展。

中国目前只有为数不多的大学和研究所初步开展了计算机辅助有机合成路线设计的工作。

南开大学已建立起中国第一个有实用价值的有机合成反应数据库,包含近7万条常用的有机合成反应,可说是一个良好的开端。

【参考文献】:

1 VledutsG E,et al. Inf Storage Retr, 1963,1(3-3), 101 - 116

2 Corey,E J. Pure Appl Chem,1967,14:19-37

3 Corey E J,et al. Science, 1969,166(3902) ,178-192

4 Corey E J. Quart. Rev Chem Soc, 1971,25 = 455-482

5 Blair J,Gasteiger J,Ugi I,et al. Computer Representation and Manipulation of Chemical Information. John Wiley, Sons,1974,130-145

6 Gasteiger J. Ugi I,et al. ACS Symp Ser, 1977,61:33-59

(南开大学中心实验室林少凡教授、张金碚副教授、乔圆圆讲师撰)

分享到: