本发明专利技术公开了一种有机化学品正辛醇/空气分配系数(KOA)的理论预测方法,属于生态风险评价测试策略领域。即基于化合物的分子Dragon描述符构建定量构效关系模型(QSAR)以及基于热力学原理采用开源溶剂化模型计算溶解自由能,由热力学原理式logKOA?=?-ΔGOA/2.303RT换算得到KOA。基于该方法提出预测化合物KOA的一般策略,即首先根据Dragon描述符判断分子是否在应用域内,处在域内则优先采用QSAR模型(不同温度下采用QSAR-T),域外化合物采用SM8AD溶剂化模型预测。采取和遵循本发明专利技术的方法策略,可快速、有效地预测不同化合物在不同温度下的KOA,节省大量人力物力财力,为大规模的化学品的生态风险评价和环境监管提供重要的基础数据。
【技术实现步骤摘要】
通过定量构效关系和溶剂化模型预测不同温度下的正辛醇空气分配系数Ktw的方法
本专利技术属于化学品生态风险评价测试策略领域,具体是基于有机化合物分子的 Dragon描述符判断化合物是否处于构建的正辛醇/空气分配系数(Km)与分子描述符的定量构效关系模型(QSAR)和温度依附性的QSAR-T模型应用域内,域内化合物优先通过QSAR 模型计算其在单一温度(25°C )下的KQA,不同温度(-10 — 50°C )的Kqa值由QSAR-T模型计算。对域外化合物,则采用溶剂化模型SM8AD进行Km的预测。
技术介绍
正辛醇/空气分配系数(Km)可以定义为在一定温度下,分配平衡时,有机化合物在正辛醇相和空气相中浓度的比值(无量纲),实际应用中常以其对数形式(IogKtw)表示。由于正辛醇是长链脂肪醇,具有类脂性,因此Km常用来描述污染物在空气相和环境有机相之间的分配行为,是评价化合物在环境中的长距离迁移能力和生物蓄积性的重要的环境行为参数。Km定义的热力学公式为logK0A=-AG0A/2. 303RT(1)式(I)中Λ Gm表示化合物从空气相转移到辛醇相中Gibbs自由能的变化,也称溶解自由能或溶剂化自由能。R是指理想气体常数,T为环境温度。Km值越大的化合物,越容易分配于环境有机相中(包括土壤有机质,空气颗粒物的有机成分,以及动物植物的表皮角质层等)。此外,Km具有较强的温度依附性温度越低,Km值越大。化合物的Km主要通过实验测定的方法来获取产生柱法、顶空气相色谱法、固相微萃取法、逸度测量法和气相色谱保留时间方法。前人通过这几种方法得到了一些典型环境污染物(如多氯联苯(PCBs),多环芳烃(PAHs),多溴联苯醚(PBDEs)以及二噁英(P⑶D/ Fs)等的Κω。这几种方法各有优缺点,适于测定的化合物性质也不同。由于化学品的种类繁多,采用实验测定方法获得Km花费大,耗时长,而且有些化合物缺乏标准品,造成测定的困难。据美国环保局的统计,目前为止,具有Km实验测定值的化合物仅有几百种,远不能满足化学品风险评估的需要。因此,发展或构建理论预测方法或者模型来快捷有效地获取化合物的Km具有重要的意义和应用价值。其中,基于分子描述符的定量结构-活性关系(QSAR) 模型是一种常用且简便有效的方法。QSAR模型的基本原理是化合物的分子结构决定它的性质。QSAR作为一种计算机建模方法,可以深入挖掘和表征有机化合物分子结构与其理化性质、环境行为、毒理效应等性质的量变规律和因果关系,从而从分子水平上评价污染物的生态风险。目前,QSAR模型已成为污染物环境生态风险评价和人体建康风险评价的重要工具。为了促进QSAR模型在化学品风险管理方面的应用,经济合作与发展组织(0Ε⑶)2007年提出了 QSAR的构建和使用导则,该导则认为,一个好的QSAR模型应该具备以下五个标准(1)明确定义的环境(活性)指标;(2)明确的算法;(3)定义了模型的应用域;(4)对模型的拟合优度、 稳健性和预测能力有适当的评价;(5)最好进行机理解释。目前已经有许多研究者建立了一些化合物Κω的QSAR预测模型。这些QSAR模型有些是基于分子碎片的基团贡献模型,比如文献“Li,X. H. ; Chen, J. W. et al. The fragment constant method for predicting octanol—air partition coefficients of persistent organic pollutants at different temperatures. Journal of Physical and Chemical Reference Data 2006,35,(3),1365-1384. ”釆用多元线性回归(MLR)的方法,建立了典型持久性有机污染物Κω的线性QSAR模型,模型的自变量为分子碎片常数。该模型具有应用简便,预测能力高,稳健性好的特点。还有些是多参数线性自由能关系(PP-LFER)模型,例如“Chen, J. W. ; Harnerj T. ; Yang,P. ; Quanj X. ; Chen, S. ; Schramm, K. W. ; Kettrupj A. Quantitative predictive models for octanol—air partition coefficients of polybrominated diphenyl ethers at different temperatures. Chemosphere 2003, 51,(7),577-584. ”和“Chen,J. W. ; Harnerj T. et al. Quantitative relationships between molecular structures, environmental temperatures and octanol-air partition coefficients of polychlorinated biphenyls. Computational Biology and Chemistry 2003, 27,(3),405-421. ”等基于化合物的分子结构描述符,采用偏最小二乘 (PLS)的方法建立了 QSAR模型,分别预测了 PCBs和PBDEs的KM。模型采用累积交叉验证系数Q2aa表征稳健性(鲁棒性),并且添加了温度这一描述符考虑TKm的温度依附性,得到了良好的预测效果。参照OE⑶的指导原则可以发现,这些QSAR模型均属于局部(local)意义上的定量构效关系,往往只能适用于某一类型的化合物。且有些模型缺乏对应用域的准确表征以及缺少有效地外部验证集进行模型预测能力的探讨。同时,对于温度依附性较强的Koa,也需要考虑温度的影响。因此,有必要建立一个应用域覆盖不同种类化合物的广义的(global) QSAR模型,并将温度作为一个变量加入模型。同时,根据OE⑶的QSAR导则, 在建立模型后,需要对其进行应用域的表征及可能的机理解释。总体来讲,预测Km的QSAR方法的计算量小,结果可靠,可应用于风险管理。 但是, QSAR模型强烈依赖于化合物的Km实验值(建模和验证),并且一个好的QSAR模型仅能够对其应用域内有限的化合物的Km做出预测。这两点构成了它应用的主要限制。因此,基于溶解自由能Λ Goa的Km预测方法具有多方面优点(I)基于溶解自由能Λ Goa的计算在理论上没有应用域的限制,适用于所有的有机化合物;(2)只需要输入分子的坐标信息,就可以较为准确快速地获取化合物在辛醇相中的Λ Goa,从而得到IogKtw值。近几年来,量子化学计算的发展突飞猛进,计算精度与速度完美结合,加之理论化学家对分子在相间的物理化学过程的认识与合理的模拟,通过溶剂化模型来计算溶剂自由能已经能获得较好的精度。 此外,这种从头算的方法,从另一方面规避了大量的分子描述符的筛选,只需要化合物分子最基本的结构坐标信息,为简化计算迈出了重要一步。许多国外的研究者开发了许多开源的隐性溶剂化模型(模型采用参数来表示溶剂),来探讨化合物分子在介质之间分配,以及在溶剂中溶解的过程及其能量变本文档来自技高网...
【技术保护点】
通过定量构效关系和溶剂化模型预测不同温度下的正辛醇空气分配系数KOA的方法,其特征包括以下步骤:(1)数据搜集和划分:搜集文献中实验测定的正辛醇/空气分配系数KOA值,得到380种有机化合物在不同温度下的936个KOA数据;随机将其中264种、654个KOA值划为训练集,其余为验证集;(2)QSAR和QSAR?T模型构建:采用多元线性回归和偏最小二乘方法构建25℃时logKOA和训练集化合物分子Dragon描述符的定量构效关系QSAR模型,表达式为:logKOA=?0.509?+?0.986?×?X1sol?–?1.018?×?Mor13v?+?1.384?×?H?050?–?1.528?×?R5v?–?0.015?×?T(O..Cl)?+?0.043?×?HATS5v?–?0.026?×?RDF035m?–?0.197?×?RCI?–?0.130?×?nCOOR?–?0.077?×?Mor15u?–?0.077?×?RDF090m,其中,X1sol表示溶剂连接性指数chi?1;Mor13v和Mor15u是3D?MoRSE描述符;H?050表示H原子连接杂原子的碎片常数;R5v和HATS5v表示GETAWAY描述符;RDF035m和RDF090m表示径向分布函数描述符;RCI?表示芳香性指数描述符;T(O..Cl)是O和Cl原子间拓扑距离的和;nCOOR表示分子中醚键的个数;在该QSAR模型的Dragon描述符上添加温度校正后构建?10—50℃时logKOA与校正的Dragon描述符之间的温度依附性QSAR?T模型,表达式为:logKOA?=?–3.03?+?3.13?×102X1sol/T?–?8.57?×?10Mor13v/T?+?4.32?×?102H050/T?–?1.27?×?103R5v/T?–?5.54?×?T(O..Cl)/T+?1.25?×?102HATS5v/T?–?1.33?×?10RDF035m/T?–?6.11?×?10RCl/T?–?3.76?×?10nCOOR/T?+1.56?×?102Mor15u/T?–?5.49?×?RDF090m/T?+?1.04?×?103/T;该QSAR和QSAR?T模型的校正决定系数R2adj?>?0.9,累积交叉验证系数Q2CUM?>?0.9;(3)QSAR和QSAR?T模型的验证和应用域表征:QSAR和QSAR?T模型的验证结果用外部预测相关系数的平方Q2EXT和均方根误差RMSE表示;QSAR和QSAR?T模型的化合物应用域相同,均同时采用以下四种应用域表征方法:描述符距离范围法、欧几里德距离法、城市街区距离法和概率密度分布法;(4)溶剂化模型:采用从头算的开源溶剂化模型SM8AD计算有机化合物分子在25℃时在正辛醇中的溶解自由能△GOA,由KOA的热力学原理式logKOA?=??△GOA/2.303RT计算得到logKOA值;(5)未知化合物的KOA预测:计算未知化合物的Dragon描述符,判断该描述符是否处在QSAR和QSAR?T模型应用域内;若是,则采用QSAR模型预测25℃时的KOA值,如需获得其他温度下的KOA,则采用QSAR?T模型预测;若处在域外,则采用溶剂化模型SM8AD计算获取KOA;...
【技术特征摘要】
【专利技术属性】
技术研发人员:李雪花,傅志强,陈景文,乔显亮,
申请(专利权)人:大连理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。