首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 968 毫秒
1.
原子类型电拓扑状态指数预测吲哚喹唑啉衍生物的抗癌性   总被引:1,自引:1,他引:0  
梅虎  刘丽  杨力  李建  闫宁  王琴 《物理化学学报》2009,25(4):747-751
采用原子类型电拓扑状态指数(ETSIAT)对17个吲哚喹唑啉衍生物的抗癌活性进行定量构效关系(QSAR)的研究. 经逐步回归变量筛选, 得到包含4个ETSIAT变量的最优偏最小二乘模型, 其复决定系数R2、留一法交互验证复决定系数Q2和均方根误差RMSEE分别为0.806、0.736 和0.248. 将样本随机分为训练集和预测集后, 采用相同变量组合对模型进行外部验证, 结果显示模型具有较高的外部预测能力. 模型分析结果显示, 与抗癌活性相关的4个ETSIAT描述子对应结构碎片分别为≥N=, —NH—, =O, >N—. 其中—NH—结构碎片与抗癌活性呈负相关关系, 而≥N=, >N—和=O则与抗癌活性呈正相关关系. 此外, 研究亦显示, 取代基R1上存在强的吸电子基团可显著提高化合物的抗癌活性, 且影响抗癌活性的因素可能还有R2基团的空间位阻效应. 据此设计出4个化合物的预测活性比最高活性样本分别提高7.7%、15.3%、23.1%和130%.  相似文献   

2.
万金玉  刘怡飞 《化学通报》2019,82(10):926-936
随着有机磷化合物(OPs)的广泛应用,其在越来越多的环境介质中被检测出来。大多数OPs具有毒性,但人们缺乏快速且有效的预测手段来对毒性进行评估。本文将结合E-Dragon软件计算的分子描述符,采用不同的QSAR模型对36个OPs的毒性进行预测。文中采用后退法作为描述符筛选方法,以均方根误差(RMSE)作为评价标准,共找到14个对线性核函数支持向量机(SVM)模型贡献较大的描述符;在最终得到的SVM模型交叉验证结果中,计算值与实际值的相关系数为0. 913,均方根误差为0. 388;外部测试验证结果中,平均相对误差为9. 10%。此外,采用多元线性回归(MLR)、人工神经网络(ANN)以及偏最小二乘回归(PLS)模型对OPs的毒性进行预测,交叉验证结果显示,三个模型的计算值与实际值的相关系数分别为0. 878、0. 686与0. 620,没有SVM模型的预测能力好。因此采用线性核函数的SVM模型对OPs进行毒性预测是一个行之有效的方法。  相似文献   

3.
丛湧  薛英 《物理化学学报》2013,29(8):1639-1647
对89 个苯并异噻唑和苯并噻嗪类丙型肝炎病毒(HCV) NS5B聚合酶非核苷抑制剂进行了定量构效关系(QSAR)研究. 采用遗传算法组合偏最小二乘(GA-PLS)和线性逐步回归分析(LSRA)两种特征选择方法选择最优描述符子集, 然后建立多元线性回归和偏最小二乘线性回归模型. 并首次尝试使用遗传算法耦合支持向量机方法(GA-SVM)对两种特征选择方法所选的描述符子集分别建立非线性支持向量机回归模型. 三种机器学习方法所建模型均得到比较满意的预测效果. 采用LSRA所选的6 个描述符建立的三个QSAR模型对于测试集的相关系数为0.958-0.962, GA-SVM法给出最好的预测精度(0.962). 采用GA-PLS所选的7个描述符建立的三个QSAR模型对于测试集的相关系数为0.918-0.960, 偏最小二乘回归模型的结果最好(0.960). 本工作提供了一种有效的方法来预测丙型肝炎病毒抑制剂的生物活性, 该方法也可以扩展到其他类似的定量构效关系研究领域.  相似文献   

4.
无环醇~(13)C NMR化学位移与其结构参数的定量关系   总被引:1,自引:0,他引:1  
用新颖的原子拓扑矢量Y_C、原子平衡电负性q_e、结构信息参数[N_H~i(i=α,β)]和γ校正参数对63个无环饱和脂肪醇的局部化学微环境进行了结构表征,并对化合物~(13)C NMR化学位移进行了QSSR研究.采用偏最小二乘回归得到模型的复相关系数R和标准偏差S分别为0.9915和2.4827;对353个碳原子~(13)C NMR化学位移的实验值与计算值的平均绝对误差仅为2.01×10~(-6).同时,采用留分法(Leave-molecule-out)和外检验方法测试模型的内部稳定性和外部预测能力.与文献结果比较,本研究所用参数少,且计算简便.  相似文献   

5.
基于分子电性距离矢量预测有机污染物的生物富集因子   总被引:1,自引:0,他引:1  
基于分子电性距离矢量描述子(MEDV)表征236种有机污染物的分子结构, 应用最佳子集回归与偏最小二乘方法建立化合物的生物富集因子与其分子结构之间的相关QSAR模型. 结果显示, 影响其生物富集活性的分子结构碎片为—CH2、—X、—C≮、—C≮、—O—, 所建立模型具有较高的估计相关系数及LOO(leave-one-out)检验相关系数, 表明模型具有良好估计能力与稳定性, 同时应用训练集样本构建的QSAR模型预测外部检验集, 表明训练集模型具有良好的预测能力.  相似文献   

6.
采用三维全息原子场作用矢量(3D-HoVAIF)对20个TIBO类衍生物抗艾滋病药物进行定量构效关系(QSAR)研究。运用偏最小二乘回归(Partial Least Square Regression,PLS)建模,同时采用内部及外部双重验证的办法对所得模型稳定性能进行深入分析和检验。PLS建模的复相关系数(Rcum)、留一法(Leave-one-out,LOO)交互校验(Cross-validation,CV)复相关系数(QCV)和外部样本校验复相关系数(Qext)分别为0.837、0.804、0.812。结果表明,3D-HoVAIF能较好表征TIBO类衍生物抗艾滋病药物分子结构信息,  相似文献   

7.
运用三维全息原子场作用矢量(3D-HoVAIF)对33个Nevirapine类抗艾滋病药物进行了定量构效关系(QSAR)研究。采用偏最小二乘回归(PLSR)建立定量构效关系模型,同时采用内部及外部双重验证的方法对所得模型稳定性能进行深入分析和检验,所建模型的复相关系数(Rcum2)、留一法(LOO)交互校验(CV)复相关系数(Qcum2)和外部样本校验复相关系数(Qext2)分别为0·835、0·530和0·518。结果表明,3D-HoVAIF能较好表征Nevirapine类抗艾滋病药物分子结构信息,且所建模型具有较好稳定性能和预测能力。  相似文献   

8.
支持向量机用于多氯代萘毒性的定量构效研究   总被引:2,自引:0,他引:2  
用偏最小二乘法(PLS)和留一交叉验证从90多个量子化学参数中筛选出极化率、分子量、部分原子上的净电荷、静电势等作为描述符,应用支持向量机(SVM)对20个多氯代萘同系物的三组毒性数据分别建立了定量构效关系模型.所得模型的交叉验证相关系数的平方分别为0.805、0.890、0.936.并将偏最小二乘法建模所得结果与之进行比较,结果表明,SVM预报能力优于PLS.  相似文献   

9.
以自组建的血管紧张素转化酶(Angiotensin I-converting enzyme)抑制肽库为研究对象,采用氨基酸描述符SVHEHS(Scores vector of hydrophobic,electronic,hydrogen bonds and steric properties)对各肽样本进行结构表征后,进行自交叉协方差(Auto cross covariances,ACC)处理,并分别利用多元线性回归(Multiple linear regression,MLR)、偏最小二乘(Partial least square regression,PLS)、人工神经网络(Artificial neural networks,ANN)3种建模方法进行ACE抑制肽QSAR建模。结果显示,所得MLR、PLS与ANN模型的相关系数(Correlation coefficient,R2)分别为0.744、0.862、0.958,留一交叉验证相关系数(Leave-one-out cross-validated correlation coefficient,Q2LOO)分别为0.532、0.829、0.948,外部验证复相关系数(External validated correlation coefficient,Q2ext)分别为0.567、0.632、0.634。因此,SVHEHS结合上述3种建模方法均适用于ACE抑制肽的QSAR研究,其中ANN的建模效果最优。  相似文献   

10.
梅虎  周原  廖志华  李志良 《化学学报》2006,64(9):949-952
采用VHSE氨基酸结构描述子表征HLA-A*0201限制性表位结构, 以遗传算法和偏最小二乘相结合(GA-PLS)对102个训练集进行定量构效关系建模. 剔除3个异常样本后, 据候选模型交互检验及50个外部测试集预测结果, 筛选得到最优偏最小二乘模型(A=2), 其R2, Q2和 分别为0.755, 0.621和0.680. 构效研究显示: CTL表位活性主要与1, 2, 7, 8, 9位氨基酸残基疏水、1, 2位立体及6位残基电性等性质密切相关.  相似文献   

11.
Most models in quantitative structure and activity relationship (QSAR) research, proposed by various techniques such as ordinary least squares regression, principal components regression, partial least squares regression, and multivariate adaptive regression splines, involve a linear parametric part and a random error part. The random errors in those models are assumed to be independently identical distributed. However, the independence assumption is not reasonable in many cases. Some dependence among errors should be considered just like Kriging. It has been successfully used in computer experiments for modeling. The aim of this paper is to apply Kriging models to QSAR. Our experiments show that the Kriging models can significantly improve the performances of the models obtained by many existing methods.  相似文献   

12.
ω-芋螺毒素属于海洋生物活性多肽,由24-31个氨基酸残基组成.特异性作用于电压敏感的钙离子通道(VGCCs),能够直接开发成药物或作为先导化合物进行新药开发.本文应用新型氨基酸残基结构描述符cscales和遗传偏最小二乘算法,对ω-芋螺毒素进行定量构效关系(QSAR)研究,并设计、构建了容量为2244个化合物的N-型和P/Q-型VGCC拮抗剂虚拟组合多肽库,然后分别采用QSAR模型预测和相似性搜索方法对组合多肽库进行了虚拟筛选.研究结果表明,建立的N-型和P/Q-型VGCC拮抗剂QSAR模型均具有较好的预测能力,交叉验证相关系数(CV-r2)均大于0.89.主成分分析和聚类分析结果表明,虚拟组合多肽库中化合物具有较好的结构多样性和差异性.通过虚拟筛选,得到了具有高预测活性的6个N-型和19个P/Q-型钙离子通道拮抗剂,为进一步的合成和活性评价奠定了理论基础.同时,本文建立的多肽QSAR预测模型和虚拟筛选策略,为其它多肽类化合物的定量构效关系研究和虚拟筛选提供了参考.  相似文献   

13.
ω-芋螺毒素属于海洋生物活性多肽, 由24-31 个氨基酸残基组成. 特异性作用于电压敏感的钙离子通道(VGCCs), 能够直接开发成药物或作为先导化合物进行新药开发. 本文应用新型氨基酸残基结构描述符cscales和遗传偏最小二乘算法, 对ω-芋螺毒素进行定量构效关系(QSAR)研究, 并设计、构建了容量为2244 个化合物的N-型和P/Q-型VGCC拮抗剂虚拟组合多肽库, 然后分别采用QSAR模型预测和相似性搜索方法对组合多肽库进行了虚拟筛选. 研究结果表明, 建立的N-型和P/Q-型VGCC拮抗剂QSAR模型均具有较好的预测能力, 交叉验证相关系数(CV-r2)均大于0.89. 主成分分析和聚类分析结果表明, 虚拟组合多肽库中化合物具有较好的结构多样性和差异性. 通过虚拟筛选, 得到了具有高预测活性的6 个N-型和19 个P/Q-型钙离子通道拮抗剂, 为进一步的合成和活性评价奠定了理论基础. 同时, 本文建立的多肽QSAR预测模型和虚拟筛选策略, 为其它多肽类化合物的定量构效关系研究和虚拟筛选提供了参考.  相似文献   

14.
15.
16.
17.
18.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号