首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 125 毫秒
1.
基于SVR和k-近邻群的组合预测在QSAR中的应用   总被引:1,自引:0,他引:1  
为提高定量构效关系(QSAR)研究的预测精度,发展了一种新的基于支持向量机回归(SVR)非线性筛选分子结构描述符、基于k-近邻群的非线性组合预测方法.首先以均方误差(MSE)最小为原则,以留一法通过多轮末尾淘汰实施分子结构描述符的非线性SVR汰选并给出最优核函数和相应保留描述符;其次基于待测样本与训练样本保留描述符向量的欧氏距离,以不同k-近邻群子模型双重留一法预测值反映样本集的异质性;然后基于MSE最小,以留一法通过多轮末尾淘汰实施近邻群子模型的非线性SVR汰选并给出最优核函数和相应保留子模型;最后基于保留子模型以双重留一法实施组合预测.以取代苯胺和苯酚类化合物对大型溞的QSAR实例验证表明:新方法在所有参比模型中预测精度最高,且能更精细地反映描述符与化合物毒性间的非线性关系,具结构风险最小、非线性、适于小样本,能有效克服过拟合、维数灾和局极小,非线性筛选描述符和子模型,非线性组合预测,自动选择最优核函数及其相应参数,泛化推广能力优异、预测精度高等诸多优点,在QSAR研究中有广泛应用前景.  相似文献   

2.
为提高小样本定量构效关系(QSAR)预测精度,基于支持向量机全局核函数与局部核函数提出了一种新的建模方法:先依不同核函数筛选描述符,再依保留描述符构建支持向量机回归(SVR)子模型.子模型预测活性值与实验值组成混合样本.以均方误差(MSE)最小为原则,对混合样本再次基于SVR实施核函数寻优与子模型筛选,基于最优核函数和保留子模型以留一法完成预测.对2个小样本体系的QSAR研究表明,该方法兼具局部核函数和全局核函数的优点,既有较强的学习能力,又有较好的推广能力,预测精度高,稳定性好.  相似文献   

3.
ω-芋螺毒素属于海洋生物活性多肽,由24-31个氨基酸残基组成.特异性作用于电压敏感的钙离子通道(VGCCs),能够直接开发成药物或作为先导化合物进行新药开发.本文应用新型氨基酸残基结构描述符cscales和遗传偏最小二乘算法,对ω-芋螺毒素进行定量构效关系(QSAR)研究,并设计、构建了容量为2244个化合物的N-型和P/Q-型VGCC拮抗剂虚拟组合多肽库,然后分别采用QSAR模型预测和相似性搜索方法对组合多肽库进行了虚拟筛选.研究结果表明,建立的N-型和P/Q-型VGCC拮抗剂QSAR模型均具有较好的预测能力,交叉验证相关系数(CV-r2)均大于0.89.主成分分析和聚类分析结果表明,虚拟组合多肽库中化合物具有较好的结构多样性和差异性.通过虚拟筛选,得到了具有高预测活性的6个N-型和19个P/Q-型钙离子通道拮抗剂,为进一步的合成和活性评价奠定了理论基础.同时,本文建立的多肽QSAR预测模型和虚拟筛选策略,为其它多肽类化合物的定量构效关系研究和虚拟筛选提供了参考.  相似文献   

4.
丛湧  薛英 《物理化学学报》2013,29(8):1639-1647
对89 个苯并异噻唑和苯并噻嗪类丙型肝炎病毒(HCV) NS5B聚合酶非核苷抑制剂进行了定量构效关系(QSAR)研究. 采用遗传算法组合偏最小二乘(GA-PLS)和线性逐步回归分析(LSRA)两种特征选择方法选择最优描述符子集, 然后建立多元线性回归和偏最小二乘线性回归模型. 并首次尝试使用遗传算法耦合支持向量机方法(GA-SVM)对两种特征选择方法所选的描述符子集分别建立非线性支持向量机回归模型. 三种机器学习方法所建模型均得到比较满意的预测效果. 采用LSRA所选的6 个描述符建立的三个QSAR模型对于测试集的相关系数为0.958-0.962, GA-SVM法给出最好的预测精度(0.962). 采用GA-PLS所选的7个描述符建立的三个QSAR模型对于测试集的相关系数为0.918-0.960, 偏最小二乘回归模型的结果最好(0.960). 本工作提供了一种有效的方法来预测丙型肝炎病毒抑制剂的生物活性, 该方法也可以扩展到其他类似的定量构效关系研究领域.  相似文献   

5.
ω-芋螺毒素属于海洋生物活性多肽, 由24-31 个氨基酸残基组成. 特异性作用于电压敏感的钙离子通道(VGCCs), 能够直接开发成药物或作为先导化合物进行新药开发. 本文应用新型氨基酸残基结构描述符cscales和遗传偏最小二乘算法, 对ω-芋螺毒素进行定量构效关系(QSAR)研究, 并设计、构建了容量为2244 个化合物的N-型和P/Q-型VGCC拮抗剂虚拟组合多肽库, 然后分别采用QSAR模型预测和相似性搜索方法对组合多肽库进行了虚拟筛选. 研究结果表明, 建立的N-型和P/Q-型VGCC拮抗剂QSAR模型均具有较好的预测能力, 交叉验证相关系数(CV-r2)均大于0.89. 主成分分析和聚类分析结果表明, 虚拟组合多肽库中化合物具有较好的结构多样性和差异性. 通过虚拟筛选, 得到了具有高预测活性的6 个N-型和19 个P/Q-型钙离子通道拮抗剂, 为进一步的合成和活性评价奠定了理论基础. 同时, 本文建立的多肽QSAR预测模型和虚拟筛选策略, 为其它多肽类化合物的定量构效关系研究和虚拟筛选提供了参考.  相似文献   

6.
基于支持向量机的高维特征非线性快速筛选与肽QSAR建模   总被引:1,自引:0,他引:1  
以氨基酸的531个物理化学性质参数直接表征肽的结构, 基于支持向量回归发展了一种新的高维特征非线性快速筛选方法, 将其应用于苦味二肽和血管紧张素转化酶抑制剂2个肽体系的定量序效关系(QSAR)建模, 各筛选获得10个意义明确的保留描述子. 以保留描述子建立支持向量回归模型, 其拟合精度、留一法交叉测试精度和外部预测精度较文献报道结果均有较大幅度提升, 优势明显; 对所建模型进行了非线性回归显著性测验、单因子相对重要性显著性测验和单因子效应分析, 增强了模型的可解释性. 新方法在肽、蛋白质QSAR建模等高维数据回归预测领域有广泛应用前景.  相似文献   

7.
为了能更深入地认识含氟新化合物作为农药的生物活性和其结构间的关系,建立有意义的构效关系模型,我们用经典QSAR(定量构效关系)方法研究了三十三个含氟化合物的两种不同的生物活性与结构的关系,其对抗黄瓜疫病活性模型有很好的解释能力和预测能力,并根据这个模型设计了一些新的活性结构.而对抑制西瓜白绢病的活性数据的处理未能获得理想模型.通过这一工作确立了先应用聚类等定性分析方法,再用多元统计分析方法作更深入研究的QSAR研究模式.  相似文献   

8.
随着大量分子描述符应用于QSAR/QSPR,如何筛选出具有良好稳定性和预测能力的描述符集,成为亟待解决的一个瓶颈问题.将63个有机化合物的1664个描述符经过初步预选后,利用偏最小乘(PLS)方法进行变量筛选,获得42个重要描述符;随机选择43个有机物,针对透聚乙烯膜性能进行训练研究,得优良估计能力和良好稳定性模型(A=6,r2=0.9647,RMSE=0.213,q2=0.8364,RMSV=0.467);对模型外部20个有机物进行预测,表明模型具有良好预测能力(rp2=0.9306,RMSP=0.326).PLS变量筛选法可以快速有效地筛选与活性密切相关的重要描述符,进而构建具有良好稳定性和预测能力的QSAR模型.  相似文献   

9.
应用密度泛函理论(DFT)在杂化泛函B3LYP和基组6-311G(d,p)水平上对57个标题化合物进行结构优化,计算获得化合物的量化和理化参数,采用最佳变量子集回归构建了化合物对梨形四膜虫的毒性与描述符之间的定量结构-活性关系(QSAR)模型。所建最佳三元QSAR模型的复相关系数R2为0.915,留一法(leave-one-out,LOO)交互检验复相关系数Rcv2为0.891;用随机筛选出的19个预测集样本进行外部预测,所得外部预测集交互检验系数Qext2为0.821,QSAR模型具有较好的稳定性和较强的预测能力。模型结果表明影响毒性的主要因素有化合物最低空轨道能、正辛醇-水分配系数及最负非氢原子净电荷。对模型应用域(AD)进行了表征,所建模型可用于应用域内苯胺类化合物对梨形四膜虫毒性的预测。  相似文献   

10.
B-Raf激酶在促分裂素原活化蛋白激酶(MAPK)信号转导通路中起着重要作用,已被确定为癌症治疗非常有吸引力的靶标.新型高效B-Raf抑制剂的开发成为癌症治疗的一个热门研究领域.本文以结构多样的B-Raf II型抑制剂为研究对象,联合应用分子对接和定量构效关系(QSAR)模型研究其定量构效关系去探讨抑制活性的起源.两个主题作为研究重点:生物活性构象和描述符.首先对分子对接方法(Glide、Gold、LigandFit、Cdocker和Libdock)进行准确性评价,后将研究的对象分子对接到B-Raf活性位点并获得生物活性构象.基于准确的对接结果,计算得到16个打分评价函数和21个能量描述符,以此构建定量构效关系模型. QSAR结果表明模型具有高度精确的拟合和强的预测能力(模型M1: r2 = 0.852, r(CV)2 = 0.790, rpre2 = 0.864;模型M2: r2 = 0.738, r(CV)2 = 0.812, rpre2 = 0.8605).同时探讨了对抑制活性有重要影响的描述符,结果表明打分评价函数(G_Score, -ECD, Dock_Score, PMF)与能量描述符(S(hb_ext), DE(int), Emodel)对抑制活性影响非常大.通过虚拟筛选和QSAR模型理论预测,一些新的具有潜在抑制活性的化合物作为B-Raf II型抑制剂被获得.上述信息对于进一步设计新颖高效的B-Raf II型抑制剂提供了有用的指导.  相似文献   

11.
12.
13.
14.
15.
16.
17.
18.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号