首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
构建147个有机物分子结构与其热导率值之间的定量结构-性质关系(QSPR)模型, 探讨影响有机物热导率的结构因素. 以147个化合物作为样本集, 随机选择118个作为训练集, 29个作为测试集. 应用CODESSA软件计算了组成、拓扑、几何、静电和量子化学等描述符, 通过启发式方法(HM)筛选得到5个结构参数并建立线性回归模型; 用所选5个结构参数作为支持向量机(SVM)的输入, 建立非线性的支持向量机回归模型. 预测结果表明: 支持向量机回归模型的性能(复相关系数R2=0.9240)虽略低于启发式回归模型的性能(R2=0.9267), 但是支持向量机方法预测性能(R2=0.9682)高于启发式方法的预测性能(R2=0.9574), 对于QSPR模型来说, 预测性能更重要. 因此, 总体来说支持向量机方法优于启发式方法. 支持向量机方法和启发式方法的提出为工程上提供了一种根据分子结构预测有机物热导率的新方法.  相似文献   

2.
随着大量分子描述符应用于QSAR/QSPR,如何筛选出具有良好稳定性和预测能力的描述符集,成为亟待解决的一个瓶颈问题.将63个有机化合物的1664个描述符经过初步预选后,利用偏最小乘(PLS)方法进行变量筛选,获得42个重要描述符;随机选择43个有机物,针对透聚乙烯膜性能进行训练研究,得优良估计能力和良好稳定性模型(A=6,r2=0.9647,RMSE=0.213,q2=0.8364,RMSV=0.467);对模型外部20个有机物进行预测,表明模型具有良好预测能力(rp2=0.9306,RMSP=0.326).PLS变量筛选法可以快速有效地筛选与活性密切相关的重要描述符,进而构建具有良好稳定性和预测能力的QSAR模型.  相似文献   

3.
以非氢原子自身及非氢原子之间的关系为分子结构描述符,对35个醛酮类化合物进行了结构表征。采用多元线性回归和偏最小二乘回归的方法建立了该类化合物结构与色谱保留指数之间的关系模型,两模型的复相关系数(R)分别为0.987和0.981,标准偏差(SD)分别为25.259和32.240。采用"留一法"交互检验和外部样本预测的方法对模型的稳健性和预测能力进行了评价,交互检验的复相关系数(RCV)分别为0.981和0.958,标准偏差(SDCV)分别为34.292和39.652;外部预测的复相关系数(Rtest)分别为0.991和0.990,标准偏差(SDtest)分别为25.749和26.776。结果表明所构建的分子结构描述符能够恰当表现该类化合物结构特征,所建模型具有良好的稳健性和预测能力。  相似文献   

4.
基于定量结构-性质关系方法预测氨基酸的比旋光度   总被引:1,自引:0,他引:1  
运用定量结构-性质关系(quantitative structure-property relationsh ip,QSPR)方法对人体必需的氨基酸比旋光度进行了预测,同时运用交互检验(LOO)方法对所建立的模型进行了检验。应用启发式算法对描述符进行筛选并建立线性回归模型,所建立的模型的相关系数(R2)为0.918,但分别用 1、-1代表左旋和右旋的分子手性后,重新建立多元线性回归模型,其相关系数(R2)变为0.970。本研究所建立的QSPR模型为预测手性化合物比旋光度提供了一种有效的新方法。  相似文献   

5.
从20种天然氨基酸的41个randic molecular profiles非零描述符、44个eigenvalue based indices非零描述符和47个walk and path counts非零描述符分别进行主成分分析,得出一种新的氨基酸描述符-SVREW。将其应用于血管紧张素转化酶(ACE)抑制二肽和ACE抑制三肽、苦味二肽和苦味四肽、后叶催产素类似物、HLA-A*0201限制性CTL表位肽的结构表征,应用多元线性回归(MLR)建立定量构效关系模型,同时采用内部与外部双重验证的方法验证模型的稳定性。所建ACE抑制二肽、ACE抑制三肽、苦味二肽、苦味四肽、后叶催产素类似物、HLA-A*0201限制性CTL表位肽的模型复相关系数(R2cum)分别为0.994,0.797,0.948,0.878,0.686,0.720;留一法交互校验复相关系数(R2cv)分别为0.955,0.859,0.879,0.958,0.796,0.843;外部样本校验相关系数(Q2ext)分别为0.990,0.954,0.890,0.950,0.748,0.773。经研究表明SVREW描述符用于肽分子结构表征所建模型的稳定性与预测能力均较好,有望成为多肽定量构效关系研究中一种有效的结构表征方法,可对新药物的发现和研究提供指导。  相似文献   

6.
烃基酚类化合物对四膜虫毒性的定量结构-活性相关研究   总被引:2,自引:0,他引:2  
在B3LYP/6-311G*水平上全优化计算了41个烃基苯酚的量子化学参数,连同取代烃基位置编码参数共同表征有机物的分子结构,应用基于预测的模型变量选择方法(VSMP)选择描述子最佳子集,建立了偶极距(μ)和分子平均极化率(α)与烃基苯酚对梨形四膜虫水生毒性pIGC50 两变量线性QSAR模型,模型的相关系数r为0.9434,均方根误差RMSE为0.2548,LOO交叉验证相关系数Q为0.9170,均方根误差RMSV为0.3066;为检验模型的稳定性和预测能力,将41个样本分作了奇数集和偶数集,分别建立了模型,并用y-Randomization方法对全部样本、奇数集和偶数集所建立的模型进行了检验;建立的奇数集和偶数集模型均满足Tropsha研究小组建议的预测能力标准.  相似文献   

7.
丛湧  薛英 《物理化学学报》2013,29(8):1639-1647
对89 个苯并异噻唑和苯并噻嗪类丙型肝炎病毒(HCV) NS5B聚合酶非核苷抑制剂进行了定量构效关系(QSAR)研究. 采用遗传算法组合偏最小二乘(GA-PLS)和线性逐步回归分析(LSRA)两种特征选择方法选择最优描述符子集, 然后建立多元线性回归和偏最小二乘线性回归模型. 并首次尝试使用遗传算法耦合支持向量机方法(GA-SVM)对两种特征选择方法所选的描述符子集分别建立非线性支持向量机回归模型. 三种机器学习方法所建模型均得到比较满意的预测效果. 采用LSRA所选的6 个描述符建立的三个QSAR模型对于测试集的相关系数为0.958-0.962, GA-SVM法给出最好的预测精度(0.962). 采用GA-PLS所选的7个描述符建立的三个QSAR模型对于测试集的相关系数为0.918-0.960, 偏最小二乘回归模型的结果最好(0.960). 本工作提供了一种有效的方法来预测丙型肝炎病毒抑制剂的生物活性, 该方法也可以扩展到其他类似的定量构效关系研究领域.  相似文献   

8.
采用化合物非氢原子固有特征值和非氢原子之间的电性作用为结构描述符,对红葡萄酒香气成分中的65个化合物进行了结构表征。通过多元线性回归(MLR)和逐步回归(SMR)方法建立了该类化合物结构-色谱保留时间关系(QSRR)模型。模型的复相关系数(R)为0.907,标准偏差(SD)为4.507。用留一法(LOO)交互检验对模型进行了评价,得到的复相关系数(RCV)为0.849,标准偏差(SDCV)为5.656。结果表明,采用的分子结构描述符能够较好地表现该类化合物结构特征,所建模型具有较好的预测能力和稳定性。  相似文献   

9.
与传统的非甾体类消炎药相比,选择性环氧化酶-2抑制剂具有无胃肠道粘膜损伤,溃疡和肾功能障碍等严重的副作用,设计选择性环氧化酶-2抑制剂具有重要意义。本文用支持矢量学习机和神经网络两种机器学习方法建立选择性环氧化酶-2抑制剂的活性预测模型,以期为选择性环氧化酶-2抑制剂药物的合成提供先导化合物。我们将467个环氧化酶-2抑制剂用Kennard-Stone方法分为训练集,验证集和独立测试集,对每一抑制剂分子我们计算了463个包含组成描述符和拓扑描述符的分子描述符来表征其分子结构,并通过F-Score方法选取最重要的分子描述符用于分类模型的建立。结果表明,SVM方法通过变量筛选后具有很好的预测能力,其预测正确率达到93.30%。  相似文献   

10.
通过比较分子力场分析方法(Co MFA)研究取代喹啉类化合物对金黄色葡萄球菌抑菌活性(p M)的三维定量结构-活性相关(3D-QSAR)。12个化合物建立了预测模型,7个化合物作为验证集(含模板分子)。训练集的Co MFA模型显示立体场、静电场对生物活性贡献依次为49.8%、50.2%。该模型的交叉验证相关系数R2cv=0.650,非交叉验证相关系数R2=0.918,对测试集中的7个化合物的生物活性进行了预测,显示出较强的稳定性和良好的预测能力。通过分析Co MFA三维等势图发现,在取代喹啉类化合物抑菌机理中,R4取代基的强吸电性起主要作用,其次是其他取代基的疏水性作用。应用上述规律进行分子设计,获得了3个在理论上具有较高抑菌活性的新的取代喹啉衍生物,期待实验的验证。  相似文献   

11.
12.
13.
14.
15.
Abstract

Separation of amino acids (AAs) and their simple and inexpensive determination/identification is an interesting topic in biological and protein science, different food industries, and drug factories. Also, the presentation of the chromatographic behavior of compounds in a predictive model can be effective to estimate the structural/chemical properties of analyte and mobile phases. In this work for the first time, retardation factor (RF) of 42 AAs in reversed-phase thin layer chromatography (RP-TLC) was modeled. Acetonitrile-sodium azide solution and 1,2 dioxane-sodium azide solution were two mobile phases which have been studied in this work. Results showed that the values of RF are correlated with the structural properties of AAs and these properties had some similarities and differences in two noted mobile phases. For the TLC data in two mobile phases, five parametric linear models were suggested (R2train = 0.93 and 0.97; R2test = 0.93 and 0.99). The models were also evaluated with different statistical approaches. It was shown that increasing the sum of geometrical distances between N and O in AAs causes decreasing their RF in RP-TLC using both mobile phases. Other structural effects of AAs on their separation in the desired RP-TLC system were also discussed.  相似文献   

16.
17.
This study performed an analysis of the influence of the training and test set rational selection on the quality and predictively of the quantitative structure–activity relationship (QSAR) model. The study was carried out on three different datasets of Influenza Neuraminidase (H1N1) inhibitors. The three datasets were divided into training and test sets using three rational selection methods: based on k-means, Kennard–Stone algorithm and Activity and the results were compared with Random selection. Then, a total of 31,490 mathematical models were developed and those models that presented a determination coefficient higher than: r2train > 0.8, r2loo > 0.7, r2test > 0.5 and minimum standard deviation (SD) and minimum root-mean square error (RMS) were selected. The selected models were validated using the internal leave-one-out method and the predictive capacity was evaluated by the external test set. The results indicate that random selection could lead to erroneous results. In return, a rational selection allows for obtaining more reliable conclusions. The QSAR models with major predictive power were found using the k-means algorithm and selection by activity.  相似文献   

18.
19.
20.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号