首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
构建147个有机物分子结构与其热导率值之间的定量结构-性质关系(QSPR)模型, 探讨影响有机物热导率的结构因素. 以147个化合物作为样本集, 随机选择118个作为训练集, 29个作为测试集. 应用CODESSA软件计算了组成、拓扑、几何、静电和量子化学等描述符, 通过启发式方法(HM)筛选得到5个结构参数并建立线性回归模型; 用所选5个结构参数作为支持向量机(SVM)的输入, 建立非线性的支持向量机回归模型. 预测结果表明: 支持向量机回归模型的性能(复相关系数R2=0.9240)虽略低于启发式回归模型的性能(R2=0.9267), 但是支持向量机方法预测性能(R2=0.9682)高于启发式方法的预测性能(R2=0.9574), 对于QSPR模型来说, 预测性能更重要. 因此, 总体来说支持向量机方法优于启发式方法. 支持向量机方法和启发式方法的提出为工程上提供了一种根据分子结构预测有机物热导率的新方法.  相似文献   

2.
基于支持向量机方法的HERG钾离子通道抑制剂分类模型   总被引:1,自引:0,他引:1  
对human ether-a-gō-gō related genes(HERG)钾离子通道(钾通道)抑制剂,计算了表征分子组成、电荷分布、拓扑、几何结构及物理化学性质等特征的1559个分子描述符.采用Fischer Score(F-Score)排序过滤和Monte Carlo模拟退火法相结合从中筛选与HERG钾通道抑制剂分类相关的分子描述符.采用支持向量机(SVM)方法,分别以IC50=1.0、10.0μmol·L-1为分类标准,建立了三个分类预测模型.对367个训练集分子,用五重交叉验证.得到正、负样本的平均预测精度分别为84.8%-96.6%、80.7%-97.7%,其总的平均预测精度为87.1%-97.2%,优于其它文献报道结果.对97个外部测试集分子,所建三个模型的总样本预测精度在67.0%-90.1%之间,接近或优于其它文献报道结果.  相似文献   

3.
分别以支持向量机(SVM)和KStar方法为基础, 构建了代谢产物的分子形状判别和代谢反应位点判别的嵌套预测模型. 分子形状判别模型是以272个分子为研究对象, 计算了包括分子拓扑、二维自相关、几何结构等在内的1280个分子描述符, 考查了支持向量机、决策树、贝叶斯网络、k最近邻这四种机器学习方法建立分类预测模型的准确性. 结果表明, 支持向量机优于其他方法, 此模型可用于预测分子能否被细胞色素P450酶催化发生氧脱烃反应. 代谢反应位点判别模型以538个氧脱烃反应代谢位点为研究对象, 计算了表征原子能量、价态、电荷等26个量子化学特征, 比较了决策树、贝叶斯网络、KStar、人工神经网络建模的准确率. 结果显示, KStar模型的准确率、敏感性、专一性均在90%以上, 对分子形状判别模型筛选出的分子, 此模型能较好地判断出哪个C―O键发生断裂. 本文以15个代谢反应明确的中药分子为验证集, 验证模型准确性, 研究结果表明基于SVM和KStar的嵌套预测模型具有一定的准确性, 有助于开展中药分子氧脱烃代谢产物的预测研究.  相似文献   

4.
基于地统计学与支持向量回归的QSAR建模   总被引:4,自引:0,他引:4  
基于主成分分析(PCA)、地统计学(GS)和支持向量回归(SVR), 提出了一种新的定量构效关系(QSAR)个体化预测方法——Weight-PCA-GS-SVR. 其基本思路是: 先以PCA降维并消除自变量间的信息冗余, 继以SVR经非线性主成分筛选去除与因变量无关的主成分, 再以保留主成分计算样本间的加权距离, 然后以高维GS确定公用变程; 每一个待测样本都以自身为中心从训练集中找出加权距离小于公用变程的私有k个近邻, 以SVR训练建模完成个体化预测. Weight-PCA-GS-SVR从行、列两个方向对模型进行了优化, 为自变量提供了一种新的加权方法, 为解决最优k近邻选择难题提供了新的思路, 并具有SVR原来的优点. 经3个化合物活性实例数据集验证, 新方法在所有参比模型中预测精度最高, 且明显优于文献报道结果, Weight-PCA-GS-SVR在QSAR等回归预测领域有较广泛的应用前景.  相似文献   

5.
海水中铁(Ⅲ)-二元有机酸盐配合物的光化学反应研究   总被引:1,自引:0,他引:1  
采用实验室模拟的方法研究了高压汞灯模拟日光照射下铁(Ⅲ)-二元有机酸盐配合物在天然海水中的光化学反应.结果发现,在二元有机酸盐配体的存在下,铁(Ⅲ)发生光化学反应生成还原态的铁(Ⅲ),铁(Ⅲ)会被溶液中的氧再氧化为铁(Ⅲ).铁(Ⅲ)的光还原反应速率受到配体浓度、pH、光强以及温度的影响.在二元有机酸与Fe(Ⅲ)浓度配比大于2的情况下,Fe(Ⅲ)-二元有机酸盐配合物的光还原反应初期铁(Ⅲ)浓度的增长符合一级动力学反应规律,100min后浓度趋于稳定,方程式为[Fe(Ⅲ)]t=kOA[OA]·[Fe(Ⅲ)]ini×[1-exp{-(kOA[OA]+kox)t}]/(kOA[OA]+kox).光强升高和pH降低都能加快光还原反应速率,而改变温度则基本上对光还原反应速率无影响,证明铁(Ⅲ)的光还原反应为自由基引发的电子转移过程.  相似文献   

6.
基于支撑向量机方法的有机化合物的生成Gibbs自由能的预测;支撑向量机;多元线形回归;吉布斯自由能  相似文献   

7.
分别采用支持向量学习机、人工神经网络、调节性逻辑回归和K-最临近等机器学习方法对761个二氢叶酸还原酶抑制剂建立了其活性分类预测模型. 采用组成描述符和拓扑描述符表征抑制剂的分子结构及物理化学性质, 使用Kennard-Stone方法进行训练集的设计, 并用Metropolis Monte Carlo模拟退火方法作变量选择. 结果表明, 支持向量学习机优于其它机器学习方法, 所得到的最优模型具有较好的预测结果, 其预测正确率为91.62%. 说明通过合适的训练集设计及变量选择, 支持向量学习机方法可以很好地用于二氢叶酸还原酶抑制剂的活性分类预测.  相似文献   

8.
9.
采用线性渐变滤光片(Linear variable filter, LVF),优化设计高性能、便携式的人体血液成分近红外检测设备,研究了支持向量回归(Support vector regression, SVR)模型对人体血红蛋白(Hemoglobin, Hb)的预测能力及稳定性,以实现贫血疾病的无创诊断.无创采集100位志愿者食指前端光谱信息并划分定标集、验证集1和2.应用网格搜索方法优选惩罚参数与核函数参数c=5.28, g=0.33,用以建立稳健的SVR模型.随后,分别对验证集1和2中Hb水平进行定量分析.实验结果表明: 预测标准偏差(RMSEP) 分别为10.20 g/L和10.85 g/L,相对预测标准偏差(R-RMSEP) 为6.85%和7.48%,测量精度较高且SVR模型对不同样品的适应性较强,基本满足临床检测要求.基于SVR算法自行设计的LVF型近红外光谱检测设备在贫血症的无创诊断中有着良好的应用前景.  相似文献   

10.
11.
支持向量机用于多氯代萘毒性的定量构效研究   总被引:2,自引:0,他引:2  
用偏最小二乘法(PLS)和留一交叉验证从90多个量子化学参数中筛选出极化率、分子量、部分原子上的净电荷、静电势等作为描述符,应用支持向量机(SVM)对20个多氯代萘同系物的三组毒性数据分别建立了定量构效关系模型.所得模型的交叉验证相关系数的平方分别为0.805、0.890、0.936.并将偏最小二乘法建模所得结果与之进行比较,结果表明,SVM预报能力优于PLS.  相似文献   

12.
13.
Support vector machines in water quality management   总被引:1,自引:0,他引:1  
Support vector classification (SVC) and regression (SVR) models were constructed and applied to the surface water quality data to optimize the monitoring program. The data set comprised of 1500 water samples representing 10 different sites monitored for 15 years. The objectives of the study were to classify the sampling sites (spatial) and months (temporal) to group the similar ones in terms of water quality with a view to reduce their number; and to develop a suitable SVR model for predicting the biochemical oxygen demand (BOD) of water using a set of variables. The spatial and temporal SVC models rendered grouping of 10 monitoring sites and 12 sampling months into the clusters of 3 each with misclassification rates of 12.39% and 17.61% in training, 17.70% and 26.38% in validation, and 14.86% and 31.41% in test sets, respectively. The SVR model predicted water BOD values in training, validation, and test sets with reasonably high correlation (0.952, 0.909, and 0.907) with the measured values, and low root mean squared errors of 1.53, 1.44, and 1.32, respectively. The values of the performance criteria parameters suggested for the adequacy of the constructed models and their good predictive capabilities. The SVC model achieved a data reduction of 92.5% for redesigning the future monitoring program and the SVR model provided a tool for the prediction of the water BOD using set of a few measurable variables. The performance of the nonlinear models (SVM, KDA, KPLS) was comparable and these performed relatively better than the corresponding linear methods (DA, PLS) of classification and regression modeling.  相似文献   

14.
15.
为预测埃坡霉素类衍生物的抗癌活性, 定义了一套表征分子形状的描述符, 即K阶形状参数, 并计算了67个表征分子的电子、拓扑和几何结构的分子描述符. 描述符经遗传算法筛选, 用于建立基于支持向量学习机(SVM)的抗癌活性分类模型; 用留一法和5重交叉验证法对SVM模型参数进行了优化. 结果表明模型具有较高的预测性且两种方法得到相近结果, 交叉验证的预测正确率达80.6%; 经筛选后的描述符有30个, 其中含有5个K阶形状参数, 这些描述符对埃坡霉素类衍生物的抗癌活性的模型建立具有比较重要的作用.  相似文献   

16.
基于支持向量机的高维特征非线性快速筛选与肽QSAR建模   总被引:1,自引:0,他引:1  
以氨基酸的531个物理化学性质参数直接表征肽的结构, 基于支持向量回归发展了一种新的高维特征非线性快速筛选方法, 将其应用于苦味二肽和血管紧张素转化酶抑制剂2个肽体系的定量序效关系(QSAR)建模, 各筛选获得10个意义明确的保留描述子. 以保留描述子建立支持向量回归模型, 其拟合精度、留一法交叉测试精度和外部预测精度较文献报道结果均有较大幅度提升, 优势明显; 对所建模型进行了非线性回归显著性测验、单因子相对重要性显著性测验和单因子效应分析, 增强了模型的可解释性. 新方法在肽、蛋白质QSAR建模等高维数据回归预测领域有广泛应用前景.  相似文献   

17.
18.
中药材三七提取液近红外光谱的支持向量机回归校正方法   总被引:34,自引:0,他引:34  
提出近红外光谱的支持向量机回归校正建模方法.以中药材三七渗漉提取液为实际分析对象,对其近红外光谱数据进行预处理和主成分分析后,用支持向量机回归算法建立人参皂苷Rg1,Rb1和Rd以及三七总皂苷的近红外光谱校正模型.以Rg1,Rb1和Rd的HPLC测定值及三七总皂苷的比色法测定值为参照,将本文方法与偏最小二乘回归和径向基神经网络建模方法相比较,结果表明,本文所建模型的预测准确性优于后两者,可推广应用于中药提取过程的近红外光谱分析.  相似文献   

19.
流感是一种主要的呼吸道传染病, 在普通人群中有着较高的发病率, 而对于一些年老和高危病人还有较高的死亡率. 研究显示抑制神经氨酸苷酶(NA)可以阻断病毒RNA复制, 因此NA是有效治疗H1N1型流感病毒的重要药物靶标. 通过计算机方法进行虚拟筛选和预测NA抑制剂已经变得越来越重要. 针对酶活性位点进行基于结构的合理药物设计, 开发H1N1 病毒神经氨酸苷酶抑制剂, 已成为药物研究的热点之一. 本文通过多种机器学习方法(支持向量机(SVM)、k-最近相邻法(k-NN)和C4.5决策树(C4.5DT))对已知的神经氨酸苷酶抑制剂(NAIs)与非神经氨酸苷酶抑制剂(non-NAIs)建立分类预测模型. 其中227个结构多样性化合物(72个NAIs与155个non-NAIs)被用于测试分类预测系统, 并用递归变量消除法选择与神经氨酸苷酶抑制剂分类相关的性质描述符以提高预测精度. 本研究对独立验证集的总预测精度为75.9%-92.6%, NA 抑制剂的预测精度为64.3%-78.6%, 非H1N1抑制剂的预测精度为77.5%-97.5%. SVM法给出最好的总预测精度(92.6%). 本研究表明支持向量机等机器学习方法可以有效预测未知数据集中潜在的NA抑制剂, 并有助于发现与其相关的分子描述符.  相似文献   

20.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号