首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
2.
构建147个有机物分子结构与其热导率值之间的定量结构-性质关系(QSPR)模型, 探讨影响有机物热导率的结构因素. 以147个化合物作为样本集, 随机选择118个作为训练集, 29个作为测试集. 应用CODESSA软件计算了组成、拓扑、几何、静电和量子化学等描述符, 通过启发式方法(HM)筛选得到5个结构参数并建立线性回归模型; 用所选5个结构参数作为支持向量机(SVM)的输入, 建立非线性的支持向量机回归模型. 预测结果表明: 支持向量机回归模型的性能(复相关系数R2=0.9240)虽略低于启发式回归模型的性能(R2=0.9267), 但是支持向量机方法预测性能(R2=0.9682)高于启发式方法的预测性能(R2=0.9574), 对于QSPR模型来说, 预测性能更重要. 因此, 总体来说支持向量机方法优于启发式方法. 支持向量机方法和启发式方法的提出为工程上提供了一种根据分子结构预测有机物热导率的新方法.  相似文献   

3.
支持向量机分类和回归用于肽的QSAR研究   总被引:4,自引:0,他引:4  
周鹏  曾晖  李波  周原  李志良 《化学通报》2006,69(5):342-346
使用支持向量机技术对两类肽化合物体系进行了分类和回归研究,并将其系统地与K最邻近法、多元线性回归、偏最小二乘、人工神经网络进行了比较。结果表明,对于小样本、非线性问题,支持向量机具有较强的稳定性能及泛化能力,在大多数情况下能够得到优于传统方法的建模效果。对于分类问题,支持向量机对训练集和测试集都达到了100%的分类正确率;对于回归问题,支持向量机虽对训练集样本拟合效果略低于人工神经网络,但对外部测试集却表现出较强的预测能力。  相似文献   

4.
5.
6.
基于地统计学与支持向量回归的QSAR建模   总被引:4,自引:0,他引:4  
基于主成分分析(PCA)、地统计学(GS)和支持向量回归(SVR), 提出了一种新的定量构效关系(QSAR)个体化预测方法——Weight-PCA-GS-SVR. 其基本思路是: 先以PCA降维并消除自变量间的信息冗余, 继以SVR经非线性主成分筛选去除与因变量无关的主成分, 再以保留主成分计算样本间的加权距离, 然后以高维GS确定公用变程; 每一个待测样本都以自身为中心从训练集中找出加权距离小于公用变程的私有k个近邻, 以SVR训练建模完成个体化预测. Weight-PCA-GS-SVR从行、列两个方向对模型进行了优化, 为自变量提供了一种新的加权方法, 为解决最优k近邻选择难题提供了新的思路, 并具有SVR原来的优点. 经3个化合物活性实例数据集验证, 新方法在所有参比模型中预测精度最高, 且明显优于文献报道结果, Weight-PCA-GS-SVR在QSAR等回归预测领域有较广泛的应用前景.  相似文献   

7.
周鹏  梅虎  田菲菲  李志良 《应用化学》2006,23(12):1410-0
支持向量机;定量构性相关;高聚物;折射率  相似文献   

8.
9.
基于支持向量机的高维特征非线性快速筛选与肽QSAR建模   总被引:1,自引:0,他引:1  
以氨基酸的531个物理化学性质参数直接表征肽的结构, 基于支持向量回归发展了一种新的高维特征非线性快速筛选方法, 将其应用于苦味二肽和血管紧张素转化酶抑制剂2个肽体系的定量序效关系(QSAR)建模, 各筛选获得10个意义明确的保留描述子. 以保留描述子建立支持向量回归模型, 其拟合精度、留一法交叉测试精度和外部预测精度较文献报道结果均有较大幅度提升, 优势明显; 对所建模型进行了非线性回归显著性测验、单因子相对重要性显著性测验和单因子效应分析, 增强了模型的可解释性. 新方法在肽、蛋白质QSAR建模等高维数据回归预测领域有广泛应用前景.  相似文献   

10.
应用启发式算法(HM)和支持向量机算法(SVM)建立了88种醛类化合物对大鼠急性毒性的定量构效关系模型。应用ChemOffice2004软件进行化合物的结构输入,利用半经验方法进行分子结构优化,在CODDESA软件中计算出组成、拓扑、几何、电子和量子化学参数。并用启发式方法筛选出相对阳性电荷、氧原子数量、碳原子的最小亲核反应指数、双键相对数量、碳原子数量、碳氢键之间的最大交换能量、最大σ-σ键序和双键数量8个参数,在此基础上应该多元线性回归和支持向量机方法建立QSPR模型。两种方法均得到了较好的结果,HM和SVM的交互检验的相关系数分别为0.90和0.93;通过对模型的稳定性和预测能力比较,SVM建立的QSAR模型能够更好地预测醛类化合物对大鼠急性毒性LD50。  相似文献   

11.
海水中铁(Ⅲ)-二元有机酸盐配合物的光化学反应研究   总被引:1,自引:0,他引:1  
采用实验室模拟的方法研究了高压汞灯模拟日光照射下铁(Ⅲ)-二元有机酸盐配合物在天然海水中的光化学反应.结果发现,在二元有机酸盐配体的存在下,铁(Ⅲ)发生光化学反应生成还原态的铁(Ⅲ),铁(Ⅲ)会被溶液中的氧再氧化为铁(Ⅲ).铁(Ⅲ)的光还原反应速率受到配体浓度、pH、光强以及温度的影响.在二元有机酸与Fe(Ⅲ)浓度配比大于2的情况下,Fe(Ⅲ)-二元有机酸盐配合物的光还原反应初期铁(Ⅲ)浓度的增长符合一级动力学反应规律,100min后浓度趋于稳定,方程式为[Fe(Ⅲ)]t=kOA[OA]·[Fe(Ⅲ)]ini×[1-exp{-(kOA[OA]+kox)t}]/(kOA[OA]+kox).光强升高和pH降低都能加快光还原反应速率,而改变温度则基本上对光还原反应速率无影响,证明铁(Ⅲ)的光还原反应为自由基引发的电子转移过程.  相似文献   

12.
13.
基于支持向量机方法的HERG钾离子通道抑制剂分类模型   总被引:1,自引:0,他引:1  
对human ether-a-gō-gō related genes(HERG)钾离子通道(钾通道)抑制剂,计算了表征分子组成、电荷分布、拓扑、几何结构及物理化学性质等特征的1559个分子描述符.采用Fischer Score(F-Score)排序过滤和Monte Carlo模拟退火法相结合从中筛选与HERG钾通道抑制剂分类相关的分子描述符.采用支持向量机(SVM)方法,分别以IC50=1.0、10.0μmol·L-1为分类标准,建立了三个分类预测模型.对367个训练集分子,用五重交叉验证.得到正、负样本的平均预测精度分别为84.8%-96.6%、80.7%-97.7%,其总的平均预测精度为87.1%-97.2%,优于其它文献报道结果.对97个外部测试集分子,所建三个模型的总样本预测精度在67.0%-90.1%之间,接近或优于其它文献报道结果.  相似文献   

14.
烟草组分的近红外光谱和支持向量机分析   总被引:1,自引:0,他引:1  
测定了120个产自福建、安徽和云南烟草样品的近红外光谱. 在利用支持向量机(SVM)技术建立其定量、定性分析模型之前, 用小波变换技术对光谱变量进行了有效的压缩, 然后采用径向基核函数建立了75个烟草样品的分类模型, 同时建立了总糖、还原糖、烟碱和总氮4个组分的定量分析模型, 并利用45个烟草样品对模型进行了检验. 仿真实验表明, 建立的SVM分类模型分类准确率达到100%, 而4个组分的定量分析模型的预测决定系数(R2)、预测均方差(RMSEP)和平均相对误差(RME)3个指标值显示其模型泛化能力非常强, 预测效果良好, 可见这是一种有效的近红外光谱的建模分析方法.  相似文献   

15.
基于支撑向量机方法的有机化合物的生成Gibbs自由能的预测;支撑向量机;多元线形回归;吉布斯自由能  相似文献   

16.
用支持向量机建立中药有效成分聚集体的预测模型   总被引:5,自引:0,他引:5  
化合物可以形成聚集体, 这种分子聚集体可能对靶点具有混杂抑制活性. 在中药中已经发现这种现象, 为了进一步研究这种现象,使用支持向量机(SVM)方法建立了分子形成聚集体的分类预测模型. 研究表明, 这个模型具有良好的预测能力, 并且具有稳定性. 通过使用现有化合物对该模型进行验证, 发现该模型具有良好的推广能力. 这个模型被用于对中草药有效成分三维结构与性质数据库(CHDD)中的分子的预测.  相似文献   

17.
18.
19.
《Analytical letters》2012,45(15):2580-2593
The feasibility of diagnosing colorectal cancers based on the combination of near-infrared (NIR) spectroscopy and supervised pattern recognition methods was investigated. A total of fifty-eight colorectal tissues were collected and prepared. The spectra were first preprocessed by standard normalize variate (SNV) and first derivatives of Savitzky-Golay polynomial filter for removing unwanted background variances. The information of CH-stretching overtones and combination regions proved to be the most valuable. Four pattern recognition methods including K-nearest neighbor classifier (KNN), perceptron, Fisher discriminant analysis (FDA), and support vector machine (SVM) were used for constructing classifiers. In terms of the total accuracy, sensitivity and specificity, the SVM classifier achieved the best performance; the sensitivity and specificity were 92.8% and 86.7%, respectively. These findings suggest that NIR spectroscopy offers the possibility of constructing a simple, feasible and sensitive method for diagnosing colorectal cancer, avoiding the need of laborious visual inspection from experts.  相似文献   

20.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号