共查询到20条相似文献,搜索用时 0 毫秒
1.
2.
构建147个有机物分子结构与其热导率值之间的定量结构-性质关系(QSPR)模型, 探讨影响有机物热导率的结构因素. 以147个化合物作为样本集, 随机选择118个作为训练集, 29个作为测试集. 应用CODESSA软件计算了组成、拓扑、几何、静电和量子化学等描述符, 通过启发式方法(HM)筛选得到5个结构参数并建立线性回归模型; 用所选5个结构参数作为支持向量机(SVM)的输入, 建立非线性的支持向量机回归模型. 预测结果表明: 支持向量机回归模型的性能(复相关系数R2=0.9240)虽略低于启发式回归模型的性能(R2=0.9267), 但是支持向量机方法预测性能(R2=0.9682)高于启发式方法的预测性能(R2=0.9574), 对于QSPR模型来说, 预测性能更重要. 因此, 总体来说支持向量机方法优于启发式方法. 支持向量机方法和启发式方法的提出为工程上提供了一种根据分子结构预测有机物热导率的新方法. 相似文献
3.
4.
5.
6.
基于地统计学与支持向量回归的QSAR建模 总被引:4,自引:0,他引:4
基于主成分分析(PCA)、地统计学(GS)和支持向量回归(SVR), 提出了一种新的定量构效关系(QSAR)个体化预测方法——Weight-PCA-GS-SVR. 其基本思路是: 先以PCA降维并消除自变量间的信息冗余, 继以SVR经非线性主成分筛选去除与因变量无关的主成分, 再以保留主成分计算样本间的加权距离, 然后以高维GS确定公用变程; 每一个待测样本都以自身为中心从训练集中找出加权距离小于公用变程的私有k个近邻, 以SVR训练建模完成个体化预测. Weight-PCA-GS-SVR从行、列两个方向对模型进行了优化, 为自变量提供了一种新的加权方法, 为解决最优k近邻选择难题提供了新的思路, 并具有SVR原来的优点. 经3个化合物活性实例数据集验证, 新方法在所有参比模型中预测精度最高, 且明显优于文献报道结果, Weight-PCA-GS-SVR在QSAR等回归预测领域有较广泛的应用前景. 相似文献
8.
9.
基于支持向量机的高维特征非线性快速筛选与肽QSAR建模 总被引:1,自引:0,他引:1
以氨基酸的531个物理化学性质参数直接表征肽的结构, 基于支持向量回归发展了一种新的高维特征非线性快速筛选方法, 将其应用于苦味二肽和血管紧张素转化酶抑制剂2个肽体系的定量序效关系(QSAR)建模, 各筛选获得10个意义明确的保留描述子. 以保留描述子建立支持向量回归模型, 其拟合精度、留一法交叉测试精度和外部预测精度较文献报道结果均有较大幅度提升, 优势明显; 对所建模型进行了非线性回归显著性测验、单因子相对重要性显著性测验和单因子效应分析, 增强了模型的可解释性. 新方法在肽、蛋白质QSAR建模等高维数据回归预测领域有广泛应用前景. 相似文献
10.
应用启发式算法(HM)和支持向量机算法(SVM)建立了88种醛类化合物对大鼠急性毒性的定量构效关系模型。应用ChemOffice2004软件进行化合物的结构输入,利用半经验方法进行分子结构优化,在CODDESA软件中计算出组成、拓扑、几何、电子和量子化学参数。并用启发式方法筛选出相对阳性电荷、氧原子数量、碳原子的最小亲核反应指数、双键相对数量、碳原子数量、碳氢键之间的最大交换能量、最大σ-σ键序和双键数量8个参数,在此基础上应该多元线性回归和支持向量机方法建立QSPR模型。两种方法均得到了较好的结果,HM和SVM的交互检验的相关系数分别为0.90和0.93;通过对模型的稳定性和预测能力比较,SVM建立的QSAR模型能够更好地预测醛类化合物对大鼠急性毒性LD50。 相似文献
11.
海水中铁(Ⅲ)-二元有机酸盐配合物的光化学反应研究 总被引:1,自引:0,他引:1
采用实验室模拟的方法研究了高压汞灯模拟日光照射下铁(Ⅲ)-二元有机酸盐配合物在天然海水中的光化学反应.结果发现,在二元有机酸盐配体的存在下,铁(Ⅲ)发生光化学反应生成还原态的铁(Ⅲ),铁(Ⅲ)会被溶液中的氧再氧化为铁(Ⅲ).铁(Ⅲ)的光还原反应速率受到配体浓度、pH、光强以及温度的影响.在二元有机酸与Fe(Ⅲ)浓度配比大于2的情况下,Fe(Ⅲ)-二元有机酸盐配合物的光还原反应初期铁(Ⅲ)浓度的增长符合一级动力学反应规律,100min后浓度趋于稳定,方程式为[Fe(Ⅲ)]t=kOA[OA]·[Fe(Ⅲ)]ini×[1-exp{-(kOA[OA]+kox)t}]/(kOA[OA]+kox).光强升高和pH降低都能加快光还原反应速率,而改变温度则基本上对光还原反应速率无影响,证明铁(Ⅲ)的光还原反应为自由基引发的电子转移过程. 相似文献
12.
13.
基于支持向量机方法的HERG钾离子通道抑制剂分类模型 总被引:1,自引:0,他引:1
对human ether-a-gō-gō related genes(HERG)钾离子通道(钾通道)抑制剂,计算了表征分子组成、电荷分布、拓扑、几何结构及物理化学性质等特征的1559个分子描述符.采用Fischer Score(F-Score)排序过滤和Monte Carlo模拟退火法相结合从中筛选与HERG钾通道抑制剂分类相关的分子描述符.采用支持向量机(SVM)方法,分别以IC50=1.0、10.0μmol·L-1为分类标准,建立了三个分类预测模型.对367个训练集分子,用五重交叉验证.得到正、负样本的平均预测精度分别为84.8%-96.6%、80.7%-97.7%,其总的平均预测精度为87.1%-97.2%,优于其它文献报道结果.对97个外部测试集分子,所建三个模型的总样本预测精度在67.0%-90.1%之间,接近或优于其它文献报道结果. 相似文献
14.
烟草组分的近红外光谱和支持向量机分析 总被引:1,自引:0,他引:1
测定了120个产自福建、安徽和云南烟草样品的近红外光谱. 在利用支持向量机(SVM)技术建立其定量、定性分析模型之前, 用小波变换技术对光谱变量进行了有效的压缩, 然后采用径向基核函数建立了75个烟草样品的分类模型, 同时建立了总糖、还原糖、烟碱和总氮4个组分的定量分析模型, 并利用45个烟草样品对模型进行了检验. 仿真实验表明, 建立的SVM分类模型分类准确率达到100%, 而4个组分的定量分析模型的预测决定系数(R2)、预测均方差(RMSEP)和平均相对误差(RME)3个指标值显示其模型泛化能力非常强, 预测效果良好, 可见这是一种有效的近红外光谱的建模分析方法. 相似文献
15.
16.
17.
18.
19.
《Analytical letters》2012,45(15):2580-2593
The feasibility of diagnosing colorectal cancers based on the combination of near-infrared (NIR) spectroscopy and supervised pattern recognition methods was investigated. A total of fifty-eight colorectal tissues were collected and prepared. The spectra were first preprocessed by standard normalize variate (SNV) and first derivatives of Savitzky-Golay polynomial filter for removing unwanted background variances. The information of CH-stretching overtones and combination regions proved to be the most valuable. Four pattern recognition methods including K-nearest neighbor classifier (KNN), perceptron, Fisher discriminant analysis (FDA), and support vector machine (SVM) were used for constructing classifiers. In terms of the total accuracy, sensitivity and specificity, the SVM classifier achieved the best performance; the sensitivity and specificity were 92.8% and 86.7%, respectively. These findings suggest that NIR spectroscopy offers the possibility of constructing a simple, feasible and sensitive method for diagnosing colorectal cancer, avoiding the need of laborious visual inspection from experts. 相似文献