共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
3.
Juan Du Lili Xi Beilei Lei Jing Lu Jiazhong Li Huanxiang Liu Xiaojun Yao 《Journal of computational chemistry》2010,31(15):2783-2793
4.
拓扑-量子指数醛酮气相色谱保留指数及沸点的定量构效关系 总被引:3,自引:0,他引:3
通过对醛酮化合物分子结构特征及其气相色谱保留指数(RI)和沸点与分子结构间关系的研究,提出了分子极化效应指数(MPEI)、奇偶指数(OEI)、立体效应指数(SVij)、顶点度-距离指数(VDI)及键连接矩阵特征根(∑X1CH)等拓扑-量子结构参数,用多元线性回归(MLR)方法获得了醛酮类化合物的沸点及其在不同极性色谱柱上的气相色谱保留指数与这些拓扑-量子指数间良好的定量结构-性质相关(QSPR)模型,相关系数均大于0.99。5个分子结构参数具有明确的物理化学意义且易于计算和运用。与文献研究的比较结果表明:由上述分子结构参数得出的模型方程适用于各类醛酮化合物的气相色谱保留指数及沸点的预测且具有较好的稳定性和准确性。 相似文献
5.
光谱样本数据常会受到环境噪声和其它组分的干扰,应作波长选择,以提高分析精度。近红外光谱谱区宽,搜索空间过大,难以直接采用遗传算法进行波长选择。为此本研究提出先用移动窗口偏最小二乘法(MWPLS)从宽谱区中初选出信息区间,再采用改进的迭代遗传算法(IGA)从中选出最优的信息子区间。MWPLS用移动窗口沿全谱区扫描,对信息区间的定位效果好,而IGA将顾及光谱数据的连续相关特性,运行多轮GA,并以上轮选择结果平滑处理后作为先验知识支持下轮的种群初始化。由此选出的连续相邻的波长点作为自变量,进行PLS建模,既可显著地简化模型,又保留一定的数据冗余,模型的稳健性好、分析精度高。将其用于小麦水分的近红外分析,效果良好,预测性能明显优于其它方法。 相似文献
6.
定量结构-活性/性质相关性研究中变量选择方法的研究——遗传算法和几种传统算法的比较 总被引:1,自引:0,他引:1
鉴于变量选择在 QSAR/QSPR研究中的重要性 ,比较了遗传算法和几种传统的方法 ,如前进法、后退法及逐步回归法 .结果表明 ,对于研究中所用数据 ,遗传算法较几种传统的方法为好 ,其原因可能由于传统的方法陷入了局部最优 .遗传算法在变量较多的情况下方可显示出效率高和得到较好结果的优越性 .对于变量的选择 ,遗传算法是一值得推荐的有效的方法 相似文献
7.
8.
9.
10.
以自组建的血管紧张素转化酶(AngiotensinI-convertingenzyme)抑制肽库为研究对象,采用氨基酸描述符SVHEHS(Scoresvectorofhydrophobic,electronic,hydrogenbondsandstericproperties)对各肽样本进行结构表征后,进行自交叉协方差(Autocrosscovariances,ACC)处理,并分别利用多元线性回归(Multiplelinearregression,MLR)、偏最小二乘(Partialleastsquareregression,PLS)、人工神经网络(Artificialneuralnetworks,ANN)3种建模方法进行ACE抑制肽QSAR建模。结果显示,所得MLR、PLS与ANN模型的相关系数(Correlationcoefficient,R2)分别为0.744、0.862、0.958,留一交叉验证相关系数(Leave-one-outcross-validatedcorrelationcoefficient,Q2LOO)分别为0.532、0.829、0.948,外部验证复相关系数(Externalvalidatedcorrelationcoefficient,Q2ext)分别为0.567、0.632、0.634。因此,SVHEHS结合上述3种建模方法均适用于ACE抑制肽的QSAR研究,其中ANN的建模效果最优。 相似文献
11.
12.
13.
Huan ZHAO Ke-Wei HUAN Xiao-Guang SHI Feng ZHENG Li-Ying LIU Wei LIU Chun-Ying ZHAO 《分析化学》2018,46(1):136-142
Near-infrared spectroscopy (NIR) is widely used in food quantitative and qualitative analysis. Variable selection technique is a critical step of the spectrum modeling with the development of chemometrics. In this study, a novel variable selection strategy, automatic weighting variable combination population analysis (AWVCPA), is proposed. Firstly, binary matrix sampling (BMS) strategy, which provides each variable the same chance to be selected and generates different variable combinations, is used to produce a population of subsets to construct a population of sub-models. Then, the variable frequency (Fre) and partial least squares regression (Reg), two kinds of information vector (IVs), are weighted to obtain the value of the contribution of each spectral variables, and the influence of two IVs of Rre and Reg is considered to each spectral variable. Finally, it uses the exponentially decreasing function (EDF) to remove the low contribution wavelengths so as to select the characteristic variables. In the case of near infrared spectra of beer and corn, yeast and oil concentration models based on partial least squares (PLS) of prediction are established. Compared with other variable selection methods, the research shows that AWVCPA is the best variable selection strategy in the same situation. It has 72.7% improvement comparing AWVCPA-PLS to PLS and the predicted root mean square error (RMSEP) decreases from 0.5348 to 0.1457 on beer dataset. Also it has 64.7% improvement comparing AWVCPA-PLS to PLS and the RMSEP decreases from 0.0702 to 0.0248 on corn dataset. 相似文献
14.
15.
16.
17.
18.
线性特征选择方法可提升定量构效关系(QSAR)模型的预测能力,但易忽略特征(理化属性)与分子活性间的非线性关系。本文提出基于支持向量回归(SVR)的逐步非线性回归(SSNR)特征选择算法并用于降血压药物血管紧张素转化酶(ACE)抑制肽的QSAR研究。首先以具有不同背景的5组分子描述符分别表征肽序列,以SSNR实施特征选择,再通过智能一致性模型(ICM)对各组描述符对应子模型的预测活性进行加权整合,获得最终活性预测值。在ACE抑制二肽与三肽两个数据上的应用结果表明,SSNR获得的特征子集结合ICM策略可有效提升模型预测能力(二肽的平均Q■为0.675±0.002,三肽为0.663±0.013),优于遗传算法-偏最小二乘(0.538±0.049、0.599±0.047)与逐步线性回归(0.583±0.041、0.675±0.010)。最后基于抑制活性已知肽序列预测所有活性未知肽的活性,分析了高活性肽及其氨基酸偏好性,为人工合成潜在高活性ACE抑制肽提供可能的序列组合。 相似文献
19.
Jingheng Wu Juan Mei Sixiang Wen Siyan Liao Jincan Chen Yong Shen 《Journal of computational chemistry》2010,31(10):1956-1968
20.