首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
分子三维投影法在苯酚类化合物构效关系研究中的应用   总被引:4,自引:0,他引:4  
对苯酚类化合物进行三维投影得到了5个形状参数,将其与3个Am指数及8个量子化学参数相结合,由最佳变量子集回归法对变量进行了压缩与选择,运用多元回归分析和人工神经网络分别构造了预测数学模型,得到了满意的结果。  相似文献   

2.
定量结构-活性/性质相关性(QSAR/QSPR)研究的基本依据是化合物的性质与结构具有相关性,所以只要有方法描述化合物的结构(得到X)就可与化合物的性质(作为Y)建立起数学模型,并由引模型预测未知化合物。由化合物的结构可衍生(即描述)出诸多变量,从统计学出发,希望用尽可能少的变量来表征尽可能多的信息(如多元回归分析)。过多的变量不仅计算量大,从而可以导致所得的数学模型不稳定,使预测结果较差^[1],而且不同变量的组合所得结果可能差别很大,由此需要对变量进行压缩和选择。虽然变量的选择是一个非常费时和复杂的工作,但变量选择的好坏对数学模型的稳定性及准确性有致关重要的影响,从某种角度上讲,它能决定一项QSAR/QSPR研究的成败。最简单的选择变量的方法是穷举组合法,但此方法的计算量非常大,特别是当变量数较大时,该方法是实际上是不可行的,尽管用于变量选择的方法已有报道,但问题尚有待进一步研究。本文侧重比较了正交变换法与变量最优子集回归法,得到了很有启示性的结果。  相似文献   

3.
进行了基于自适应蒙特卡洛法评定测量不确定度的程序开发与应用。基于Python语言,设计开发自适应蒙特卡洛法评定测量不确定度程序,包含评定过程框架、自定义变量名称模块、过程参数关联计算模块以及蒙特卡洛法采样计算模块。程序界面简洁,操作简单,计算准确,适用于任意多个独立变量、任意多个过程参数及单一被测量的数学模型,为利用自适应蒙特卡洛法评定测量不确定度提供了方便。  相似文献   

4.
提出了一种应用同步荧光光谱技术无损快速鉴别料酒品牌的新方法.利用主成分分解法和小波变换法对料酒样品的同步荧光光谱信号进行了压缩处理,分别采用同步荧光光谱数据的第一主成分和小波细节系数为特征变量进行主成分分析和聚类分析,分类结果表明小波系数作为料酒的特征变量对料酒品牌分类正确率更高.利用偏最小二乘和径向基人工神经网络方法...  相似文献   

5.
快速多模型回归分析方法的研究   总被引:2,自引:2,他引:2  
逐步回归[1]是变量选择的常用方法.由逐步回归法得到的数学表达式不一定是最优数学模型,所以有其局限性.假如有m个变量x;,x。,……,x。,我们希望得到分别包含1个变量、2个变量、……、直至m个变量的最优回归方程,可以采用组合算法C:,对每个子集的所有组合进行回归分析,然后从C:个回归方程中选出最优的数学模型.由于随着变量个数m的增加,总的回归次数以2”的形式倍增,运算量大,时间长.此时可采用快速多模型(LeaPsandbounds)回归分析[‘j.此法为一种快速多模型回归,据此可以得到一组含有不同变量个数的最优方程.该…  相似文献   

6.
卷烟内在质量的气相色谱-数学聚类法研究   总被引:2,自引:0,他引:2  
采用吸附丝色谱方法采集和分析了红塔山牌卷烟的挥发性成分,对 10个真品进行 R型聚类分析和 R型因子分析,从 26个组分提取出对卷烟质量起主导作用的 7个特征变量(组分),并对其丰度进行了讨论,进而建立了红塔山卷烟的质量数学模型,用 2个真品和 2 个假冒品对模型进行了检验,结果令人满意。  相似文献   

7.
采用吸附丝色谱方法采集和分析了红塔山牌卷烟的挥发性成分,对10个真品进行R型聚类分析和R型因子分析,从26个组分提取出对卷烟质量起主导作用的7个特征变量(组分),并对其丰度进行了讨论,进而建立了红塔山卷烟的质量数学模型,用2个真品和2个假冒品对模型进行了检验,结果令人满意。  相似文献   

8.
戴琼  朱明华  葛海霖 《化学学报》1988,46(9):881-886
用最小二乘法拟合的多项式作为描述保留值或峰宽与流动相组成间关系的数学模型, 以影响水溶性维生素分离的主要因素(流动相中有机调节剂甲醇的浓度)作为主变量, 分析时间最短为目标, 各最难分离物质对的分离度≥1.5为约束条件, 在一定变量范围内对流动相组成进行了优化, 并运用此优化方法选择了维生素C、烟酸、烟酰胺、维生素B1、维生素B2和维生素B6六种水溶性维生素的最佳分离条件.  相似文献   

9.
提出了一种基于偏最小二乘判别分析和F-score的特征筛选方法,并将其用于蛋白质组学质谱数据分析。方法主要包含3个步骤:(1)用LIMPIC算法对原始数据进行预处理;(2)计算每个变量的F-score值并将所有变量按F-score值降底的顺序排列;(3)采用偏最小二乘判别分析交互检验按前向选择法选择最佳变量子集。用本方法对一组卵巢癌数据进行分析,最终从原始的15154个质荷比变量中选择了12个特征变量作为潜在生物标记物,它们在训练集上交叉检验的特异性和灵敏度分别为98.36%和98.15%,在独立测试集上的特异性和灵敏度分别为96.67%和100%。用筛选出的变量作PCA所得的结果显示这些变量能够较好地将样本分类,说明能够反映出样本的类别信息。所提出的方法可用于蛋白质组学质谱数据的特征筛选及样本分类。  相似文献   

10.
章文军  许禄  齐玉华 《分析化学》2001,29(2):178-181
正交变换法是变量选择的一种可行方法,但该种方法非常依赖于正交变换过程中变量的排序,侧重比较了不同排序方法,其中,后退法可以得到较好的结果。文中采用此种方法对由苯酚及苯胺类化合物所衍生的变量进行了正交变换,并对上述化合物的色谱比移值进行了预测。同时,与前进选择法、后退剔除法和逐步回归法几种传统方法进行了比较,得到了有启示性的结果。  相似文献   

11.
12.
13.
14.
15.
16.
鉴于变量选择在 QSAR/QSPR研究中的重要性 ,比较了遗传算法和几种传统的方法 ,如前进法、后退法及逐步回归法 .结果表明 ,对于研究中所用数据 ,遗传算法较几种传统的方法为好 ,其原因可能由于传统的方法陷入了局部最优 .遗传算法在变量较多的情况下方可显示出效率高和得到较好结果的优越性 .对于变量的选择 ,遗传算法是一值得推荐的有效的方法  相似文献   

17.
基于SVR和k-近邻群的组合预测在QSAR中的应用   总被引:1,自引:0,他引:1  
为提高定量构效关系(QSAR)研究的预测精度,发展了一种新的基于支持向量机回归(SVR)非线性筛选分子结构描述符、基于k-近邻群的非线性组合预测方法.首先以均方误差(MSE)最小为原则,以留一法通过多轮末尾淘汰实施分子结构描述符的非线性SVR汰选并给出最优核函数和相应保留描述符;其次基于待测样本与训练样本保留描述符向量的欧氏距离,以不同k-近邻群子模型双重留一法预测值反映样本集的异质性;然后基于MSE最小,以留一法通过多轮末尾淘汰实施近邻群子模型的非线性SVR汰选并给出最优核函数和相应保留子模型;最后基于保留子模型以双重留一法实施组合预测.以取代苯胺和苯酚类化合物对大型溞的QSAR实例验证表明:新方法在所有参比模型中预测精度最高,且能更精细地反映描述符与化合物毒性间的非线性关系,具结构风险最小、非线性、适于小样本,能有效克服过拟合、维数灾和局极小,非线性筛选描述符和子模型,非线性组合预测,自动选择最优核函数及其相应参数,泛化推广能力优异、预测精度高等诸多优点,在QSAR研究中有广泛应用前景.  相似文献   

18.
19.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号