首页 | 本学科首页   官方微博 | 高级检索  
     

定量结构-活性/性质相关性中变量的选择——正交变换法与最优子集回归法的比较
作者姓名:章文军  许禄
作者单位:中国科学院长春应用化学研究所, 长春 130022
基金项目:国家自然科学基金 (批准号 :2 96 770 16 )
摘    要:定量结构-活性/性质相关性(QSAR/QSPR)研究的基本依据是化合物的性质与结构具有相关性,所以只要有方法描述化合物的结构(得到X)就可与化合物的性质(作为Y)建立起数学模型,并由引模型预测未知化合物。由化合物的结构可衍生(即描述)出诸多变量,从统计学出发,希望用尽可能少的变量来表征尽可能多的信息(如多元回归分析)。过多的变量不仅计算量大,从而可以导致所得的数学模型不稳定,使预测结果较差^[1],而且不同变量的组合所得结果可能差别很大,由此需要对变量进行压缩和选择。虽然变量的选择是一个非常费时和复杂的工作,但变量选择的好坏对数学模型的稳定性及准确性有致关重要的影响,从某种角度上讲,它能决定一项QSAR/QSPR研究的成败。最简单的选择变量的方法是穷举组合法,但此方法的计算量非常大,特别是当变量数较大时,该方法是实际上是不可行的,尽管用于变量选择的方法已有报道,但问题尚有待进一步研究。本文侧重比较了正交变换法与变量最优子集回归法,得到了很有启示性的结果。

关 键 词:构效关系的研究  变量选择  正交变换法  变量最优子集法  
文章编号:0251-0790(2001)07-1134-03
收稿时间:2000-08-01
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《高等学校化学学报》浏览原始摘要信息
点击此处可从《高等学校化学学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号