定量结构-活性/性质相关性中变量的选择——正交变换法与最优子集回归法的比较 |
| |
作者姓名: | 章文军 许禄 |
| |
作者单位: | 中国科学院长春应用化学研究所, 长春 130022 |
| |
基金项目: | 国家自然科学基金 (批准号 :2 96 770 16 ) |
| |
摘 要: | 定量结构-活性/性质相关性(QSAR/QSPR)研究的基本依据是化合物的性质与结构具有相关性,所以只要有方法描述化合物的结构(得到X)就可与化合物的性质(作为Y)建立起数学模型,并由引模型预测未知化合物。由化合物的结构可衍生(即描述)出诸多变量,从统计学出发,希望用尽可能少的变量来表征尽可能多的信息(如多元回归分析)。过多的变量不仅计算量大,从而可以导致所得的数学模型不稳定,使预测结果较差^[1],而且不同变量的组合所得结果可能差别很大,由此需要对变量进行压缩和选择。虽然变量的选择是一个非常费时和复杂的工作,但变量选择的好坏对数学模型的稳定性及准确性有致关重要的影响,从某种角度上讲,它能决定一项QSAR/QSPR研究的成败。最简单的选择变量的方法是穷举组合法,但此方法的计算量非常大,特别是当变量数较大时,该方法是实际上是不可行的,尽管用于变量选择的方法已有报道,但问题尚有待进一步研究。本文侧重比较了正交变换法与变量最优子集回归法,得到了很有启示性的结果。
|
关 键 词: | 构效关系的研究 变量选择 正交变换法 变量最优子集法 |
文章编号: | 0251-0790(2001)07-1134-03 |
收稿时间: | 2000-08-01 |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
| 点击此处可从《高等学校化学学报》浏览原始摘要信息 |
|
点击此处可从《高等学校化学学报》下载全文 |