共查询到20条相似文献,搜索用时 31 毫秒
1.
鉴于变量选择在QSAR/QSPR研究中的重要性,比较了遗传算法和几种传统的方法,如前进法、后退法及逐步回归法.结果表明,对于研究中所用数据,遗传算法较几种传统的方法为好,其原因可能由于传统的方法陷入了局部最优.遗传算法在变量较多的情况下方可显示出效率高和得到较好结果的优越性.对于变量的选择,遗传算法是一值得推荐的有效的方法. 相似文献
2.
定量结构-活性/性质相关性研究中变量选择方法的研究——遗传算法和几种传统算法的比较 总被引:5,自引:0,他引:5
鉴于变量选择在QSAR/QSPR研究中的重要性。比较了遗传算法和几种传统的方法,如前进法、后退法及逐步回归法。结果表明,对于研究中所用数据,遗传算法较几种传统的方法为好,其原因可能由于传统的方法陷入了局部最优。遗传算法在变量较多的情况下方可显示出效率高和得到较好结果的优越性。对于变量的选择,遗传算法是一值得推荐的有效的方法。 相似文献
3.
4.
5.
对89 个苯并异噻唑和苯并噻嗪类丙型肝炎病毒(HCV) NS5B聚合酶非核苷抑制剂进行了定量构效关系(QSAR)研究. 采用遗传算法组合偏最小二乘(GA-PLS)和线性逐步回归分析(LSRA)两种特征选择方法选择最优描述符子集, 然后建立多元线性回归和偏最小二乘线性回归模型. 并首次尝试使用遗传算法耦合支持向量机方法(GA-SVM)对两种特征选择方法所选的描述符子集分别建立非线性支持向量机回归模型. 三种机器学习方法所建模型均得到比较满意的预测效果. 采用LSRA所选的6 个描述符建立的三个QSAR模型对于测试集的相关系数为0.958-0.962, GA-SVM法给出最好的预测精度(0.962). 采用GA-PLS所选的7个描述符建立的三个QSAR模型对于测试集的相关系数为0.918-0.960, 偏最小二乘回归模型的结果最好(0.960). 本工作提供了一种有效的方法来预测丙型肝炎病毒抑制剂的生物活性, 该方法也可以扩展到其他类似的定量构效关系研究领域. 相似文献
6.
遗传算法在绿茶叶近红外光谱分析中波长选择的应用 总被引:1,自引:0,他引:1
利用遗传算法提取茶叶的近红外吸收特征波长,研究建立了绿茶水分和氨基酸的近红外光谱分析模型,并对波长选择前后模型进行了比较分析.结果表明:经遗传算法波长选择后,简化了分析模型,有效地减小了不相关或非线性变量的干扰,模型的稳健性增强. 相似文献
7.
变量选择经常被用于优化近红外光谱线性校正模型,消除冗余信息,提升回归的准确性和可解释性。该文研究并设计了一种基于蒙特卡洛的方法,用于评估不同线性校正方法在变量选择的子空间中能达到的最优程度,寻找变量选择对线性校正模型的优化极限。该方法通过获得验证指标——预测均方根误差(RMSEP)的分布图,揭示变量选择方法在数据集上的优化效果与优化极限。将该方法应用于3组样品的近红外光谱建模研究,结果表明:在烟草-果胶数据集上的可优化率约为24.98%,RMSEP降低了15.2%;在小麦-蛋白质数据集上的可优化率约为13.90%,RMSEP降低了9.5%;在玉米-淀粉数据集上的可优化率约为14.05%,RMSEP降低了57.1%。应用该方法可以快速得到变量选择方法在模型上的优化极限,为变量选择方法的设计、应用和评估提供参考。 相似文献
8.
定量结构-活性/性质相关性中变量的选择——正交变换法与最优子集回归法的比较 总被引:1,自引:0,他引:1
定量结构-活性/性质相关性(QSAR/QSPR)研究的基本依据是化合物的性质与结构具有相关性,所以只要有方法描述化合物的结构(得到X)就可与化合物的性质(作为Y)建立起数学模型,并由引模型预测未知化合物。由化合物的结构可衍生(即描述)出诸多变量,从统计学出发,希望用尽可能少的变量来表征尽可能多的信息(如多元回归分析)。过多的变量不仅计算量大,从而可以导致所得的数学模型不稳定,使预测结果较差^[1],而且不同变量的组合所得结果可能差别很大,由此需要对变量进行压缩和选择。虽然变量的选择是一个非常费时和复杂的工作,但变量选择的好坏对数学模型的稳定性及准确性有致关重要的影响,从某种角度上讲,它能决定一项QSAR/QSPR研究的成败。最简单的选择变量的方法是穷举组合法,但此方法的计算量非常大,特别是当变量数较大时,该方法是实际上是不可行的,尽管用于变量选择的方法已有报道,但问题尚有待进一步研究。本文侧重比较了正交变换法与变量最优子集回归法,得到了很有启示性的结果。 相似文献
9.
测试和比较了天然棉纤维织物和几种人造可再生纤维素纤维(竹原纤维、莫代尔纤维和天丝纤维)在实验室条件下和大环境堆肥条件下的生物降解性.生物降解行为的测试分别采用ASTM D5988-03、堆肥法和酶催化降解法,以比较几种织物在自然环境和微生物培养基条件下的降解速度;结合红外光谱通过分析降解前后结构的改变研究不同的降解方法对纤维素材料的降解程度.结果表明纤维素类纤维织物均表现出良好的生物降解性,并且人造可再生纤维素纤维的降解速度高于天然棉纤维.和传统的实验室条件下测量织物降解性的方法相比,堆肥中含有更多的微生物和酶活性组分,加速了纤维素材料的分解. 相似文献
10.
11.
CPSA与疏水性参数的遗传算法及神经网络法研究 总被引:2,自引:0,他引:2
用分子力学计算出“净”原子表面积,并利用量子化学方法计算出化合物的电荷加权部分表面积(CP-SA).在用遗传算法和神经网络法对改进的CPSA与有机醇类化合物的疏水性参数作相关分析时发现,改进的CPSA可有效地用于构效关系研究,且算法简洁易行,两种多元统计方法均得到了满意的结果. 相似文献
12.
该文研究了近红外光谱技术在红曲菌固态发酵生物量快速检测方面的应用。共采集了4个批次80个样本的光谱,采用氨基葡萄糖法测定生物量。为降低模型的复杂度和提高模型的预测性能,研究了遗传算法(Genetic Algorithm,GA)的光谱谱区选择方法,并建立所优选光谱变量的预测红曲菌固态发酵生物量的PLS模型。为说明遗传算法优选光谱变量的可行性,另外分别建立了全谱和相关系数法两种波长选择方法下的PLS定量模型,比较分析了3种方法所获模型的预测能力,并对GA方法优选的光谱波段信息与菌体成分中含氢基团的对应吸收进行分析。结果表明,遗传算法能在降低模型复杂度的同时提高模型的预测性能,其建模结果为Rc=0.998 3,RMSECV=3.580 2,Rp=0.993 1,RMSEP=3.643 7,参与建模的数据点由全谱的1 457个减少到585个,且模型预测精度相比FS-PLS模型提高了11.55%。研究表明近红外光谱技术结合遗传算法所建的PLS预测模型能够实现红曲菌固态发酵生物量的快速检测,从而为进一步实现在线发酵过程优化控制提供依据。 相似文献
13.
变量选择技术是光谱建模的重要环节。本研究提出了一种新的变量选择方法——自加权变量组合集群分析法(AWVCPA),首先通过二进制矩阵采样法(BMS)对变量空间进行采样;其次通过对变量出现频率(Fre)和偏最小二乘回归系数(Reg)两种信息向量(IVs)做加权处理,得到了每个光谱变量的贡献值,进而考虑到了Fre和Reg两类IVs对于光谱建模的影响;最后通过指数衰减函数(EDF)删除贡献小的波长点,进而实现特征变量选取。以啤酒和玉米两组近红外光谱数据为例,基于偏最小二乘法(PLS)建立啤酒中酵母浓度预测模型和玉米中油浓度预测模型,对比其它变量选择方法。研究表明,在相同条件下,基于AWVCPA变量选择方法建立的预测模型都取得了最优的预测精度,对啤酒中酵母浓度的预测,相比全光谱PLS模型,RMSEP由0.5348下降到0.1457,预测精度提高了72.7%;对玉米含油量的预测,相比全光谱PLS模型,预测均方根误差(RMSEP)由0.0702下降到了0.0248,预测精度提高了64.7%。 相似文献
14.
叠加法是由内标法衍生而来的一种气相色谱定量方法。对于较复杂混合物的分析,当选择内标物困难时,用叠加法定量更为方便。本文在大量实验的基础上,提出了叠加法定量过程中应注意的一些问题。 相似文献
15.
HEPT类化合物的QSAR研究 总被引:3,自引:0,他引:3
为定量结构/活性相关性研究提取了量子化学参数,拓扑指数Am,分子连接性指数^mxt及疏水性常数,同时应用正交变换和最佳变量子集算法(Leaps-and-Bonds)进行了变量压缩和选择,进而实施了多元回归分析,并由此结果进行了HEPT类化合物(1-[(2-hydroxyethoxy)methyl]-6-(phenylthio)-thymine derivatives)的结构/活性关系的理论解释,进行了人工神经网络法对于该类化合物的活性预测,其结构明显好于多元回归法。 相似文献
16.
利用氟离子选择电极,采用一种改进的标准加入法的数据处理方法测定湖北宜昌几种茶叶中的氟含量.与传统的标准加入法不同的是:以加入标准溶液后测得溶液中待测物质(如:氟离子)的总质量(样品及加入标准液后氟离子的质量之和)对加入标准液的中该物质的质量(标准液中氟离子的质量)作图.湖北宜昌某品牌茶叶中的氟含量为46.8±0.5 mg/kg,相对标准偏差(RSD)为0.79%,加标回收率在98.0%~102.5%之间.改进后的标准加入法的数据处理方法简单、快速,能够提供更多的信息(如:加标回收率). 相似文献
17.
18.
化学振荡研究领域的数学方法与程序软件 总被引:6,自引:0,他引:6
本文总结了已应用于化学振荡研究领域的数学方法和程序软件.其中在数学方法部分主要介绍了两种常用于求解化学振荡反应数学模型的吉尔(Gear)法和龙格-库塔(Runge-Kutta)法及其优缺点,并简要描述了3种研究化学振荡反应机理模型的数学分析方法--稳定性分析、灵敏度分析和主成分分析.同时结合作者的实践,给出了用两种功能强大的符号型数学运算软件--Mathematica和Maple来求解振荡反应数学模型的方法.文章还简要介绍了用来模拟化学振荡机理的遗传算法和蒙特卡罗(Monte Carlo)算法以及MECHEM和Chemical Kinetic Simulator(CKS)软件. 相似文献
19.
利用近红外光谱技术对食用植物油中反式脂肪酸(Trans fatty acids,TFA)含量进行快速定量检测,并通过波段选择、预处理方法、变量筛选及建模方法对TFA含量预测模型进行优化.采用AntarisⅡ傅里叶变换近红外光谱仪在4000~10000 cm-1光谱范围采集98个食用植物油样本的近红外透射光谱,然后采用气相色谱法测定TFA的真实含量.首先,对样本原始光谱进行波段、预处理方法优选;在此基础上,采用竞争自适应重加权法(Competitive adaptive reweighted sampling,CARS)筛选TFA相关的重要变量,最后应用主成分回归、偏最小二乘和最小二乘支持向量机方法分别建立食用植物油中TFA含量的预测模型.研究结果表明,近红外光谱技术检测食用植物油中的TFA含量是可行的,优化后的最佳预测模型的校正集和预测集R2分别为0.992和0.989,RMSEC和RMSEP分别为0.071%和0.075%.最佳预测模型所用的变量仅26个,占全波段变量的0.854%.此外,与全波段偏最小二乘预测模型相比,其预测集R2由0.904上升为0.989,RMSEP由0.230%下降为0.075%.由此表明,模型优化非常必要,CARS能有效筛选TFA相关的重要变量,极大减少建模变量数,从而简化预测模型,并较大提高预测模型的精度和稳定性. 相似文献
20.
在热动力学理论基础上提出了一种新的热动力学研究法--时间变量法.该法无须将反应进行到底,只需知道一张热谱图上的3个时间点t,t时刻峰高△和t前峰面积a,就可用计算机数值方法求算反应的速率常数.应用该法研究了一级反应、等浓度二级反应、不等浓度二级反应、三级反应和1.5级反应的热动力学. 相似文献