首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
利用氨基酸结构描述符SVHEHS分别对血管紧张素转化酶(Angiotensin I-converting Enzyme,ACE)竞争性抑制二肽、三肽、四肽序列表征后,建立结构与活性的多元线性回归(MLR)模型。ACE抑制二肽模型的相关系数、交叉验证相关系数、均方根误差、外部验证相关系数分别为0.851、0.781、0.327、0.792;三肽模型分别为0.805、0.717、0.339、0.817;四肽模型分别为0.792、0.553、0.393、0.630。研究表明,运用该描述符建立的ACE抑制肽MLR模型拟合、预测能力均较好,能较好解释ACE抑制肽的活性与结构间的关系。  相似文献   

2.
本文选取45个典型硝基苯类化合物的小鼠半致死浓度毒性数据,利用遗传算法和多元线性回归分析,构建了硝基苯类化合物结构与急性毒性LD50的定量构效关系。模型的相关系数R2和内部交叉验证系数Q2分别为0.819和0.732,均方根误差为0.243。结果表明,该模型具有较好的预测能力和稳健性。通过模型中筛选出的描述符可知,硝基苯类化合物的急性毒性与氢键的数量以及结构拓扑学参数有较强的相关性。  相似文献   

3.
在分析了改性双基推进剂不同成分含量对其燃速性能影响的基础上,使用机器学习方法建立了以推进剂成分含量及压强为输入变量,推进剂燃速值为输出的预测模型。通过以相关系数(R~2)、均方根误差(RMSE)以及平均绝对误差(MAE)作为模型的性能评价指标,比较了不同机器学习方法的预测性能,包括随机森林、支持向量回归、极限梯度提升、人工神经网络、多元线性回归、偏最小二乘回归和K最近邻回归。结果表明,以多项式内积(Poly)为核函数的支持向量回归(Support Vector Regression, SVR)模型的预测效果最优,其模型的留一法交叉验证结果令人满意,R~2、RMSE、MAE分别为0.9927、0.5553、0.4033。最后,为进一步验证模型的准确性、稳定性,我们分别采用5折、10折交叉验证与留一法进行结果比较,并绘制模型的学习曲线。结果证实模型稳定可靠,过拟合程度低,可实现对改性双基推进剂燃速的准确预测,可为具有优越性能的推进剂配方设计与优化提供理论指导。  相似文献   

4.
为提高小样本定量构效关系(QSAR)预测精度,基于支持向量机全局核函数与局部核函数提出了一种新的建模方法:先依不同核函数筛选描述符,再依保留描述符构建支持向量机回归(SVR)子模型.子模型预测活性值与实验值组成混合样本.以均方误差(MSE)最小为原则,对混合样本再次基于SVR实施核函数寻优与子模型筛选,基于最优核函数和保留子模型以留一法完成预测.对2个小样本体系的QSAR研究表明,该方法兼具局部核函数和全局核函数的优点,既有较强的学习能力,又有较好的推广能力,预测精度高,稳定性好.  相似文献   

5.
刘静  管骁  彭剑秋 《化学学报》2012,70(1):83-91
收集20种天然氨基酸的457种理化性质,按照疏水、电性特征、氢键贡献和立体特征分类后,对它们分别进行主成分分析(Principal component analysis,PCA),得到一个新的氨基酸残基结构描述符SVHEHS.用该描述符分别对血管紧张素转化酶(AngiotensinⅠconverting enzyme,ACE)抑制二肽、三肽、四肽进行序列表征,并用来与生物活性建立偏最小二乘(Partial least square regression,PLS)模型.ACE抑制二肽、三肽、四肽模型的相关系数、交叉验证相关系数、 均方根误差、外部验证相关系数分别为0.607,0.507,0.587,0.783;0.852,0.813,0.232,0.839;1,1,0,0.935.由此说明,采用SVHEHS描述符建立的PLS模型拟合、预测能力均较好,可用于血管紧张素转化酶抑制肽的定量构效关系研究.  相似文献   

6.
烃基酚类化合物对四膜虫毒性的定量结构-活性相关研究   总被引:2,自引:0,他引:2  
在B3LYP/6-311G*水平上全优化计算了41个烃基苯酚的量子化学参数,连同取代烃基位置编码参数共同表征有机物的分子结构,应用基于预测的模型变量选择方法(VSMP)选择描述子最佳子集,建立了偶极距(μ)和分子平均极化率(α)与烃基苯酚对梨形四膜虫水生毒性pIGC50 两变量线性QSAR模型,模型的相关系数r为0.9434,均方根误差RMSE为0.2548,LOO交叉验证相关系数Q为0.9170,均方根误差RMSV为0.3066;为检验模型的稳定性和预测能力,将41个样本分作了奇数集和偶数集,分别建立了模型,并用y-Randomization方法对全部样本、奇数集和偶数集所建立的模型进行了检验;建立的奇数集和偶数集模型均满足Tropsha研究小组建议的预测能力标准.  相似文献   

7.
刘静  管骁  彭剑秋 《分析测试学报》2012,31(10):1260-1265
通过对天然氨基酸的457种物化性质参数进行主成分分析后得到SVHEHS描述符,用该描述符分别对血管紧张素转化酶(ACE)抑制二肽、三肽、四肽进行表征,并建立了肽结构与活性的神经网络模型。ACE抑制二肽神经网络模型的相关系数、交叉验证相关系数、均方根误差和外部验证相关系数分别为0.946、0.951、0.249、0.852,三肽模型分别为0.973、0.945、0.135、0.813,四肽模型分别为0.915、0.879、0.250、0.814。由此表明SVHEHS描述符结合神经网络对ACE抑制肽的建模效果及模型预测能力均较理想,在此基础上进一步通过平均影响值(Mean impact value,MIV)法确定了显著影响各类肽活性的结构因素,从而为新的强活性ACE抑制肽的分子设计提供了理论基础。  相似文献   

8.
应用近红外漫反射光谱技术和化学计量学,研究成熟期猕猴桃内部品质与其近红外漫反射光谱之间的关系。在室温(24±2)℃下,采集猕猴桃赤道区域不同测试部位在4 000~10 000 cm^(-1)范围内的光谱数据,用基于平滑处理、归一化及基线校正的组合式处理方法对原始光谱进行预处理;另应用偏最小二乘(PLS)法、主成分回归法和多元线性回归法等方法分别建立猕猴桃硬度、可溶性固形物含量(SSC)的校正模型。结果表明:采用组合预处理方法和PLS法建立的校正模型精度最高;硬度校正集相关系数R_c、均方根误差RMSEC和预测集相关系数R_p、均方根误差RMSEP达到了0.976 5,0.548 3,0.943 2,0.612 7;SSC校正集相关系数R_c、均方根误差RMSEC和预测集相关系数R_p、均方根误差RMSEP达到了0.916 6,0.539 6,0.901 2,0.619 0;试验结果验证了本法的可行性。  相似文献   

9.
支持向量机用于多氯代萘毒性的定量构效研究   总被引:2,自引:0,他引:2  
用偏最小二乘法(PLS)和留一交叉验证从90多个量子化学参数中筛选出极化率、分子量、部分原子上的净电荷、静电势等作为描述符,应用支持向量机(SVM)对20个多氯代萘同系物的三组毒性数据分别建立了定量构效关系模型.所得模型的交叉验证相关系数的平方分别为0.805、0.890、0.936.并将偏最小二乘法建模所得结果与之进行比较,结果表明,SVM预报能力优于PLS.  相似文献   

10.
应用近红外漫反射光谱技术和化学计量学,研究成熟期猕猴桃内部品质与其近红外漫反射光谱之间的关系。在室温(24±2)℃下,采集猕猴桃赤道区域不同测试部位在4 000~10 000 cm~(-1)范围内的光谱数据,用基于平滑处理、归一化及基线校正的组合式处理方法对原始光谱进行预处理;另应用偏最小二乘(PLS)法、主成分回归法和多元线性回归法等方法分别建立猕猴桃硬度、可溶性固形物含量(SSC)的校正模型。结果表明:采用组合预处理方法和PLS法建立的校正模型精度最高;硬度校正集相关系数R_c、均方根误差RMSEC和预测集相关系数R_p、均方根误差RMSEP达到了0.976 5,0.548 3,0.943 2,0.612 7;SSC校正集相关系数R_c、均方根误差RMSEC和预测集相关系数R_p、均方根误差RMSEP达到了0.916 6,0.539 6,0.901 2,0.619 0;试验结果验证了本法的可行性。  相似文献   

11.
12.
13.
14.
15.
基于支撑向量机方法的有机化合物的生成Gibbs自由能的预测;支撑向量机;多元线形回归;吉布斯自由能  相似文献   

16.
17.
计算了44个烷基苯酚类化合物的组成、拓扑、几何、静电和量子化学等结构参数,运用启发式方法对这些结构参数进行筛选,得到了含3个变量的化合物的定量结构与色谱保留值的线性关系模型,同时以这3个变量作为支持向量机模型的输入变量建立非线性回归模型。两种方法的相关系数(R2 )分别为0.98和0.92,相应的均方根误差分别是0.99和2.77。通过对两种模型的稳定性和预测能力的比较,发现线性模型能够更好地反映烷基苯酚的气相色谱保留值与其结构参数之间的定量关系。在已知烷基苯酚类化合物结构参数的情况下,线性回归模型更有助于它们的色谱分析。  相似文献   

18.
19.
20.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号