首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 156 毫秒
1.
2.
从20 种天然氨基酸的171个物化性质出发, 按照疏水、立体和电性特征及氢键贡献将其分类后, 分别进行主成分分析, 得到一个新描述子VHSEH(Principal component score vector of hydrophobic, steric, electronic properties and, hydrogen bonds contributions). 对后叶催产素的结构进行了表征, 并以偏最小二乘法及D-优化划分样本建立了PLS定量序效关系模型, 得到复相关系数R2分别为 0.958 和 0.957, Q2分别为0.903和0.845, 约高于VHSE描述子模型值; 对抗菌肽进行了结构表征, 建立了PLS和OSC-PLS模型, 其R2分别为0.84和 0.995, Q2分别为0.546和0.926, 较SZOTT描述子结果好; 对58 个血管紧张素转化酶抑制剂进行QSAM研究, 得到R2, Q2及RMS分别为0.877, 0.838和0.361. 研究结果表明, VHSEH 描述子信息量大, 物化意义明确, 结果更易解释.  相似文献   

3.
基于氨基酸物化性质的描述子矢量VHSE, 对21个后叶催产素类似物进行结构表征. 经逐步回归与偏最小二乘相结合的变量筛选技术, 根据模型的外部预测结果, 筛选得到一个最优的9变量组合. 应用该变量组合对21个后叶催产素类似物的促宫缩活性进行偏最小二乘建模, 模型复相关系数R2为92.6%, 留一法和留组法交互验证Q2分别为78.3%和79.4%. 结果表明, 后叶催产素的促宫缩活性主要与第3号氨基酸残基的疏水性、立体结构和电性性质以及第8号氨基酸残基的电性特征密切相关.  相似文献   

4.
基于多模型共识的偏最小二乘法用于近红外光谱定量分析   总被引:6,自引:0,他引:6  
建立了多模型共识偏最小二乘(cPLS)建模方法, 并应用于烟草样品近红外(NIR)光谱与常规成分氯含量之间的建模研究, 探讨了建模参数对预测结果的影响. 结果表明, cPLS方法与传统的偏最小二乘算法(PLS)相比, 所建模型更稳定可靠, 预测结果也可得到了明显改善.  相似文献   

5.
梅虎  周原  廖志华  李志良 《化学学报》2006,64(9):949-952
采用VHSE氨基酸结构描述子表征HLA-A*0201限制性表位结构, 以遗传算法和偏最小二乘相结合(GA-PLS)对102个训练集进行定量构效关系建模. 剔除3个异常样本后, 据候选模型交互检验及50个外部测试集预测结果, 筛选得到最优偏最小二乘模型(A=2), 其R2, Q2和 分别为0.755, 0.621和0.680. 构效研究显示: CTL表位活性主要与1, 2, 7, 8, 9位氨基酸残基疏水、1, 2位立体及6位残基电性等性质密切相关.  相似文献   

6.
循环子空间回归为喹喏酮N1位构效关系建模   总被引:2,自引:0,他引:2  
拟从线性泛函的角度分析循环子空间回归(CSR).CSR方法将从自变量参数矩阵和因变量向量中提取成分,循环地构造并扩张Krylov子空间,且以此作为源空间,运用最小二乘准则解得映射到因变量实空间的线性泛函.整个求解过程包容了最小二乘回归(LSR)、主成分回归(PCR)、偏最小二乘回归(PLS)以及其它中间的回归方法.然后由预报能力的强弱,从中确定最佳回归模型.本文应用CSR方法为喹喏酮N1位抗菌构效关系建模,效果良好.  相似文献   

7.
张若秋  杜一平 《分析测试学报》2020,39(10):1282-1287
在实际多元校正应用中有很多因素会影响偏最小二乘(PLS)模型的预测效果,作为光谱数据本源的仪器噪声是其中的重要影响因素。以往的研究工作多使用各种滤波器或平滑方法来降低仪器噪声的影响,然而对于仪器噪声如何影响偏最小二乘的建模过程和模型预测能力鲜有报道。该文阐述并论证了仪器噪声怎样通过第一个隐变量的计算被引入模型中,经过对偏最小二乘计算过程的理论推导,论述了噪声的引入对偏最小二乘权重向量、载荷向量计算具有累积效应,并随着后续隐变量的计算不断在模型中传递,从而对偏最小二乘模型产生影响。同时对偏最小二乘模型的预测误差进行理论分解,将其划分为无噪理想模型本身的误差和由噪声传播导致的误差。结果表明,仪器噪声不仅会降低偏最小二乘模型的预测性能,还会影响偏最小二乘模型的最优复杂度选择。  相似文献   

8.
应用红外光声光谱技术结合区间、组合区间偏最小二乘,建立了油菜籽含氮量和含油量的校正模型。结果表明,红外光声光谱技术可以应用于油菜籽品质的快速测定。相对于全谱偏最小二乘建模,区间、组合区间偏最小二乘的采用筛选出了含氮量和含油量的相关波段,使模型简化,并提高了模型预测精度。  相似文献   

9.
拟从线性泛函的角度分析循环子空间回归(CSR)。CSR方法将从自变量参数矩阵和因变量向量中提取成分,循环地构造并扩张Krylov子窨,且以此作为源空间,运用最小二乘准则解最映射到因变量实空间的线性泛函。整个求解过程包容了最小二乘回归(LSR)、主成分回归(PCR)、偏最小二乘回归(PLS)以及其它中间的回归方法。然后以预报能力的强弱,从中确定最佳回归模型。本文应用SCR方法为喹喏酮N1位抗菌构效关系建模,效果良好。  相似文献   

10.
氨基酸结构描述子矢量VHSE及其在肽QSAR中的应用   总被引:8,自引:0,他引:8  
从20种天然氨基酸的50个物化性质出发,按照疏水、立体和电性特征将其分类后分别进行主成分分析,并将产生的得分矢量即VHSE(principal component score vector of hydrophilicity,steric,and electronic properties)作为氨基酸结构描述子用于肽的定量构效关系研究。与已有方法相比,VHSE描述子具有物化意义明确、结果更易解释等特点。应用该描述子并结合逐步回归变量筛选和偏最小二乘建模方法,在对苦味二肽和血管舒缓激肽促进剂等体系的定量构效关系研究中,均取得了优于已有文献的结果。  相似文献   

11.
12.
一种新的氨基酸描述子及其在肽QSAR中的应用   总被引:11,自引:0,他引:11  
从天然氨基酸的25个结构与拓扑变量中经主成分分析得到一种新的氨基酸描述子——VSTV (principal component scores vector of structural and topological variables).应用该描述子对以下3个体系,即血管紧张素转化酶抑制剂(2肽)、抗菌18肽和促凝血酶原激酶抑制剂(6~12肽)进行分子结构参数化表达,并在此基础上通过偏最小二乘回归(PLSR)建立定量构效关系(QSAR)模型,取得了优于文献的结果.模型的复相关系数(R2)和交互检验复相关系数(Q2)分别为0.789, 0.767; 0.996, 0.879; 0.981, 0.480.  相似文献   

13.
一组新氨基酸描述子用于肽定量构效关系研究   总被引:2,自引:0,他引:2  
用主成分分析从20种天然氨基酸0D~3D结构信息中收集到的共1369个描述子变量得到了一组新氨基酸描述子(SZOTT), 将其用于血管紧张素转化酶抑制剂和苦味二肽结构表征并以偏最小二乘法建立定量构效关系模型, 得复相关系数RCU2分别为0.894和0.908, 留一法交互检验的复相关系数RCV2分别为0.828和0.736, 估计均方根误差RMS分别为0.331和0.195. 研究结果表明, SZOTT描述子含信息量大, 操作简便, 结构表达能力强, 有望在多肽定量构效关系研究中得到进一步推广.  相似文献   

14.
15.
16.
从20种天然氨基酸197个GETAWAY指数经主成分分析得出一种新3D氨基酸描述子——VSGETAWAY[vector of principal component scores for GETAWAY (geometry, topology and atom-weights assembly)]. 将其应用于48个苦味活性二肽、31个血管舒缓激肽促进剂和20个促凝血酶原激酶抑制剂结构表征并以偏最小二乘(PLS)对3个体系建立定量构效关系(QSAR)模型, 得复相关系数(Rcum2)与交互检验复相关系数(Qcum2)分别为0.887和0.753; 0.995和0.708; 0.999和0.802. 研究结果表明, VSGETAWAY描述子操作简便、结构表达能力强, 有望成为多肽药物QSAR研究中一种有效的结构表征方法.  相似文献   

17.
从20种天然氨基酸的1369种性质参数经主成分分析得出一种新多肽序列表征方法——SZOTT. 将其用于71个不同长度肽序列表征, 以偏最小二乘(PLS)和支持向量机(SVM)建立定量结构-保留模型(QSRM). 研究表明, SZOTT能够较好表征71个肽序列特征, 其含信息量大且易操作, 与PLS相比, SVM对lgk建模预测表现出较强的拟合能力和良好外部预测能力, SZOTT表征方法和SVM建模可进一步用于肽HPLC保留行为研究.  相似文献   

18.
Near-infrared (NIR) spectra in the region of 5000-4000 cm−1 with a chemometric method called searching combination moving window partial least squares (SCMWPLS) were employed to determine the concentrations of human serum albumin (HSA), γ-globulin, and glucose contained in the control serum IIB (CS IIB) solutions with various concentrations. SCMWPLS is proposed to search for the optimized combinations of informative regions, which are spectral intervals, considered containing useful information for building partial least squares (PLS) models. The informative regions can easily be found by moving window partial least squares regression (MWPLSR) method. PLS calibration models using the regions obtained by SCMWPLS were developed for HSA, γ-globulin, and glucose. These models showed good prediction with the smallest root mean square error of predictions (RMSEP), the relatively small number of PLS factors, and the highest correlation coefficients among the results achieved by using whole region and MWPLSR methods. The RMSEP values of HSA, γ-globulin, and glucose yielded by SCMWPLS were 0.0303, 0.0327, and 0.0195 g/dl, respectively. These results prove that SCMWPLS can be successfully applied to determine simultaneously the concentrations of HSA, γ-globulin, and glucose in complicated biological fluids such as CS IIB solutions by using NIR spectroscopy.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号