首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 125 毫秒
1.
氨基酸描述子SZOTT用于多肽定量序效建模研究   总被引:1,自引:0,他引:1  
在相关研究的基础上, 提出一新的氨基酸描述子SZOTT, 该描述子所含信息量大, 且操作简便. 将其用于两类肽体系序列表征, 用偏最小二乘和正交信号纠正-偏最小二乘建模, 获得较好的建模结果.  相似文献   

2.
支持向量机分类和回归用于肽的QSAR研究   总被引:4,自引:0,他引:4  
周鹏  曾晖  李波  周原  李志良 《化学通报》2006,69(5):342-346
使用支持向量机技术对两类肽化合物体系进行了分类和回归研究,并将其系统地与K最邻近法、多元线性回归、偏最小二乘、人工神经网络进行了比较。结果表明,对于小样本、非线性问题,支持向量机具有较强的稳定性能及泛化能力,在大多数情况下能够得到优于传统方法的建模效果。对于分类问题,支持向量机对训练集和测试集都达到了100%的分类正确率;对于回归问题,支持向量机虽对训练集样本拟合效果略低于人工神经网络,但对外部测试集却表现出较强的预测能力。  相似文献   

3.
张纪阳  张代兵  张伟  谢红卫 《色谱》2012,30(9):857-863
基于质谱的大规模蛋白质鉴定中,在线液相色谱分离发挥了重要作用。色谱保留时间(retention time,RT)是肽段鉴定和定量的重要信息。由于整个色谱分析运行时间中,流动相中的有机相采用了非线性浓度曲线以及样品中肽段之间的相互影响等因素,基于肽段序列的RT预测还存在精度不高、模型推广性能差等问题。本文提出了一种基于串并联支持向量机(serial and parallel support vector machine,SP-SVM)的RT预测方法,能够表征洗脱过程中有机相浓度的非线性变化和肽段之间的相互影响,显著提高了肽段保留时间预测的精度。利用复杂样本数据集验证结果表明,预测RT和实验RT之间的决定系数达到了0.95,超过95%的鉴定肽段的RT预测误差范围小于总运行时间的20%,超过70%的鉴定肽段的RT预测误差范围小于总运行时间的10%。本文提出的模型的性能达到了目前已知的最好水平。  相似文献   

4.
基于支持向量机的高维特征非线性快速筛选与肽QSAR建模   总被引:1,自引:0,他引:1  
以氨基酸的531个物理化学性质参数直接表征肽的结构, 基于支持向量回归发展了一种新的高维特征非线性快速筛选方法, 将其应用于苦味二肽和血管紧张素转化酶抑制剂2个肽体系的定量序效关系(QSAR)建模, 各筛选获得10个意义明确的保留描述子. 以保留描述子建立支持向量回归模型, 其拟合精度、留一法交叉测试精度和外部预测精度较文献报道结果均有较大幅度提升, 优势明显; 对所建模型进行了非线性回归显著性测验、单因子相对重要性显著性测验和单因子效应分析, 增强了模型的可解释性. 新方法在肽、蛋白质QSAR建模等高维数据回归预测领域有广泛应用前景.  相似文献   

5.
提出一种新的组合方法用于β-turns预测和特征分析.该方法包括两步:如何表征β-turns特征和如何构建其预测模型.第一步应用氨基酸广义信息因子分析标度表征蛋白质中β-turns的结构特征,该标度涉及氨基酸的疏水性、α-螺旋与转角倾向、体积性质、构成特征、局部柔性及静电性.第二步以426个蛋白质为训练集样本,通过留1/7法交互验证,基于支持向量机建立β-turns预测模型.该模型分别成功地预测547和823个蛋白的β-turns.所得结果与所对比方法结果相当,更重要的是,SVM模型提供了一些关于β-turns特征的重要结构信息.该组合方法可以进一步尝试用于蛋白质结构预测及特征分析.  相似文献   

6.
一种新的玉米抗氧化肽的制备与结构表征   总被引:19,自引:0,他引:19  
用酶法在受控条件下降解玉米醇溶蛋白,对酶解产物进行分离纯化,获得一种新的抗氧化肽;对其一级结构进行了表征,氨基酸组成和顺序为Leu-Asp-Tyr-Glu;从结构上分析了其可能的抗氧化机制.  相似文献   

7.
一组新氨基酸描述子用于肽定量构效关系研究   总被引:2,自引:0,他引:2  
用主成分分析从20种天然氨基酸0D~3D结构信息中收集到的共1369个描述子变量得到了一组新氨基酸描述子(SZOTT), 将其用于血管紧张素转化酶抑制剂和苦味二肽结构表征并以偏最小二乘法建立定量构效关系模型, 得复相关系数RCU2分别为0.894和0.908, 留一法交互检验的复相关系数RCV2分别为0.828和0.736, 估计均方根误差RMS分别为0.331和0.195. 研究结果表明, SZOTT描述子含信息量大, 操作简便, 结构表达能力强, 有望在多肽定量构效关系研究中得到进一步推广.  相似文献   

8.
麻远  赵玉芬 《化学进展》2003,15(5):393-400
本文综述了多肽和蛋白质合成中的片段连接方法,这是近年来多肽和蛋白质合成领域中方法学上的重要进展.该方法使用非保护的多肽片段,无需酶或化学活化试剂,在缓冲溶液中能够高产率地获得多肽和蛋白质.还介绍了与多肽片段连接有关的肽硫酯和肽醛的合成方法.  相似文献   

9.
以支持向量机(SVM)和线性判别分析(LDA)对200条禽流感病毒、100条B型流感和100条C型流感病毒蛋白共400条为训练集样本,从表征序列的200个整体与局部变量中以逐步(stepwise)方法选取24个变量作为LDA模型的输入建立线性识别模型,病毒蛋白总识别率达99.8%,留一法交互检验总识别率为99.4%.从原始200变量中经主成分分析得16个主成分作为SVM的输入,以径向基核函数(RBF)SVM建立非线性识别模型,病毒蛋白总识别率为99.8%,留一法交互检验总识别率为99.2%.以100条禽流感、50条B型流感和50条C型流感病毒编码蛋白质共200条为测试集样本,得LDA模型,对其总识别正确率为95.4%,SVM模型对其总识别正确率为96.5%.识别结果表明,两个模型都可较好识别禽流感病毒蛋白,并且SVM对禽流感病毒蛋白的识别结果优于LDA.  相似文献   

10.
支持向量机方法预测有机物的亨利常数   总被引:4,自引:2,他引:4  
以有机物摩尔体积V、偶极项π*、氢键给予体的酸性am、氢键接受体的碱性βm等四种理化参数为输入变量,利用支持向量机方法对72种有机物的亨利常数值进行了定量预测研究。研究发现,采用支持向量机方法可以实现使用较少样本数据建模,并达到较好的预测结果。支持向量方法的预测结果远优于线性回归法预测结果。  相似文献   

11.
海水中铁(Ⅲ)-二元有机酸盐配合物的光化学反应研究   总被引:1,自引:0,他引:1  
采用实验室模拟的方法研究了高压汞灯模拟日光照射下铁(Ⅲ)-二元有机酸盐配合物在天然海水中的光化学反应.结果发现,在二元有机酸盐配体的存在下,铁(Ⅲ)发生光化学反应生成还原态的铁(Ⅲ),铁(Ⅲ)会被溶液中的氧再氧化为铁(Ⅲ).铁(Ⅲ)的光还原反应速率受到配体浓度、pH、光强以及温度的影响.在二元有机酸与Fe(Ⅲ)浓度配比大于2的情况下,Fe(Ⅲ)-二元有机酸盐配合物的光还原反应初期铁(Ⅲ)浓度的增长符合一级动力学反应规律,100min后浓度趋于稳定,方程式为[Fe(Ⅲ)]t=kOA[OA]·[Fe(Ⅲ)]ini×[1-exp{-(kOA[OA]+kox)t}]/(kOA[OA]+kox).光强升高和pH降低都能加快光还原反应速率,而改变温度则基本上对光还原反应速率无影响,证明铁(Ⅲ)的光还原反应为自由基引发的电子转移过程.  相似文献   

12.
陈国华  夏之宁  陆瑶 《化学学报》2010,68(11):1137-1142
选取25条CPP和16条非CPP作为训练集样本, 以61条CPP和21条非CPP为预测集样本. 利用氨基酸的z-Scale对肽链进行编码, 分别使用原始72个自交叉协方差变量和它们的主成分矢量进行线性判别(LDA)和支持矢量机(SVM)分类研究. 当采用LDA方法时, 对于训练集的预测以及它们的留一法交互检验, 均获得比较优越的结果, 但对预测集的预测总的识别率的最优结果仅为57.3%. 分别利用主成分和原始变量集作为SVM的输入建立的非线性识别模型, 对训练集的总识别率分别为85.4%和100%, 留一法交互检验的总识别率分别为80.5%和75.6%, 对预测集的最优总识别正确率为74.4%. 识别结果表明SVM能够比较好的提取原始变量间的细微模式变化, 对CPP总的识别结果优于LDA.  相似文献   

13.
在有机溶剂中进行酶催化合成肽及肽类衍生物的研究进展   总被引:2,自引:0,他引:2  
介绍了有机溶剂中含非天然组分的肽及肽类衍生物的酶催化反应,同时对研究有机溶剂中酶的活性与结构关系的谱学技术进行了评述.  相似文献   

14.
Journal of Computer-Aided Molecular Design - The support vector machine (SVM) algorithm is one of the most widely used machine learning (ML) methods for predicting active compounds and molecular...  相似文献   

15.
一种新三维氨基酸描述子SVTD及在肽QSAR的应用   总被引:1,自引:0,他引:1  
  相似文献   

16.
研究了火电厂电煤煤粉的近红外光谱特征,提取了前3个主成分和前6个离散傅立叶变换(DFT)系数,结合主成分得分、马氏距离和偏最小二乘(PLS)交互验证方法剔除异常样本,并建立偏最小二乘回归(PLSR)、栅格支持向量机回归(G-SVR)、遗传算法支持向量机回归(GA-SVR)和粒子群算法支持向量机回归(PSO-SVR)等定量分析模型。结果表明,利用DFT系数作为PSO-SVR模型的输入变量,当其进化代数为300,种群规模为20,模型参数c1、c2为1.5,1.7时,性能最优,其中校正集相关系数(RC)为0.990,测试集相关系数(RP)为0.954,定标标准差(SEC)为0.366,测试标准差(SEP)为0.128。该方法准确可靠,已成功应用于近红外在线电煤发热量监测系统,并可推广用于其它较为复杂的近红外在线分析系统。  相似文献   

17.
The cistrans photoisomerization of the azobenzene building block 4-(4-aminophenylazo)benzoic acid incorporated in a cyclic peptide (see scheme) facilitated a two-state transition of the peptide chain from a rigid constrained conformation in the trans isomer into the largely free conformational space of the cis isomer.  相似文献   

18.
Sulfonamides are a classic group of chemotherapeutic drugs with a broad spectrum of pharmacological action, including anticancer activity. In this work, reversed-phase high-performance liquid chromatography and biomimetic chromatography were applied to characterize the lipophilicity of sulfonamide derivatives with proven anticancer activities against human colon cancer. Chromatographically determined lipophilicity parameters were compared with obtained logP, employing various computational approaches. Similarities and dissimilarities between experimental and computational logP were studied using principal component analysis, cluster analysis, and the sum of ranking differences. Furthermore, quantitative structure–retention relationship modeling was applied to understand the influences of sulfonamide’s molecular properties on lipophilicity and affinity to phospholipids.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号