首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 265 毫秒
1.
高活性细胞毒T细胞(CTL)表位鉴定是设计肿瘤疫苗的关键内容.采用天然氨基酸的531个物理化学性质参数表征HLA-A*0201限制性表位9肽, 从531×9个初始描述子出发, 经二元矩阵重排过滤器粗筛和多轮末尾淘汰精细筛选, 获得18个物理化学意义明确的保留描述子. 18个保留描述子主要涉及除1位、5位外各位置残基的疏水性和空间结构特征, 3位残基疏水性对活性影响最大, 且2位、4位、9位残基共占10个保留描述子,支持2位和9位残基为锚点、3位为关键位点以及4位残基为标志链的现有认知. 对18个保留描述子以支持向量回归构建定量序效模型,其拟合、留一法交叉验证决定系数R2、Qcv2分别为0.957、0.708; 独立预测决定系数及均方根误差Qext2 、RMSEext分别为0.818、0.366, 明显优于文献报道. 通过对全组合虚拟9肽的预测, 得到了多条预测活性高于已知表位肽的9肽, 可供实验验证. 较全面阐明了特定位置残基对多肽亲和性的影响规律, 为高活性多肽疫苗分子设计提供了切实指导.  相似文献   

2.
基于支持向量机的高维特征非线性快速筛选与肽QSAR建模   总被引:1,自引:0,他引:1  
以氨基酸的531个物理化学性质参数直接表征肽的结构, 基于支持向量回归发展了一种新的高维特征非线性快速筛选方法, 将其应用于苦味二肽和血管紧张素转化酶抑制剂2个肽体系的定量序效关系(QSAR)建模, 各筛选获得10个意义明确的保留描述子. 以保留描述子建立支持向量回归模型, 其拟合精度、留一法交叉测试精度和外部预测精度较文献报道结果均有较大幅度提升, 优势明显; 对所建模型进行了非线性回归显著性测验、单因子相对重要性显著性测验和单因子效应分析, 增强了模型的可解释性. 新方法在肽、蛋白质QSAR建模等高维数据回归预测领域有广泛应用前景.  相似文献   

3.
周鹏  李志良  田菲菲  张梦军 《化学学报》2006,64(20):2065-2070
给出了基于定量序效模型(QSAM)的计算机辅助虚拟疫苗库设计方案, 并以此为基础成功组建了一个合理规模的HLA-A*0201限制性CTL表位库, 其实现流程如下: (1)从天然氨基酸516种理化性质经主成分分析(PCA)得到一种新的氨基酸描述子: 氨基酸综合性质得分(SP-score); (2)基于SP-score结合遗传-偏最小二乘(GA-PLS)技术建立QSAM模型; (3)利用QSAM模型作为评价工具采用遗传算法(GA)优化CTL表位种群; (4)统计优秀种群中20种氨基酸分别在抗原肽序列不同位置出现频率f; (5)保留fF (F为平均出现概率, 对于任意氨基酸为1/20)的氨基酸作为该位置的有利残基类型参与虚拟组合库的构建.  相似文献   

4.
从20种天然氨基酸197个GETAWAY指数经主成分分析得出一种新3D氨基酸描述子——VSGETAWAY[vector of principal component scores for GETAWAY (geometry, topology and atom-weights assembly)]. 将其应用于48个苦味活性二肽、31个血管舒缓激肽促进剂和20个促凝血酶原激酶抑制剂结构表征并以偏最小二乘(PLS)对3个体系建立定量构效关系(QSAR)模型, 得复相关系数(Rcum2)与交互检验复相关系数(Qcum2)分别为0.887和0.753; 0.995和0.708; 0.999和0.802. 研究结果表明, VSGETAWAY描述子操作简便、结构表达能力强, 有望成为多肽药物QSAR研究中一种有效的结构表征方法.  相似文献   

5.
周鹏  周原  曾晖  李志良 《化学通报》2006,69(6):465-468
从天然碱基的36种性质参数出发,通过主成分分析(PCA)技术处理得到了1个显著的主成分得分,并将该得分作为单个碱基的信息描述子———VBPV。进而使用VBPV对38个大肠杆菌(E.coli)启动子序列一级结构进行表征,并结合多元统计方法将表征参数与转录启动强度(PS)成功地建立了定量序列活性模型(QSAM),该模型拟合复相关系数Rcum与交叉检验复相关系数Qcum分别为0.97和0.95。  相似文献   

6.
从20 种天然氨基酸的171个物化性质出发, 按照疏水、立体和电性特征及氢键贡献将其分类后, 分别进行主成分分析, 得到一个新描述子VHSEH(Principal component score vector of hydrophobic, steric, electronic properties and, hydrogen bonds contributions). 对后叶催产素的结构进行了表征, 并以偏最小二乘法及D-优化划分样本建立了PLS定量序效关系模型, 得到复相关系数R2分别为 0.958 和 0.957, Q2分别为0.903和0.845, 约高于VHSE描述子模型值; 对抗菌肽进行了结构表征, 建立了PLS和OSC-PLS模型, 其R2分别为0.84和 0.995, Q2分别为0.546和0.926, 较SZOTT描述子结果好; 对58 个血管紧张素转化酶抑制剂进行QSAM研究, 得到R2, Q2及RMS分别为0.877, 0.838和0.361. 研究结果表明, VHSEH 描述子信息量大, 物化意义明确, 结果更易解释.  相似文献   

7.
折叠速率预测对阐明蛋白质折叠机理意义重大.本文收集了115条目前已知折叠速率的蛋白质样本(包括二态、多态和混态蛋白),为了较全面地表征蛋白质分子的一级结构信息,提取序列长度、氨基酸残基多尺度组分、成对残基k-space特征与基于残基物理化学性质的地统计学关联总共9357维特征.经改进的二元矩阵重排过滤器和多轮末尾淘汰非线性筛选,获得23个物理化学意义明确的保留特征,建立的非线性支持向量回归模型Jackknife交叉验证的相关系数R=0.95,优于文献报道及其他参比特征选择方法.支持向量回归解释体系表明折叠速率与保留描述符的非线性回归极显著,分析了各保留描述符对折叠速率的影响,结果表明蛋白质折叠速率与序列长度、中短程关联特征、三联体残基组份特征等密切相关.  相似文献   

8.
从20种天然氨基酸的1369种性质参数经主成分分析得出一种新多肽序列表征方法——SZOTT. 将其用于71个不同长度肽序列表征, 以偏最小二乘(PLS)和支持向量机(SVM)建立定量结构-保留模型(QSRM). 研究表明, SZOTT能够较好表征71个肽序列特征, 其含信息量大且易操作, 与PLS相比, SVM对lgk建模预测表现出较强的拟合能力和良好外部预测能力, SZOTT表征方法和SVM建模可进一步用于肽HPLC保留行为研究.  相似文献   

9.
10.
基于岭回归和SVM的高维特征选择与肽QSAR建模   总被引:1,自引:0,他引:1  
岭回归估计权重绝对值在一定程度上体现了对应特征作用大小, 据此发展了基于岭回归(RR)和支持向量机(SVM)的高维特征选择算法. 对苦味二肽(BTT)和细胞毒性T淋巴细胞(CTL)表位9 肽两个肽体系, 以氨基酸的531 个物理化学性质参数直接表征肽结构, 各获得1062、4779 个初始特征; 对训练集, 初始特征以岭回归排序后序贯引入, 当SVM留一法交叉测试(LOOCV)的均方误差(MSE)显著上扬时终止, 最后以多轮末尾淘汰进一步精筛, 分别获得7、18个物理化学意义明确的保留特征. 基于保留特征与支持向量回归(SVR), 对训练集建立定量构效关系(QSAR)模型, 预测独立测试集, 其拟合精度、留一法交叉测试精度、独立预测精度均优于现有文献报道结果. 新方法运行速度快, 选取的特征物理化学意义明确, 解释性强, 在肽、蛋白质定量构效关系建模等高维数据回归预测领域有较广泛应用前景.  相似文献   

11.
12.
ω-芋螺毒素属于海洋生物活性多肽,由24-31个氨基酸残基组成.特异性作用于电压敏感的钙离子通道(VGCCs),能够直接开发成药物或作为先导化合物进行新药开发.本文应用新型氨基酸残基结构描述符cscales和遗传偏最小二乘算法,对ω-芋螺毒素进行定量构效关系(QSAR)研究,并设计、构建了容量为2244个化合物的N-型和P/Q-型VGCC拮抗剂虚拟组合多肽库,然后分别采用QSAR模型预测和相似性搜索方法对组合多肽库进行了虚拟筛选.研究结果表明,建立的N-型和P/Q-型VGCC拮抗剂QSAR模型均具有较好的预测能力,交叉验证相关系数(CV-r2)均大于0.89.主成分分析和聚类分析结果表明,虚拟组合多肽库中化合物具有较好的结构多样性和差异性.通过虚拟筛选,得到了具有高预测活性的6个N-型和19个P/Q-型钙离子通道拮抗剂,为进一步的合成和活性评价奠定了理论基础.同时,本文建立的多肽QSAR预测模型和虚拟筛选策略,为其它多肽类化合物的定量构效关系研究和虚拟筛选提供了参考.  相似文献   

13.
ω-芋螺毒素属于海洋生物活性多肽, 由24-31 个氨基酸残基组成. 特异性作用于电压敏感的钙离子通道(VGCCs), 能够直接开发成药物或作为先导化合物进行新药开发. 本文应用新型氨基酸残基结构描述符cscales和遗传偏最小二乘算法, 对ω-芋螺毒素进行定量构效关系(QSAR)研究, 并设计、构建了容量为2244 个化合物的N-型和P/Q-型VGCC拮抗剂虚拟组合多肽库, 然后分别采用QSAR模型预测和相似性搜索方法对组合多肽库进行了虚拟筛选. 研究结果表明, 建立的N-型和P/Q-型VGCC拮抗剂QSAR模型均具有较好的预测能力, 交叉验证相关系数(CV-r2)均大于0.89. 主成分分析和聚类分析结果表明, 虚拟组合多肽库中化合物具有较好的结构多样性和差异性. 通过虚拟筛选, 得到了具有高预测活性的6 个N-型和19 个P/Q-型钙离子通道拮抗剂, 为进一步的合成和活性评价奠定了理论基础. 同时, 本文建立的多肽QSAR预测模型和虚拟筛选策略, 为其它多肽类化合物的定量构效关系研究和虚拟筛选提供了参考.  相似文献   

14.
15.
16.
17.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号