排序方式: 共有32条查询结果,搜索用时 15 毫秒
11.
基于氨基酸物化性质的描述子矢量VHSE, 对21个后叶催产素类似物进行结构表征. 经逐步回归与偏最小二乘相结合的变量筛选技术, 根据模型的外部预测结果, 筛选得到一个最优的9变量组合. 应用该变量组合对21个后叶催产素类似物的促宫缩活性进行偏最小二乘建模, 模型复相关系数R2为92.6%, 留一法和留组法交互验证Q2分别为78.3%和79.4%. 结果表明, 后叶催产素的促宫缩活性主要与第3号氨基酸残基的疏水性、立体结构和电性性质以及第8号氨基酸残基的电性特征密切相关. 相似文献
12.
梁桂兆 陈泽聪 杨善彬 梅虎 周原 舒茂 杨力 杨胜喜 郑小林 陈国华 周鹏 田菲菲 廖春阳 吴世容 李根容 李德静 何留 甘孟瑜 高剑坤 陈国平 王贵学 龙莎 景举华 曾晖 张巧霞 张梦军 杨娟 仝建波 王娇娜 刘永红 李波 仇亮加 蔡绍皙 赵娜 杨艳 苏霞利 宋健 陈美霞 陈刚 张雪姣 孙家英 李经纬 邓婕 彭传友 李志 许罗南 廖立敏 吴玉乾 朱万平 苏勤亮 卢大军 李军 黄振虎 周萍 李志良 《中国科学B辑》2007,37(6)
以支持向量机(SVM)和线性判别分析(LDA)对200条禽流感病毒、100条B型流感和100条C型流感病毒蛋白共400条为训练集样本,从表征序列的200个整体与局部变量中以逐步(stepwise)方法选取24个变量作为LDA模型的输入建立线性识别模型,病毒蛋白总识别率达99.8%,留一法交互检验总识别率为99.4%.从原始200变量中经主成分分析得16个主成分作为SVM的输入,以径向基核函数(RBF)SVM建立非线性识别模型,病毒蛋白总识别率为99.8%,留一法交互检验总识别率为99.2%.以100条禽流感、50条B型流感和50条C型流感病毒编码蛋白质共200条为测试集样本,得LDA模型,对其总识别正确率为95.4%,SVM模型对其总识别正确率为96.5%.识别结果表明,两个模型都可较好识别禽流感病毒蛋白,并且SVM对禽流感病毒蛋白的识别结果优于LDA. 相似文献
13.
泛素-蛋白酶体在真核生物的抗原呈递、细胞周期调控和转录因子激活等生理过程中发挥着极为重要的作用,其核心就是蛋白酶体对底物的选择性酶切作用,因此对选择性酶切位点的预测一直是计算生物学的一个重点研究内容.针对现有酶切位点预测方法的非线性和物理意义不明确等问题,借鉴定量构效关系研究方法,采用基于氨基酸物理化学性质的描述子——VHSE(Principal component score vector of hydrophobic,steric,and electronic properties)对收集的2650个MHC-I配体的源蛋白序列进行了结构表征,在此基础上利用支持向量机建立了蛋白酶体酶切位点的预测模型,其最优线性模型的灵敏度(Sensitivity)、特异性(Specificity)、接受者操作特征曲线下面积(area under receiver operatingcharacteristics curve,AUC)和马休斯相关系数(Matthews coefficient of correlation,MCC)分别为90.18%,69.63%,0.8797和0.6131.模型分析结果表明:影响酶切位点选择性的氨基酸性质由大到小依次为:疏水性、电性和立体特征;P9,P8,P4,P1,P3’,P4’和P5’位氨基酸对酶切位点的选择有重要影响,研究亦显示酶切位点上游P1位和下游P1’~P5’的"疏水势差"有利于蛋白酶体的切割作用. 相似文献
14.
原子类型电拓扑状态指数预测吲哚喹唑啉衍生物的抗癌性 总被引:1,自引:1,他引:0
采用原子类型电拓扑状态指数(ETSIAT)对17个吲哚喹唑啉衍生物的抗癌活性进行定量构效关系(QSAR)的研究. 经逐步回归变量筛选, 得到包含4个ETSIAT变量的最优偏最小二乘模型, 其复决定系数R2、留一法交互验证复决定系数Q2和均方根误差RMSEE分别为0.806、0.736 和0.248. 将样本随机分为训练集和预测集后, 采用相同变量组合对模型进行外部验证, 结果显示模型具有较高的外部预测能力. 模型分析结果显示, 与抗癌活性相关的4个ETSIAT描述子对应结构碎片分别为≥N=, —NH—, =O, >N—. 其中—NH—结构碎片与抗癌活性呈负相关关系, 而≥N=, >N—和=O则与抗癌活性呈正相关关系. 此外, 研究亦显示, 取代基R1上存在强的吸电子基团可显著提高化合物的抗癌活性, 且影响抗癌活性的因素可能还有R2基团的空间位阻效应. 据此设计出4个化合物的预测活性比最高活性样本分别提高7.7%、15.3%、23.1%和130%. 相似文献
15.
采用表征分子内部化学微环境及原子所处杂化状态的结构描述子:原子电性作用矢量(AEIV)和原子杂化状态指数(AHSI),对42个吖啶酮生物碱分子792个共振碳原子进行结构表征,以多元线性回归技术建立13C核磁共振化学位移定量结构波谱关系模型,所得回归模型的复相关系数为R=0.957,标准偏差为SD=12.247. 采用留一法交互检验的结果为Rcv=0.956,标准偏差SDcv=12.331. 对外部样本集预测结果表明,AEIV和AHSI具有表征能力强、物化意义明确等优点,所建模型具有良好的稳定性和估计能力. 相似文献
16.
原子电性作用矢量和杂化状态指数用于氨基酸核磁共振碳谱模拟 总被引:3,自引:4,他引:3
提出了用于表征分子局部化学微环境及原子所处杂化状态的结构描述子:原子电性作用矢量(AEIV)和原子杂化状态指数(AHSI),将其应用于20个天然氨基酸103个碳原子13C核磁共振模拟中,取得满意结果。模型计算值、留一法(LOO-CV)交互校验预测值和新颖的留一分子法(LMO)交互校验预测值的复相关系数分别为r=0.9948、0.9940和0.9924。进一步使用4个非天然氨基酸化学位移值来测试该模型的预测能力,预测复相关系数为r=0.9940。 相似文献
17.
一种新的氨基酸描述子及其在肽QSAR中的应用 总被引:11,自引:0,他引:11
从天然氨基酸的25个结构与拓扑变量中经主成分分析得到一种新的氨基酸描述子——VSTV (principal component scores vector of structural and topological variables).应用该描述子对以下3个体系,即血管紧张素转化酶抑制剂(2肽)、抗菌18肽和促凝血酶原激酶抑制剂(6~12肽)进行分子结构参数化表达,并在此基础上通过偏最小二乘回归(PLSR)建立定量构效关系(QSAR)模型,取得了优于文献的结果.模型的复相关系数(R2)和交互检验复相关系数(Q2)分别为0.789, 0.767; 0.996, 0.879; 0.981, 0.480. 相似文献
18.
19.
20.
针对56个环氧酮肽衍生物,分别采用比较分子场分析(comparative molecular field analysis,CoMFA)、比较分子相似性形状指数分析(comparative molecular similarity indices analysis,CoMSIA)、Topomer CoMFA、Holo-gram QSAR(HQSAR)以及基于一维和二维描述符的支持向量机(support vector machine,SVM)方法进行了细致的构效关系研究。研究显示:通过引入一维和二维描述符的SVM建模方法,避免了柔性分子在三维构效关系研究中的构象选择和叠合难题,亦可有效避免过拟合现象的发生。所建最优SVM模型的决定系数R2、均方根误差(RMS)、交互验证系数Q2和外部预测R2pred分别为0.681,0.436,0.572和0.641。分析结果显示:电性、拓扑特征、疏水性和分子体积是影响环氧酮肽蛋白酶体抑制活性的主要因素。在此基础上,以活性最高样本分子(CID:42638286的)为模板,基于相似性评价方法对其侧链进行设计,结合Lipinski"5规则"类药性筛选,共得到12个新颖目标分子,且预测活性均达到纳摩尔水平。 相似文献