首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 156 毫秒
1.
吕巍  薛英 《物理化学学报》2010,26(2):471-477
脂肪组织中,激素敏感脂肪酶(HSL)被认为是调节脂肪酸代谢的关键限速酶.HSL在糖尿病的发病过程中起重要作用,抑制HSL活性有助于糖尿病的治疗,因此探索新颖的HSL抑制剂成为当前研究的热门.在激素敏感脂肪酶的作用机制和三维结构缺乏的情况下,需要发展预测HSL抑制剂的方法.本文采用几种机器学习方法(支持向量机(SVM)、k-最近相邻法(k-NN)和C4.5决策树(C4.5DT))对已知的HSL抑制剂与非抑制剂建立分类预测模型.252个结构多样性化合物(123个HSL抑制剂与129个HSL非抑制剂)被用于测试分类预测系统,并用递归变量消除法选择与HSL抑制剂相关的性质描述符以提高预测精度.本研究对独立验证集的总预测精度为75.0%-80.0%,HSL抑制剂的预测精度为85.7%-90.5%,非HSL抑制剂的预测精度为63.2%-68.4%.支持向量机方法给出最好的总预测精度(80.0%).本研究表明支持向量机等机器学习方法可以有效预测未知数据集中潜在的HSL抑制剂,并有助于发现与其相关的分子描述符.  相似文献   

2.
吕巍  薛英 《物理化学学报》2011,27(6):1407-1416
在丙型肝炎病毒(HCV)的基因复制和蛋白质成熟的过程中, 非结构蛋白5B(NS5B)作为RNA依赖的RNA聚合酶起到了重要的作用. 抑制NS5B聚合酶可以阻止丙型肝炎病毒的RNA复制, 因此成为一种治疗丙型肝炎的有效方法. 通过计算机方法进行虚拟筛选和预测NS5B聚合酶抑制剂已经变得越来越重要. 本文主要采用机器学习方法(支持向量机(SVM)、k-最近相邻法(k-NN)和C4.5决策树(C4.5 DT))对已知的丙型肝炎病毒NS5B蛋白酶抑制剂与非抑制剂建立分类预测模型. 1248个结构多样性化合物(552个NS5B抑制剂与696个非NS5B抑制剂)被用于测试分类预测系统, 并用递归变量消除法选择与NS5B抑制剂相关的性质描述符以提高预测精度. 独立验证集的总预测精度为84.1%-85.0%, NS5B抑制剂的预测精度为81.4%-91.7%, 非NS5B抑制剂的预测精度为78.2%-87.2%. 其中支持向量机给出最好的NS5B抑制剂预测精度(91.7%); C4.5决策树给出最好的非NS5B抑制剂预测精度(87.2%); k-最近相邻法给出最好的总预测精度(85.0%). 研究表明机器学习方法可以有效预测未知数据集中潜在的NS5B抑制剂, 并有助于发现与其相关的分子描述符.  相似文献   

3.
机器学习方法用于建立乙酰胆碱酯酶抑制剂的分类模型   总被引:1,自引:0,他引:1  
我们构建了表征乙酰胆碱酯酶抑制剂分子组成、电荷、拓扑、几何结构及物理化学性质等特征的1559个描述符,通过Fischer Score排序过滤和Monte Carlo模拟退火法相结合进行变量筛选得到37个描述符,然后分别用支持向量学习机(SVM)、人工神经网络(ANN)和k-近邻(k-NN)等机器学习方法建立了乙酰胆碱酯酶抑制剂的分类预测模型.对于训练集的515个样本,通过五重交叉验证,各机器学习方法对正样本,负样本和总样本的平均预测精度分别为87.3%-92.7%,67.0%-81.0%和79.4%-88.2%;通过y-scrambling方法验证SVM模型是否偶然相关,结果正样本,负样本和总样本的平均预测精度分别为72.7%-82.5%,41.0%-53.0%和62.1%-69.1%,明显低于实际所建模型的预测精度,表明所建模型不存在偶然相关;对172个没有参与建模的外部独立测试样本,各机器学习方法对正样本,负样本和总样本的预测精度分别为93.3%-100.0%,74.6%-89.6%和86.1%-95.9%.所建模型中,SVM模型预测精度最好,且明显高于其它文献报道结果.  相似文献   

4.
基于支持向量机方法的HERG钾离子通道抑制剂分类模型   总被引:1,自引:0,他引:1  
对human ether-a-gō-gō related genes(HERG)钾离子通道(钾通道)抑制剂,计算了表征分子组成、电荷分布、拓扑、几何结构及物理化学性质等特征的1559个分子描述符.采用Fischer Score(F-Score)排序过滤和Monte Carlo模拟退火法相结合从中筛选与HERG钾通道抑制剂分类相关的分子描述符.采用支持向量机(SVM)方法,分别以IC50=1.0、10.0μmol·L-1为分类标准,建立了三个分类预测模型.对367个训练集分子,用五重交叉验证.得到正、负样本的平均预测精度分别为84.8%-96.6%、80.7%-97.7%,其总的平均预测精度为87.1%-97.2%,优于其它文献报道结果.对97个外部测试集分子,所建三个模型的总样本预测精度在67.0%-90.1%之间,接近或优于其它文献报道结果.  相似文献   

5.
基质金属蛋白酶-13(MMP-13)为预防和治疗骨关节炎(OA)提供了充满希望的靶标.通过抑制剂来阻断MMP-13的活性将会对治疗OA疾病产生潜在的作用.然而,宽谱抑制剂同样抑制MMP家族的其它成员,特别是MMP-1,这将会导致肌与骨的综合症.因此,设计和发现潜在的MMP-13相对于MMP-1的高效选择性抑制剂,在对治疗OA新型药物的研发中具有相当重要的现实意义.本研究通过两种机器学习方法(ML):支持向量机(SVM)和随机森林(RF)来建立分类模型,用于预测不同结构的MMP-13对MMP-1的选择性抑制剂.所建这些模型的预测效果都已经达到了令人满意的精度.在这两种ML模型中,RF对于MMP-13选择性抑制剂和非抑制剂的精度分别达到97.58%和100%.同时,与MMP-13对MMP-1的选择性抑制最相关的分子描述符也基于不同的特征选择方法被两种模型挑选出来.最后,用预测效果最好的RF模型虚拟筛选了ZINC数据库的"fragment-like"子集,从而得到了一系列潜在的候选药物.研究表明,机器学习方法,特别是RF方法,对于发现潜在的MMP-13选择性抑制剂十分有效.同时还得到了一些与MMP-13的选择性抑制相关的分子描述符.  相似文献   

6.
基质金属蛋白酶-13 (MMP-13)为预防和治疗骨关节炎(OA)提供了充满希望的靶标. 通过抑制剂来阻断MMP-13的活性将会对治疗OA疾病产生潜在的作用. 然而,宽谱抑制剂同样抑制MMP家族的其它成员,特别是MMP-1,这将会导致肌与骨的综合症. 因此,设计和发现潜在的MMP-13 相对于MMP-1 的高效选择性抑制剂,在对治疗OA新型药物的研发中具有相当重要的现实意义. 本研究通过两种机器学习方法(ML):支持向量机(SVM)和随机森林(RF)来建立分类模型,用于预测不同结构的MMP-13 对MMP-1 的选择性抑制剂. 所建这些模型的预测效果都已经达到了令人满意的精度. 在这两种ML模型中,RF对于MMP-13选择性抑制剂和非抑制剂的精度分别达到97.58%和100%. 同时,与MMP-13对MMP-1的选择性抑制最相关的分子描述符也基于不同的特征选择方法被两种模型挑选出来. 最后,用预测效果最好的RF模型虚拟筛选了ZINC数据库的“fragment-like”子集,从而得到了一系列潜在的候选药物. 研究表明,机器学习方法,特别是RF方法,对于发现潜在的MMP-13选择性抑制剂十分有效. 同时还得到了一些与MMP-13的选择性抑制相关的分子描述符.  相似文献   

7.
本文应用一种组合遗传算法和共轭梯度法的支持向量机(GA-CG-SVM)方法建立了药物诱导磷脂质病分类预测模型.首先对描述符进行了优化,选出了19个描述符用于模型的构建,所建模型对训练集的预测准确率为81.6%,对测试集的预测精度为87.5%,说明所建SVM分类模型不仅能正确预测训练集药物诱导的磷脂质病,也对其他化合物具...  相似文献   

8.
HEC1(癌症高表达蛋白)是纺锤体检查点控制、着丝粒功能、细胞存活的关键的有丝分裂调节器,与原发性乳腺癌的不良预后有关.筛选具有高亲和力的HEC1新型抑制剂对探索乳腺癌的靶向治疗具有重要意义.本文从结构多样性的化合物库中筛选HEC1抑制剂.通过对分子描述符的特征筛选,采用支持向量机(SVM)和随机森林(RF)方法分别对HEC1抑制剂和非抑制剂建立了分类模型.经对比, RF模型显示了更好的预测精度.我们采用RF模型对HEC1抑制剂进行了虚拟筛选,从“in-house”实体库筛选得到2个潜在的HEC1抑制剂分子.随后对筛出的化合物进行了体外活性实验,发现对乳腺癌细胞株MDA-MB-468和MDA-MB-231均有一定程度的抗肿瘤活性.研究结果表明,机器学习方法对于设计和虚拟筛选HEC1抑制剂有良好的效果.  相似文献   

9.
为了预测人体免疫缺陷蛋白酶抑制剂的活性, 计算了表征分子的组成和拓扑特征的462个分子描述符, 用Kennard-Stone方法和随机方法进行了训练集和测试集设计, 用Monte Carlo 模拟退火方法进行变量筛选, 并分别用神经网络, 逻辑回归, k-近邻和支持向量学习机方法建立了HIV-1蛋白酶的抑制剂模型. 结果表明支持向量学习机优于其余机器学习方法, 用SVM方法所建立的最优模型的最后预测正确率达到98.24%.  相似文献   

10.
分别采用支持向量学习机、人工神经网络、调节性逻辑回归和K-最临近等机器学习方法对761个二氢叶酸还原酶抑制剂建立了其活性分类预测模型. 采用组成描述符和拓扑描述符表征抑制剂的分子结构及物理化学性质, 使用Kennard-Stone方法进行训练集的设计, 并用Metropolis Monte Carlo模拟退火方法作变量选择. 结果表明, 支持向量学习机优于其它机器学习方法, 所得到的最优模型具有较好的预测结果, 其预测正确率为91.62%. 说明通过合适的训练集设计及变量选择, 支持向量学习机方法可以很好地用于二氢叶酸还原酶抑制剂的活性分类预测.  相似文献   

11.
12.
为预测埃坡霉素类衍生物的抗癌活性, 定义了一套表征分子形状的描述符, 即K阶形状参数, 并计算了67个表征分子的电子、拓扑和几何结构的分子描述符. 描述符经遗传算法筛选, 用于建立基于支持向量学习机(SVM)的抗癌活性分类模型; 用留一法和5重交叉验证法对SVM模型参数进行了优化. 结果表明模型具有较高的预测性且两种方法得到相近结果, 交叉验证的预测正确率达80.6%; 经筛选后的描述符有30个, 其中含有5个K阶形状参数, 这些描述符对埃坡霉素类衍生物的抗癌活性的模型建立具有比较重要的作用.  相似文献   

13.
14.
15.
16.
17.
基于支持向量学习机方法的人体小肠吸收药物活性的预测   总被引:2,自引:0,他引:2  
为了预测分子在人体小肠中的吸收,本文计算了表征分子的电子、拓扑、几何结构、分子形状等特征的102个分子描述符,用遗传算法变量选择方法使描述符减少到47个。体系共包含了230个化合物分子,69个不能被吸收(mA-),161个可以被吸收(HIA )。对建立的SVM模型,用5重交叉验证和独立测试集进行验证,预测正确率分别达到79.1%和77.1%,结果具有较好的一致性。在模型验证中,通过聚类分析方法组合训练集和测试集,保证了模型的稳定性,提高了建模效率。  相似文献   

18.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号