共查询到20条相似文献,搜索用时 15 毫秒
1.
基于机器学习方法的激素敏感脂肪酶抑制剂活性预测(英文) 总被引:1,自引:0,他引:1
脂肪组织中,激素敏感脂肪酶(HSL)被认为是调节脂肪酸代谢的关键限速酶.HSL在糖尿病的发病过程中起重要作用,抑制HSL活性有助于糖尿病的治疗,因此探索新颖的HSL抑制剂成为当前研究的热门.在激素敏感脂肪酶的作用机制和三维结构缺乏的情况下,需要发展预测HSL抑制剂的方法.本文采用几种机器学习方法(支持向量机(SVM)、k-最近相邻法(k-NN)和C4.5决策树(C4.5DT))对已知的HSL抑制剂与非抑制剂建立分类预测模型.252个结构多样性化合物(123个HSL抑制剂与129个HSL非抑制剂)被用于测试分类预测系统,并用递归变量消除法选择与HSL抑制剂相关的性质描述符以提高预测精度.本研究对独立验证集的总预测精度为75.0%-80.0%,HSL抑制剂的预测精度为85.7%-90.5%,非HSL抑制剂的预测精度为63.2%-68.4%.支持向量机方法给出最好的总预测精度(80.0%).本研究表明支持向量机等机器学习方法可以有效预测未知数据集中潜在的HSL抑制剂,并有助于发现与其相关的分子描述符. 相似文献
2.
机器学习方法用于建立乙酰胆碱酯酶抑制剂的分类模型 总被引:1,自引:0,他引:1
我们构建了表征乙酰胆碱酯酶抑制剂分子组成、电荷、拓扑、几何结构及物理化学性质等特征的1559个描述符,通过Fischer Score排序过滤和Monte Carlo模拟退火法相结合进行变量筛选得到37个描述符,然后分别用支持向量学习机(SVM)、人工神经网络(ANN)和k-近邻(k-NN)等机器学习方法建立了乙酰胆碱酯酶抑制剂的分类预测模型.对于训练集的515个样本,通过五重交叉验证,各机器学习方法对正样本,负样本和总样本的平均预测精度分别为87.3%-92.7%,67.0%-81.0%和79.4%-88.2%;通过y-scrambling方法验证SVM模型是否偶然相关,结果正样本,负样本和总样本的平均预测精度分别为72.7%-82.5%,41.0%-53.0%和62.1%-69.1%,明显低于实际所建模型的预测精度,表明所建模型不存在偶然相关;对172个没有参与建模的外部独立测试样本,各机器学习方法对正样本,负样本和总样本的预测精度分别为93.3%-100.0%,74.6%-89.6%和86.1%-95.9%.所建模型中,SVM模型预测精度最好,且明显高于其它文献报道结果. 相似文献
3.
分别采用支持向量学习机、人工神经网络、调节性逻辑回归和K-最临近等机器学习方法对761个二氢叶酸还原酶抑制剂建立了其活性分类预测模型. 采用组成描述符和拓扑描述符表征抑制剂的分子结构及物理化学性质, 使用Kennard-Stone方法进行训练集的设计, 并用Metropolis Monte Carlo模拟退火方法作变量选择. 结果表明, 支持向量学习机优于其它机器学习方法, 所得到的最优模型具有较好的预测结果, 其预测正确率为91.62%. 说明通过合适的训练集设计及变量选择, 支持向量学习机方法可以很好地用于二氢叶酸还原酶抑制剂的活性分类预测. 相似文献
4.
在丙型肝炎病毒(HCV)的基因复制和蛋白质成熟的过程中, 非结构蛋白5B(NS5B)作为RNA依赖的RNA聚合酶起到了重要的作用. 抑制NS5B聚合酶可以阻止丙型肝炎病毒的RNA复制, 因此成为一种治疗丙型肝炎的有效方法. 通过计算机方法进行虚拟筛选和预测NS5B聚合酶抑制剂已经变得越来越重要. 本文主要采用机器学习方法(支持向量机(SVM)、k-最近相邻法(k-NN)和C4.5决策树(C4.5 DT))对已知的丙型肝炎病毒NS5B蛋白酶抑制剂与非抑制剂建立分类预测模型. 1248个结构多样性化合物(552个NS5B抑制剂与696个非NS5B抑制剂)被用于测试分类预测系统, 并用递归变量消除法选择与NS5B抑制剂相关的性质描述符以提高预测精度. 独立验证集的总预测精度为84.1%-85.0%, NS5B抑制剂的预测精度为81.4%-91.7%, 非NS5B抑制剂的预测精度为78.2%-87.2%. 其中支持向量机给出最好的NS5B抑制剂预测精度(91.7%); C4.5决策树给出最好的非NS5B抑制剂预测精度(87.2%); k-最近相邻法给出最好的总预测精度(85.0%). 研究表明机器学习方法可以有效预测未知数据集中潜在的NS5B抑制剂, 并有助于发现与其相关的分子描述符. 相似文献
5.
6.
与传统的非甾体类消炎药相比,选择性环氧化酶-2抑制剂具有无胃肠道粘膜损伤,溃疡和肾功能障碍等严重的副作用,设计选择性环氧化酶-2抑制剂具有重要意义。本文用支持矢量学习机和神经网络两种机器学习方法建立选择性环氧化酶-2抑制剂的活性预测模型,以期为选择性环氧化酶-2抑制剂药物的合成提供先导化合物。我们将467个环氧化酶-2抑制剂用Kennard-Stone方法分为训练集,验证集和独立测试集,对每一抑制剂分子我们计算了463个包含组成描述符和拓扑描述符的分子描述符来表征其分子结构,并通过F-Score方法选取最重要的分子描述符用于分类模型的建立。结果表明,SVM方法通过变量筛选后具有很好的预测能力,其预测正确率达到93.30%。 相似文献
7.
流感是一种主要的呼吸道传染病, 在普通人群中有着较高的发病率, 而对于一些年老和高危病人还有较高的死亡率. 研究显示抑制神经氨酸苷酶(NA)可以阻断病毒RNA复制, 因此NA是有效治疗H1N1型流感病毒的重要药物靶标. 通过计算机方法进行虚拟筛选和预测NA抑制剂已经变得越来越重要. 针对酶活性位点进行基于结构的合理药物设计, 开发H1N1 病毒神经氨酸苷酶抑制剂, 已成为药物研究的热点之一. 本文通过多种机器学习方法(支持向量机(SVM)、k-最近相邻法(k-NN)和C4.5决策树(C4.5DT))对已知的神经氨酸苷酶抑制剂(NAIs)与非神经氨酸苷酶抑制剂(non-NAIs)建立分类预测模型. 其中227个结构多样性化合物(72个NAIs与155个non-NAIs)被用于测试分类预测系统, 并用递归变量消除法选择与神经氨酸苷酶抑制剂分类相关的性质描述符以提高预测精度. 本研究对独立验证集的总预测精度为75.9%-92.6%, NA 抑制剂的预测精度为64.3%-78.6%, 非H1N1抑制剂的预测精度为77.5%-97.5%. SVM法给出最好的总预测精度(92.6%). 本研究表明支持向量机等机器学习方法可以有效预测未知数据集中潜在的NA抑制剂, 并有助于发现与其相关的分子描述符. 相似文献
8.
HEC1(癌症高表达蛋白)是纺锤体检查点控制、着丝粒功能、细胞存活的关键的有丝分裂调节器,与原发性乳腺癌的不良预后有关.筛选具有高亲和力的HEC1新型抑制剂对探索乳腺癌的靶向治疗具有重要意义.本文从结构多样性的化合物库中筛选HEC1抑制剂.通过对分子描述符的特征筛选,采用支持向量机(SVM)和随机森林(RF)方法分别对HEC1抑制剂和非抑制剂建立了分类模型.经对比, RF模型显示了更好的预测精度.我们采用RF模型对HEC1抑制剂进行了虚拟筛选,从“in-house”实体库筛选得到2个潜在的HEC1抑制剂分子.随后对筛出的化合物进行了体外活性实验,发现对乳腺癌细胞株MDA-MB-468和MDA-MB-231均有一定程度的抗肿瘤活性.研究结果表明,机器学习方法对于设计和虚拟筛选HEC1抑制剂有良好的效果. 相似文献
9.
基质金属蛋白酶-13(MMP-13)为预防和治疗骨关节炎(OA)提供了充满希望的靶标.通过抑制剂来阻断MMP-13的活性将会对治疗OA疾病产生潜在的作用.然而,宽谱抑制剂同样抑制MMP家族的其它成员,特别是MMP-1,这将会导致肌与骨的综合症.因此,设计和发现潜在的MMP-13相对于MMP-1的高效选择性抑制剂,在对治疗OA新型药物的研发中具有相当重要的现实意义.本研究通过两种机器学习方法(ML):支持向量机(SVM)和随机森林(RF)来建立分类模型,用于预测不同结构的MMP-13对MMP-1的选择性抑制剂.所建这些模型的预测效果都已经达到了令人满意的精度.在这两种ML模型中,RF对于MMP-13选择性抑制剂和非抑制剂的精度分别达到97.58%和100%.同时,与MMP-13对MMP-1的选择性抑制最相关的分子描述符也基于不同的特征选择方法被两种模型挑选出来.最后,用预测效果最好的RF模型虚拟筛选了ZINC数据库的"fragment-like"子集,从而得到了一系列潜在的候选药物.研究表明,机器学习方法,特别是RF方法,对于发现潜在的MMP-13选择性抑制剂十分有效.同时还得到了一些与MMP-13的选择性抑制相关的分子描述符. 相似文献
10.
金属有机框架(Metal-organic framework ,MOF)因其高孔隙率、高比表面积和结构可调性,在气体吸附分离领域广泛应用。随着MOF数量激增,传统分子模拟和实验方法验证MOF性能成本高且速度慢,因此目前MOF筛选工作已转向高通量计算辅助的机器学习(Machine-learning,ML)。机器学习作为一种高效的大数据处理方法,能够在高通量筛选(High-Throughput Computational Screening,HTCS)的基础上对数据进行拟合,从而快速而准确地筛选出气体吸附分离材料,并深入挖掘其结构与性能之间的关系。本文回顾了近年机器学习应用于MOF筛选的研究。本文重点讨论了一些运用机器学习从大量结构中筛选出可用于CH4、H2和CO2等气体吸附分离与储存的MOF材料的工作。同时,我们梳理了当前MOF材料筛选工作中的研究思路和进展,并指出了机器学习在筛选MOF材料工作中面临的一些瓶颈和挑战。最后,对该领域的未来发展前景进行了展望。 相似文献
11.
丝印电极法体外筛选黄嘌呤氧化酶抑制剂方法研究 总被引:1,自引:0,他引:1
建立丝印电极快速筛选黄嘌呤氧化酶(XO)抑制剂的新方法. 利用丝网印刷技术制作一次性使用的丝印碳糊电极, 采用吸附法将羧基化的多壁碳纳米管(MWNTs)修饰在电极表面, 建立测定尿酸(UA)的简单快捷的计时电流分析方法, 将该法应用于XO抑制剂的体外筛选. 在0.3 V (vs. Ag/AgCl)的工作电位下, UA在MWNTs修饰的丝印电极上产生灵敏的响应电流, 响应时间30 s, 测定UA的线性范围为2~300 μmol•L-1, 线性方程为Y (μmol•L-1)=43.8240X (μA)-0.1592, r=0.9998, 最低检出限为1 μmol•L-1. 用该法对4种中药水提物进行了筛选, 相对空白对照组, 桑寄生500 μg•mL-1浓度组有显著性差异. 该法简单、快速, 电极制作成本低, 所需仪器简单, 适用于体外大量筛选XO抑制剂. 相似文献
12.
基质金属蛋白酶-13 (MMP-13)为预防和治疗骨关节炎(OA)提供了充满希望的靶标. 通过抑制剂来阻断MMP-13的活性将会对治疗OA疾病产生潜在的作用. 然而,宽谱抑制剂同样抑制MMP家族的其它成员,特别是MMP-1,这将会导致肌与骨的综合症. 因此,设计和发现潜在的MMP-13 相对于MMP-1 的高效选择性抑制剂,在对治疗OA新型药物的研发中具有相当重要的现实意义. 本研究通过两种机器学习方法(ML):支持向量机(SVM)和随机森林(RF)来建立分类模型,用于预测不同结构的MMP-13 对MMP-1 的选择性抑制剂. 所建这些模型的预测效果都已经达到了令人满意的精度. 在这两种ML模型中,RF对于MMP-13选择性抑制剂和非抑制剂的精度分别达到97.58%和100%. 同时,与MMP-13对MMP-1的选择性抑制最相关的分子描述符也基于不同的特征选择方法被两种模型挑选出来. 最后,用预测效果最好的RF模型虚拟筛选了ZINC数据库的“fragment-like”子集,从而得到了一系列潜在的候选药物. 研究表明,机器学习方法,特别是RF方法,对于发现潜在的MMP-13选择性抑制剂十分有效. 同时还得到了一些与MMP-13的选择性抑制相关的分子描述符. 相似文献
13.
利用具有新机制的抗耐药菌DNA旋转酶抑制剂GSK299423与DNA旋转酶的晶体复合物(PDB code:2XCS)构建基于配体-受体复合物的药效团模型, 诱骗集(Decoy set)验证结果表明该药效团模型具有较强的活性识别能力. 将药效团模型与分子对接相结合用于筛选化合物库, 通过抑菌活性测定, 获得了具有抗多药耐药菌活性的DNA旋转酶抑制剂LTH02. 相似文献
14.
15.
以2-氨基-5-氯苯甲酸为起始原料,用改进方法经十步反应合成了极光激酶抑制剂MLN8237,总产率12.3%,其结构经1HNMR和MS确证. 相似文献
16.
配体活性构象搜寻方法及其应用研究——Ⅰ.搜寻方法及凝血酶抑制剂活性构象的搜寻 总被引:4,自引:0,他引:4
在综合系统构象搜寻和配体-生物大分子对接(Dock)方法的基础上,发展了根据受体活性部位三维结构搜寻配体活性构象的搜寻方法BCSPL.用此方法搜寻了凝血酶抑制剂PPACK的活性构象,结果与晶体结构非常吻合,又用此方法搜寻了膦酰肽类和二肽、三肽类凝血酶抑制剂与人体α凝血酶结合时的活性构象,并在此基础上用分子力学计算了抑制剂与凝血酶的结合能,结果表明结合能与活性有很好的相关性,计算结果能合理地解释抑制剂与凝血酶的相互作用方式及结构与活性的关系. 相似文献
17.
18.
近红外光谱结合CARS变量筛选方法用于液态奶中蛋白质与脂肪含量的测定 总被引:6,自引:1,他引:6
采用CARS(Competitive adaptive reweighted sampling)变量筛选方法建模,显著提高了液态奶中蛋白质与脂肪近红外模型的预测精度。用蒙特卡罗采样(Monte-Carlo sampling)方法先剔除奇异样本,再对光谱进行中心化与Karl Norris滤波降噪处理,通过CARS方法筛选出与样本性质密切相关的变量,建立预测蛋白质与脂肪含量的偏最小二乘法(PLS)校正模型,并与未选变量的PLS模型进行比较。以定标集相关系数(r2)及交互验证均方残差(RMSECV)和预测误差均方根(RMSEP)作为判定依据,确定了蛋白质与脂肪的最佳建模条件。蛋白质与脂肪校正模型的相关系数分别为0.975 0、0.995 1,RMSECV分别为0.194 8、0.136 3,RMSEP分别为0.113 3、0.140 1,预测结果优于未选变量的PLS模型及其他选变量方法,有效简化了模型,适于液态奶中脂肪和蛋白质的快速、无损检测。 相似文献
19.
20.
用"相对熵"作为优化函数,提出了一个有效快速的折叠预测优化算法.使用了非格点模型,预测只关心蛋白质主链的走向.其中只用到了蛋白质主链上的两两连续的Cα原子间的距离信息以及20种氨基酸的接触势的一个扩展形式.对几个真实蛋白质做了算法测试,预测的初始结构都为比较大的去折叠态,预测构象相对于它们天然结构的均方根偏差(RMSD)为5~7 A.从原理上讲,该方法是对能量优化的改进. 相似文献