首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
基质金属蛋白酶-13 (MMP-13)为预防和治疗骨关节炎(OA)提供了充满希望的靶标. 通过抑制剂来阻断MMP-13的活性将会对治疗OA疾病产生潜在的作用. 然而,宽谱抑制剂同样抑制MMP家族的其它成员,特别是MMP-1,这将会导致肌与骨的综合症. 因此,设计和发现潜在的MMP-13 相对于MMP-1 的高效选择性抑制剂,在对治疗OA新型药物的研发中具有相当重要的现实意义. 本研究通过两种机器学习方法(ML):支持向量机(SVM)和随机森林(RF)来建立分类模型,用于预测不同结构的MMP-13 对MMP-1 的选择性抑制剂. 所建这些模型的预测效果都已经达到了令人满意的精度. 在这两种ML模型中,RF对于MMP-13选择性抑制剂和非抑制剂的精度分别达到97.58%和100%. 同时,与MMP-13对MMP-1的选择性抑制最相关的分子描述符也基于不同的特征选择方法被两种模型挑选出来. 最后,用预测效果最好的RF模型虚拟筛选了ZINC数据库的“fragment-like”子集,从而得到了一系列潜在的候选药物. 研究表明,机器学习方法,特别是RF方法,对于发现潜在的MMP-13选择性抑制剂十分有效. 同时还得到了一些与MMP-13的选择性抑制相关的分子描述符.  相似文献   

2.
HEC1(癌症高表达蛋白)是纺锤体检查点控制、着丝粒功能、细胞存活的关键的有丝分裂调节器,与原发性乳腺癌的不良预后有关.筛选具有高亲和力的HEC1新型抑制剂对探索乳腺癌的靶向治疗具有重要意义.本文从结构多样性的化合物库中筛选HEC1抑制剂.通过对分子描述符的特征筛选,采用支持向量机(SVM)和随机森林(RF)方法分别对HEC1抑制剂和非抑制剂建立了分类模型.经对比, RF模型显示了更好的预测精度.我们采用RF模型对HEC1抑制剂进行了虚拟筛选,从“in-house”实体库筛选得到2个潜在的HEC1抑制剂分子.随后对筛出的化合物进行了体外活性实验,发现对乳腺癌细胞株MDA-MB-468和MDA-MB-231均有一定程度的抗肿瘤活性.研究结果表明,机器学习方法对于设计和虚拟筛选HEC1抑制剂有良好的效果.  相似文献   

3.
最近的研究已经证实,以周期蛋白依赖性激酶4(cyclin-dependent kinase 4,CDK4)为靶点,通过CDK4的抑制剂重新建立细胞周期的调控在肿瘤靶向治疗的发展中已经成为有吸引力的方向。本文测试了三种机器学习方法,k最近邻、C4.5决策树和随机森林(random forest,RF),用于预测CDK4的抑制剂。所建这些模型都达到了令人满意的预测效果。其中,RF模型当参数Mtry=13、jbt=255时对应的总预测精度最大,为96.65%。同时,与CDK4抑制剂最相关的25个分子描述符也被最优的RF模型挑选了出来。本文的研究表明,机器学习方法特别是RF方法,对于发现潜在的CDK4抑制剂十分有效。  相似文献   

4.
脾酪氨酸激酶(Syk)是一种细胞内的酪氨酸激酶细胞质受体,在类风湿性关节炎(RA)的发病过程中起着至关重要的作用。筛选Syk抑制剂对RA的治疗有着重要的意义。采用C4.5决策树与随机森林(RF)两种机器学习方法分别对Syk抑制剂与非抑制剂建立模型,经过对比,RF具有更好的预测精度。采用RF模型对Syk抑制剂进行虚拟筛选,从ZINC数据库筛选得到潜在的Syk抑制剂分子。研究结果表明,机器学习方法对于虚拟筛选和发现潜在的Syk抑制剂十分有效。  相似文献   

5.
流感是一种主要的呼吸道传染病, 在普通人群中有着较高的发病率, 而对于一些年老和高危病人还有较高的死亡率. 研究显示抑制神经氨酸苷酶(NA)可以阻断病毒RNA复制, 因此NA是有效治疗H1N1型流感病毒的重要药物靶标. 通过计算机方法进行虚拟筛选和预测NA抑制剂已经变得越来越重要. 针对酶活性位点进行基于结构的合理药物设计, 开发H1N1 病毒神经氨酸苷酶抑制剂, 已成为药物研究的热点之一. 本文通过多种机器学习方法(支持向量机(SVM)、k-最近相邻法(k-NN)和C4.5决策树(C4.5DT))对已知的神经氨酸苷酶抑制剂(NAIs)与非神经氨酸苷酶抑制剂(non-NAIs)建立分类预测模型. 其中227个结构多样性化合物(72个NAIs与155个non-NAIs)被用于测试分类预测系统, 并用递归变量消除法选择与神经氨酸苷酶抑制剂分类相关的性质描述符以提高预测精度. 本研究对独立验证集的总预测精度为75.9%-92.6%, NA 抑制剂的预测精度为64.3%-78.6%, 非H1N1抑制剂的预测精度为77.5%-97.5%. SVM法给出最好的总预测精度(92.6%). 本研究表明支持向量机等机器学习方法可以有效预测未知数据集中潜在的NA抑制剂, 并有助于发现与其相关的分子描述符.  相似文献   

6.
与传统的非甾体类消炎药相比,选择性环氧化酶-2抑制剂具有无胃肠道粘膜损伤,溃疡和肾功能障碍等严重的副作用,设计选择性环氧化酶-2抑制剂具有重要意义。本文用支持矢量学习机和神经网络两种机器学习方法建立选择性环氧化酶-2抑制剂的活性预测模型,以期为选择性环氧化酶-2抑制剂药物的合成提供先导化合物。我们将467个环氧化酶-2抑制剂用Kennard-Stone方法分为训练集,验证集和独立测试集,对每一抑制剂分子我们计算了463个包含组成描述符和拓扑描述符的分子描述符来表征其分子结构,并通过F-Score方法选取最重要的分子描述符用于分类模型的建立。结果表明,SVM方法通过变量筛选后具有很好的预测能力,其预测正确率达到93.30%。  相似文献   

7.
吕巍  薛英 《物理化学学报》2010,26(2):471-477
脂肪组织中,激素敏感脂肪酶(HSL)被认为是调节脂肪酸代谢的关键限速酶.HSL在糖尿病的发病过程中起重要作用,抑制HSL活性有助于糖尿病的治疗,因此探索新颖的HSL抑制剂成为当前研究的热门.在激素敏感脂肪酶的作用机制和三维结构缺乏的情况下,需要发展预测HSL抑制剂的方法.本文采用几种机器学习方法(支持向量机(SVM)、k-最近相邻法(k-NN)和C4.5决策树(C4.5DT))对已知的HSL抑制剂与非抑制剂建立分类预测模型.252个结构多样性化合物(123个HSL抑制剂与129个HSL非抑制剂)被用于测试分类预测系统,并用递归变量消除法选择与HSL抑制剂相关的性质描述符以提高预测精度.本研究对独立验证集的总预测精度为75.0%-80.0%,HSL抑制剂的预测精度为85.7%-90.5%,非HSL抑制剂的预测精度为63.2%-68.4%.支持向量机方法给出最好的总预测精度(80.0%).本研究表明支持向量机等机器学习方法可以有效预测未知数据集中潜在的HSL抑制剂,并有助于发现与其相关的分子描述符.  相似文献   

8.
吕巍  薛英 《物理化学学报》2011,27(6):1407-1416
在丙型肝炎病毒(HCV)的基因复制和蛋白质成熟的过程中, 非结构蛋白5B(NS5B)作为RNA依赖的RNA聚合酶起到了重要的作用. 抑制NS5B聚合酶可以阻止丙型肝炎病毒的RNA复制, 因此成为一种治疗丙型肝炎的有效方法. 通过计算机方法进行虚拟筛选和预测NS5B聚合酶抑制剂已经变得越来越重要. 本文主要采用机器学习方法(支持向量机(SVM)、k-最近相邻法(k-NN)和C4.5决策树(C4.5 DT))对已知的丙型肝炎病毒NS5B蛋白酶抑制剂与非抑制剂建立分类预测模型. 1248个结构多样性化合物(552个NS5B抑制剂与696个非NS5B抑制剂)被用于测试分类预测系统, 并用递归变量消除法选择与NS5B抑制剂相关的性质描述符以提高预测精度. 独立验证集的总预测精度为84.1%-85.0%, NS5B抑制剂的预测精度为81.4%-91.7%, 非NS5B抑制剂的预测精度为78.2%-87.2%. 其中支持向量机给出最好的NS5B抑制剂预测精度(91.7%); C4.5决策树给出最好的非NS5B抑制剂预测精度(87.2%); k-最近相邻法给出最好的总预测精度(85.0%). 研究表明机器学习方法可以有效预测未知数据集中潜在的NS5B抑制剂, 并有助于发现与其相关的分子描述符.  相似文献   

9.
B-Raf激酶在促分裂素原活化蛋白激酶(MAPK)信号转导通路中起着重要作用,已被确定为癌症治疗非常有吸引力的靶标.新型高效B-Raf抑制剂的开发成为癌症治疗的一个热门研究领域.本文以结构多样的B-Raf II型抑制剂为研究对象,联合应用分子对接和定量构效关系(QSAR)模型研究其定量构效关系去探讨抑制活性的起源.两个主题作为研究重点:生物活性构象和描述符.首先对分子对接方法(Glide、Gold、LigandFit、Cdocker和Libdock)进行准确性评价,后将研究的对象分子对接到B-Raf活性位点并获得生物活性构象.基于准确的对接结果,计算得到16个打分评价函数和21个能量描述符,以此构建定量构效关系模型. QSAR结果表明模型具有高度精确的拟合和强的预测能力(模型M1: r2 = 0.852, r(CV)2 = 0.790, rpre2 = 0.864;模型M2: r2 = 0.738, r(CV)2 = 0.812, rpre2 = 0.8605).同时探讨了对抑制活性有重要影响的描述符,结果表明打分评价函数(G_Score, -ECD, Dock_Score, PMF)与能量描述符(S(hb_ext), DE(int), Emodel)对抑制活性影响非常大.通过虚拟筛选和QSAR模型理论预测,一些新的具有潜在抑制活性的化合物作为B-Raf II型抑制剂被获得.上述信息对于进一步设计新颖高效的B-Raf II型抑制剂提供了有用的指导.  相似文献   

10.
张骥  申鹏  陆涛  余丹妮  李卉  杨国忠 《化学学报》2011,69(4):383-392
运用密度泛函理论(DFT)和线性回归分析等方法研究了黄酮类化合物抑制MMP-9的定量结构-活性关系(QSAR)和结构修饰. 研究发现, 黄酮类化合物抑制MMP-9的实验生物活性数据-lg EC50值与计算获得的黄酮类化合物的最低空分子轨道能量及分子水合能之间均存在着良好的线性关系|留一法交叉验证结果表明, 所建立的两个相应的QSAR模型都具有良好的稳定性和预测能力. 进一步研究发现, 在黄酮类化合物分子的A环、B环和C环上的合适部位选用供电子能力较强、能降低分子水合能的取代基团对其进行结构修饰, 有利于提高修饰后的分子抑制MMP-9的生物活性. 根据对木犀草素(Luteolin)分子进行结构修饰的结果(共33种化合物), 我们提出了黄酮类化合物抑制MMP-9可能的作用机理, 并设计出8种经结构修饰后生物活性有显著提高的MMP-9抑制剂, 希望将来得到实验的证实.  相似文献   

11.
丛湧  薛英 《物理化学学报》2013,29(8):1639-1647
对89 个苯并异噻唑和苯并噻嗪类丙型肝炎病毒(HCV) NS5B聚合酶非核苷抑制剂进行了定量构效关系(QSAR)研究. 采用遗传算法组合偏最小二乘(GA-PLS)和线性逐步回归分析(LSRA)两种特征选择方法选择最优描述符子集, 然后建立多元线性回归和偏最小二乘线性回归模型. 并首次尝试使用遗传算法耦合支持向量机方法(GA-SVM)对两种特征选择方法所选的描述符子集分别建立非线性支持向量机回归模型. 三种机器学习方法所建模型均得到比较满意的预测效果. 采用LSRA所选的6 个描述符建立的三个QSAR模型对于测试集的相关系数为0.958-0.962, GA-SVM法给出最好的预测精度(0.962). 采用GA-PLS所选的7个描述符建立的三个QSAR模型对于测试集的相关系数为0.918-0.960, 偏最小二乘回归模型的结果最好(0.960). 本工作提供了一种有效的方法来预测丙型肝炎病毒抑制剂的生物活性, 该方法也可以扩展到其他类似的定量构效关系研究领域.  相似文献   

12.
基于支持向量机方法的HERG钾离子通道抑制剂分类模型   总被引:1,自引:0,他引:1  
对human ether-a-gō-gō related genes(HERG)钾离子通道(钾通道)抑制剂,计算了表征分子组成、电荷分布、拓扑、几何结构及物理化学性质等特征的1559个分子描述符.采用Fischer Score(F-Score)排序过滤和Monte Carlo模拟退火法相结合从中筛选与HERG钾通道抑制剂分类相关的分子描述符.采用支持向量机(SVM)方法,分别以IC50=1.0、10.0μmol·L-1为分类标准,建立了三个分类预测模型.对367个训练集分子,用五重交叉验证.得到正、负样本的平均预测精度分别为84.8%-96.6%、80.7%-97.7%,其总的平均预测精度为87.1%-97.2%,优于其它文献报道结果.对97个外部测试集分子,所建三个模型的总样本预测精度在67.0%-90.1%之间,接近或优于其它文献报道结果.  相似文献   

13.
MMP-2是基底膜降解的关键酶,参与宫颈癌病发的整个过程,被认为是治疗宫颈癌的潜在新靶点。本文采用三维定量构效关系(3D-QSAR)研究32个咖啡酸苯乙酯类化合物与抗宫颈癌肿瘤细胞增殖活性的构效关系,通过比较分子场分析(CoMFA)模型(Q~2=0.638,R~2=0.972)及分子相似性指数分析(CoMSIA)模型(Q~2=0.665,R~2=0.975),表明所建立的QSAR模型具有稳定的预测能力。基于上述两种模型设计了18种新型咖啡酸苯乙酯类抑制剂,其中5种化合物具有较好的抗癌活性,抑制活性最强的为WS-1。将WS-1与MMP-2蛋白结合,结合模式显示WS-1主要通过氢键作用及疏水作用与MMP-2蛋白紧密结合,并能有效地占据MMP-2蛋白的结合位点。本研究构建的3D-QSAR模型也为进一步设计治疗宫颈癌其他抑制剂提供了理论参考。  相似文献   

14.
为了预测人体免疫缺陷蛋白酶抑制剂的活性, 计算了表征分子的组成和拓扑特征的462个分子描述符, 用Kennard-Stone方法和随机方法进行了训练集和测试集设计, 用Monte Carlo 模拟退火方法进行变量筛选, 并分别用神经网络, 逻辑回归, k-近邻和支持向量学习机方法建立了HIV-1蛋白酶的抑制剂模型. 结果表明支持向量学习机优于其余机器学习方法, 用SVM方法所建立的最优模型的最后预测正确率达到98.24%.  相似文献   

15.
机器学习方法用于建立乙酰胆碱酯酶抑制剂的分类模型   总被引:1,自引:0,他引:1  
我们构建了表征乙酰胆碱酯酶抑制剂分子组成、电荷、拓扑、几何结构及物理化学性质等特征的1559个描述符,通过Fischer Score排序过滤和Monte Carlo模拟退火法相结合进行变量筛选得到37个描述符,然后分别用支持向量学习机(SVM)、人工神经网络(ANN)和k-近邻(k-NN)等机器学习方法建立了乙酰胆碱酯酶抑制剂的分类预测模型.对于训练集的515个样本,通过五重交叉验证,各机器学习方法对正样本,负样本和总样本的平均预测精度分别为87.3%-92.7%,67.0%-81.0%和79.4%-88.2%;通过y-scrambling方法验证SVM模型是否偶然相关,结果正样本,负样本和总样本的平均预测精度分别为72.7%-82.5%,41.0%-53.0%和62.1%-69.1%,明显低于实际所建模型的预测精度,表明所建模型不存在偶然相关;对172个没有参与建模的外部独立测试样本,各机器学习方法对正样本,负样本和总样本的预测精度分别为93.3%-100.0%,74.6%-89.6%和86.1%-95.9%.所建模型中,SVM模型预测精度最好,且明显高于其它文献报道结果.  相似文献   

16.
线性特征选择方法可提升定量构效关系(QSAR)模型的预测能力,但易忽略特征(理化属性)与分子活性间的非线性关系。本文提出基于支持向量回归(SVR)的逐步非线性回归(SSNR)特征选择算法并用于降血压药物血管紧张素转化酶(ACE)抑制肽的QSAR研究。首先以具有不同背景的5组分子描述符分别表征肽序列,以SSNR实施特征选择,再通过智能一致性模型(ICM)对各组描述符对应子模型的预测活性进行加权整合,获得最终活性预测值。在ACE抑制二肽与三肽两个数据上的应用结果表明,SSNR获得的特征子集结合ICM策略可有效提升模型预测能力(二肽的平均Q■为0.675±0.002,三肽为0.663±0.013),优于遗传算法-偏最小二乘(0.538±0.049、0.599±0.047)与逐步线性回归(0.583±0.041、0.675±0.010)。最后基于抑制活性已知肽序列预测所有活性未知肽的活性,分析了高活性肽及其氨基酸偏好性,为人工合成潜在高活性ACE抑制肽提供可能的序列组合。  相似文献   

17.
越来越多的研究表明:药物分子与靶标分子的结合动力学性质与其在体内的药效有很强的相关性。因此,以改善结合动力学性质为导向的分子设计为药物研发提供了新的思路。本工作的研究目标在于得出预测药物分子解离速率常数(koff)的通用型定量结构-动力学关系(QSKR)模型。我们从文献中收集了406个配体分子的解离速率常数实验值,采用分子模拟方法构建了所有配体与靶蛋白复合物的三维结构模型。然后基于蛋白-配体原子对描述符,采用随机森林算法来构建预测配体分子解离速率常数的QSKR模型。通过探索不同条件(如距离区间,划分区间宽度和特征选择标准)下产生的描述符集合对模型预测精度的影响,确定当采用距离阈值为15?、划分区间宽度为3?、特征选择方差水平为2时得到的QSKR模型为最优,在两个独立测试集上获得良好的预测精度(相关系数为0.62)。本工作对预测药物分子解离速率常数这一关键科学问题进行了有益的探索,可为后续研究提供思路。  相似文献   

18.
Hydroxamate类抑制剂与MMP-3的结合自由能的计算   总被引:1,自引:0,他引:1  
章威  侯廷军  徐筱杰 《化学学报》2001,59(12):2116-2121
用自由能微扰方法(FEP)计算了两种hydroxamate类的抑制剂和MMP-3的相对结合自由能。在计算中,对于催化区的锌离子与其共价结合的配体(包括抑制和组氨酸)采用了键合的模型,抑制剂和周围配体的部分电荷的计算采用两步静电势收敛方法。自由能计算采用了慢增长(Slowgrowth)和固定窗口增长(Fixedwidthwindowgrowth)两种方法,并且在每次计算中都采用了双向采样(Double-widesampling)的策略。两种方法计算得到的相对结合自由能都能和实验值很好的符合。同时从动力学模拟的得到的分子轨迹得到了抑制剂和受体之间相互作用模式,抑制剂的P1部分可以和受体的S1'口袋形成很强范德华和疏水相互作用,P1上的苯环可以和Tyr223上的苯环形成较好的π键堆积相互作用。  相似文献   

19.
分子映射(MOLMAP)指数是以分子的化学键描述符为基础,通过Kohonen自组织映射依据一定的算法而衍生.化学键描述符是由化学键的物理化学性质,如两端原子的电荷差和拓扑性质,键连杂原子数量等所组成.本文将分子映射指数应用于4075个有机物质(Ames实验结果:2305个结构有诱变性,1770个结构无诱变性)的变异性预测.通过随机森林,分别采用三种类型的指数建立模型:(1)采用不同维数的分子映射指数;(2)采用全局分子描述符;(3)将分子映射指数与全局分子描述符相结合.整个数据集的集外(out-of-bag)交叉验证的正确预测率达到85.4%.为了检验模型的稳定性,采用所建模型预测源于另一数据库的472个化合物,正确预测率为86.7%,与此前的研究相比,两个预测结果均有所提高.  相似文献   

20.
为了寻找靶向Caspase-1的活性化合物,本研究建立了四种机器学习分类模型(RF、SVM、ANN和VOTING)。这些模型根据不同的评估指标进行了比较,具有高曲线下面积(AUC)的最佳分类模型被用来对ZINC数据库中的天然产物进行虚拟筛选。随后通过不同的药物相似性规则对化合物的ADMET特性进行了过滤。此外,考虑到蛋白质与配体结合的实际情况,本文对每个选定的配体与Caspase-1进行了分子对接和相互作用分析。根据计算出的结合能进行排序,并筛选出3个潜在的抑制剂。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号