期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

基于机器学习方法的激素敏感脂肪酶抑制剂活性预测(英文) 总被引：1，自引：0，他引：1

吕巍薛英《物理化学学报》2010,26(2):471-477

脂肪组织中,激素敏感脂肪酶(HSL)被认为是调节脂肪酸代谢的关键限速酶.HSL在糖尿病的发病过程中起重要作用,抑制HSL活性有助于糖尿病的治疗,因此探索新颖的HSL抑制剂成为当前研究的热门.在激素敏感脂肪酶的作用机制和三维结构缺乏的情况下,需要发展预测HSL抑制剂的方法.本文采用几种机器学习方法(支持向量机(SVM)、k-最近相邻法(k-NN)和C4.5决策树(C4.5DT))对已知的HSL抑制剂与非抑制剂建立分类预测模型.252个结构多样性化合物(123个HSL抑制剂与129个HSL非抑制剂)被用于测试分类预测系统,并用递归变量消除法选择与HSL抑制剂相关的性质描述符以提高预测精度.本研究对独立验证集的总预测精度为75.0%-80.0%,HSL抑制剂的预测精度为85.7%-90.5%,非HSL抑制剂的预测精度为63.2%-68.4%.支持向量机方法给出最好的总预测精度(80.0%).本研究表明支持向量机等机器学习方法可以有效预测未知数据集中潜在的HSL抑制剂,并有助于发现与其相关的分子描述符. 相似文献

2.

机器学习方法用于建立乙酰胆碱酯酶抑制剂的分类模型 总被引：1，自引：0，他引：1

杨国兵李泽荣饶含兵李象远陈宇综《物理化学学报》2010,26(12):3351-3359

我们构建了表征乙酰胆碱酯酶抑制剂分子组成、电荷、拓扑、几何结构及物理化学性质等特征的1559个描述符,通过Fischer Score排序过滤和Monte Carlo模拟退火法相结合进行变量筛选得到37个描述符,然后分别用支持向量学习机(SVM)、人工神经网络(ANN)和k-近邻(k-NN)等机器学习方法建立了乙酰胆碱酯酶抑制剂的分类预测模型.对于训练集的515个样本,通过五重交叉验证,各机器学习方法对正样本,负样本和总样本的平均预测精度分别为87.3%-92.7%,67.0%-81.0%和79.4%-88.2%;通过y-scrambling方法验证SVM模型是否偶然相关,结果正样本,负样本和总样本的平均预测精度分别为72.7%-82.5%,41.0%-53.0%和62.1%-69.1%,明显低于实际所建模型的预测精度,表明所建模型不存在偶然相关;对172个没有参与建模的外部独立测试样本,各机器学习方法对正样本,负样本和总样本的预测精度分别为93.3%-100.0%,74.6%-89.6%和86.1%-95.9%.所建模型中,SVM模型预测精度最好,且明显高于其它文献报道结果. 相似文献

3.

机器学习方法用于二氢叶酸还原酶抑制剂的活性预测

陈晓梅饶含兵黄文丽李泽荣《高等学校化学学报》2007,28(11):2171-2178

分别采用支持向量学习机、人工神经网络、调节性逻辑回归和K-最临近等机器学习方法对761个二氢叶酸还原酶抑制剂建立了其活性分类预测模型. 采用组成描述符和拓扑描述符表征抑制剂的分子结构及物理化学性质, 使用Kennard-Stone方法进行训练集的设计, 并用Metropolis Monte Carlo模拟退火方法作变量选择. 结果表明, 支持向量学习机优于其它机器学习方法, 所得到的最优模型具有较好的预测结果, 其预测正确率为91.62%. 说明通过合适的训练集设计及变量选择, 支持向量学习机方法可以很好地用于二氢叶酸还原酶抑制剂的活性分类预测. 相似文献

4.

基于机器学习方法的丙型肝炎病毒非结构蛋白5B聚合酶抑制剂活性预测

吕巍薛英《物理化学学报》2011,27(6):1407-1416

在丙型肝炎病毒(HCV)的基因复制和蛋白质成熟的过程中, 非结构蛋白5B(NS5B)作为RNA依赖的RNA聚合酶起到了重要的作用. 抑制NS5B聚合酶可以阻止丙型肝炎病毒的RNA复制, 因此成为一种治疗丙型肝炎的有效方法. 通过计算机方法进行虚拟筛选和预测NS5B聚合酶抑制剂已经变得越来越重要. 本文主要采用机器学习方法(支持向量机(SVM)、k-最近相邻法(k-NN)和C4.5决策树(C4.5 DT))对已知的丙型肝炎病毒NS5B蛋白酶抑制剂与非抑制剂建立分类预测模型. 1248个结构多样性化合物(552个NS5B抑制剂与696个非NS5B抑制剂)被用于测试分类预测系统, 并用递归变量消除法选择与NS5B抑制剂相关的性质描述符以提高预测精度. 独立验证集的总预测精度为84.1%-85.0%, NS5B抑制剂的预测精度为81.4%-91.7%, 非NS5B抑制剂的预测精度为78.2%-87.2%. 其中支持向量机给出最好的NS5B抑制剂预测精度(91.7%); C4.5决策树给出最好的非NS5B抑制剂预测精度(87.2%); k-最近相邻法给出最好的总预测精度(85.0%). 研究表明机器学习方法可以有效预测未知数据集中潜在的NS5B抑制剂, 并有助于发现与其相关的分子描述符. 相似文献

5.

基于支持向量学习机的HIV-1蛋白酶抑制剂的活性预测

饶含兵李泽荣陈晓梅李象远《化学学报》2007,65(3):197-202

为了预测人体免疫缺陷蛋白酶抑制剂的活性, 计算了表征分子的组成和拓扑特征的462个分子描述符, 用Kennard-Stone方法和随机方法进行了训练集和测试集设计, 用Monte Carlo 模拟退火方法进行变量筛选, 并分别用神经网络, 逻辑回归, k-近邻和支持向量学习机方法建立了HIV-1蛋白酶的抑制剂模型. 结果表明支持向量学习机优于其余机器学习方法, 用SVM方法所建立的最优模型的最后预测正确率达到98.24%. 相似文献

6.

机器学习方法用于选择性环氧化酶-2抑制剂活性预测模型的建立

王正国饶含兵李泽荣《化学研究与应用》2006,18(11):1317-1321

与传统的非甾体类消炎药相比,选择性环氧化酶-2抑制剂具有无胃肠道粘膜损伤,溃疡和肾功能障碍等严重的副作用,设计选择性环氧化酶-2抑制剂具有重要意义。本文用支持矢量学习机和神经网络两种机器学习方法建立选择性环氧化酶-2抑制剂的活性预测模型,以期为选择性环氧化酶-2抑制剂药物的合成提供先导化合物。我们将467个环氧化酶-2抑制剂用Kennard-Stone方法分为训练集,验证集和独立测试集,对每一抑制剂分子我们计算了463个包含组成描述符和拓扑描述符的分子描述符来表征其分子结构,并通过F-Score方法选取最重要的分子描述符用于分类模型的建立。结果表明,SVM方法通过变量筛选后具有很好的预测能力,其预测正确率达到93.30%。相似文献

7.

基于机器学习方法的H1N1神经氨酸苷酶抑制剂的分类预测

吕巍薛英孟庆伟《物理化学学报》2013,29(1):217-223

流感是一种主要的呼吸道传染病, 在普通人群中有着较高的发病率, 而对于一些年老和高危病人还有较高的死亡率. 研究显示抑制神经氨酸苷酶(NA)可以阻断病毒RNA复制, 因此NA是有效治疗H1N1型流感病毒的重要药物靶标. 通过计算机方法进行虚拟筛选和预测NA抑制剂已经变得越来越重要. 针对酶活性位点进行基于结构的合理药物设计, 开发H1N1 病毒神经氨酸苷酶抑制剂, 已成为药物研究的热点之一. 本文通过多种机器学习方法(支持向量机(SVM)、k-最近相邻法(k-NN)和C4.5决策树(C4.5DT))对已知的神经氨酸苷酶抑制剂(NAIs)与非神经氨酸苷酶抑制剂(non-NAIs)建立分类预测模型. 其中227个结构多样性化合物(72个NAIs与155个non-NAIs)被用于测试分类预测系统, 并用递归变量消除法选择与神经氨酸苷酶抑制剂分类相关的性质描述符以提高预测精度. 本研究对独立验证集的总预测精度为75.9%-92.6%, NA 抑制剂的预测精度为64.3%-78.6%, 非H1N1抑制剂的预测精度为77.5%-97.5%. SVM法给出最好的总预测精度(92.6%). 本研究表明支持向量机等机器学习方法可以有效预测未知数据集中潜在的NA抑制剂, 并有助于发现与其相关的分子描述符. 相似文献

8.

基于分子描述符和机器学习方法预测和虚拟筛选乳腺癌靶向蛋白HEC1抑制剂

何冰罗勇李秉轲薛英余洛汀邱小龙杨登贵《物理化学学报》2015,31(9):1795-1802

HEC1(癌症高表达蛋白)是纺锤体检查点控制、着丝粒功能、细胞存活的关键的有丝分裂调节器,与原发性乳腺癌的不良预后有关.筛选具有高亲和力的HEC1新型抑制剂对探索乳腺癌的靶向治疗具有重要意义.本文从结构多样性的化合物库中筛选HEC1抑制剂.通过对分子描述符的特征筛选,采用支持向量机(SVM)和随机森林(RF)方法分别对HEC1抑制剂和非抑制剂建立了分类模型.经对比, RF模型显示了更好的预测精度.我们采用RF模型对HEC1抑制剂进行了虚拟筛选,从“in-house”实体库筛选得到2个潜在的HEC1抑制剂分子.随后对筛出的化合物进行了体外活性实验,发现对乳腺癌细胞株MDA-MB-468和MDA-MB-231均有一定程度的抗肿瘤活性.研究结果表明,机器学习方法对于设计和虚拟筛选HEC1抑制剂有良好的效果. 相似文献

9.

基于分子描述符和机器学习方法预测和虚拟筛选MMP-13对MMP-1的选择性抑制剂

李秉轲丛湧田之悦薛英《物理化学学报》2014,(1)

基质金属蛋白酶-13(MMP-13)为预防和治疗骨关节炎(OA)提供了充满希望的靶标.通过抑制剂来阻断MMP-13的活性将会对治疗OA疾病产生潜在的作用.然而,宽谱抑制剂同样抑制MMP家族的其它成员,特别是MMP-1,这将会导致肌与骨的综合症.因此,设计和发现潜在的MMP-13相对于MMP-1的高效选择性抑制剂,在对治疗OA新型药物的研发中具有相当重要的现实意义.本研究通过两种机器学习方法(ML):支持向量机(SVM)和随机森林(RF)来建立分类模型,用于预测不同结构的MMP-13对MMP-1的选择性抑制剂.所建这些模型的预测效果都已经达到了令人满意的精度.在这两种ML模型中,RF对于MMP-13选择性抑制剂和非抑制剂的精度分别达到97.58%和100%.同时,与MMP-13对MMP-1的选择性抑制最相关的分子描述符也基于不同的特征选择方法被两种模型挑选出来.最后,用预测效果最好的RF模型虚拟筛选了ZINC数据库的"fragment-like"子集,从而得到了一系列潜在的候选药物.研究表明,机器学习方法,特别是RF方法,对于发现潜在的MMP-13选择性抑制剂十分有效.同时还得到了一些与MMP-13的选择性抑制相关的分子描述符. 相似文献

10.

机器学习筛选用于气体吸附分离和存储的金属有机骨架材料

下载免费PDF全文

赵晨曹蓉夏杰桢吴琪《化学通报》2024,87(3):317-324,316

金属有机框架（Metal-organic framework ,MOF）因其高孔隙率、高比表面积和结构可调性,在气体吸附分离领域广泛应用。随着MOF数量激增,传统分子模拟和实验方法验证MOF性能成本高且速度慢,因此目前MOF筛选工作已转向高通量计算辅助的机器学习（Machine-learning,ML）。机器学习作为一种高效的大数据处理方法,能够在高通量筛选（High-Throughput Computational Screening,HTCS）的基础上对数据进行拟合,从而快速而准确地筛选出气体吸附分离材料,并深入挖掘其结构与性能之间的关系。本文回顾了近年机器学习应用于MOF筛选的研究。本文重点讨论了一些运用机器学习从大量结构中筛选出可用于CH4、H2和CO2等气体吸附分离与储存的MOF材料的工作。同时,我们梳理了当前MOF材料筛选工作中的研究思路和进展,并指出了机器学习在筛选MOF材料工作中面临的一些瓶颈和挑战。最后,对该领域的未来发展前景进行了展望。相似文献

11.

丝印电极法体外筛选黄嘌呤氧化酶抑制剂方法研究 总被引：1，自引：0，他引：1

周娟刘敏丁虹 Hong 《化学学报》2008,66(8):995-998

建立丝印电极快速筛选黄嘌呤氧化酶(XO)抑制剂的新方法. 利用丝网印刷技术制作一次性使用的丝印碳糊电极, 采用吸附法将羧基化的多壁碳纳米管(MWNTs)修饰在电极表面, 建立测定尿酸(UA)的简单快捷的计时电流分析方法, 将该法应用于XO抑制剂的体外筛选. 在0.3 V (vs. Ag/AgCl)的工作电位下, UA在MWNTs修饰的丝印电极上产生灵敏的响应电流, 响应时间30 s, 测定UA的线性范围为2～300 μmol•L^－1, 线性方程为Y (μmol•L^－1)＝43.8240X (μA)－0.1592, r＝0.9998, 最低检出限为1 μmol•L^－1. 用该法对4种中药水提物进行了筛选, 相对空白对照组, 桑寄生500 μg•mL^－1浓度组有显著性差异. 该法简单、快速, 电极制作成本低, 所需仪器简单, 适用于体外大量筛选XO抑制剂. 相似文献

12.

基于分子描述符和机器学习方法预测和虚拟筛选MMP-13对MMP-1的选择性抑制剂

李秉轲丛湧田之悦薛英《物理化学学报》2014,30(1):171-182

基质金属蛋白酶-13 (MMP-13)为预防和治疗骨关节炎(OA)提供了充满希望的靶标. 通过抑制剂来阻断MMP-13的活性将会对治疗OA疾病产生潜在的作用. 然而,宽谱抑制剂同样抑制MMP家族的其它成员,特别是MMP-1,这将会导致肌与骨的综合症. 因此,设计和发现潜在的MMP-13 相对于MMP-1 的高效选择性抑制剂,在对治疗OA新型药物的研发中具有相当重要的现实意义. 本研究通过两种机器学习方法(ML)：支持向量机(SVM)和随机森林(RF)来建立分类模型,用于预测不同结构的MMP-13 对MMP-1 的选择性抑制剂. 所建这些模型的预测效果都已经达到了令人满意的精度. 在这两种ML模型中,RF对于MMP-13选择性抑制剂和非抑制剂的精度分别达到97.58%和100%. 同时,与MMP-13对MMP-1的选择性抑制最相关的分子描述符也基于不同的特征选择方法被两种模型挑选出来. 最后,用预测效果最好的RF模型虚拟筛选了ZINC数据库的“fragment-like”子集,从而得到了一系列潜在的候选药物. 研究表明,机器学习方法,特别是RF方法,对于发现潜在的MMP-13选择性抑制剂十分有效. 同时还得到了一些与MMP-13的选择性抑制相关的分子描述符. 相似文献

13.

具有全新机理的DNA旋转酶抑制剂的筛选及抑菌活性

黄振桂林克江尹鸿萍叶波平翁幸鐾尤启冬《高等学校化学学报》2013,34(8):1887-1893

利用具有新机制的抗耐药菌DNA旋转酶抑制剂GSK299423与DNA旋转酶的晶体复合物(PDB code:2XCS)构建基于配体-受体复合物的药效团模型, 诱骗集(Decoy set)验证结果表明该药效团模型具有较强的活性识别能力. 将药效团模型与分子对接相结合用于筛选化合物库, 通过抑菌活性测定, 获得了具有抗多药耐药菌活性的DNA旋转酶抑制剂LTH02. 相似文献

14.

遗传算法用于偏最小二乘方法建模中的变量筛选 总被引：19，自引：0，他引：19

褚小立袁洪福王艳斌陆婉珍《分析化学》2001,29(4):437-442

利用全局搜索方法－遗传算法（genetic algorithms,GA)对近红外光谱分析中的波长变量进行筛选,再用偏最小二乘方法（patrial least squares,PLS）建立分析校正模型。对两类样品的近红外光谱分析应用实例表明,这种选取变量进行校正的方法,不仅简化、优化了模型,而且增强了所建模型的预测能力,尤其适用于单纯PLS较以校正关联的体系。相似文献

15.

极光激酶抑制剂MLN8237的合成方法改进

付明伟葛敏《合成化学》2012,20(5):652-655

以2-氨基-5-氯苯甲酸为起始原料,用改进方法经十步反应合成了极光激酶抑制剂MLN8237,总产率12.3％,其结构经1HNMR和MS确证. 相似文献

16.

配体活性构象搜寻方法及其应用研究——Ⅰ.搜寻方法及凝血酶抑制剂活性构象的搜寻 总被引：4，自引：0，他引：4

蒋华良陈凯先陈建忠顾健德胡增建刘东祥王沁泌王蔚赵善荣戎锁宝杨玉社朱维良嵇汝运《中国科学B辑》1997,(5)

在综合系统构象搜寻和配体-生物大分子对接(Dock)方法的基础上,发展了根据受体活性部位三维结构搜寻配体活性构象的搜寻方法BCSPL.用此方法搜寻了凝血酶抑制剂PPACK的活性构象,结果与晶体结构非常吻合,又用此方法搜寻了膦酰肽类和二肽、三肽类凝血酶抑制剂与人体α凝血酶结合时的活性构象,并在此基础上用分子力学计算了抑制剂与凝血酶的结合能,结果表明结合能与活性有很好的相关性,计算结果能合理地解释抑制剂与凝血酶的相互作用方式及结构与活性的关系. 相似文献

17.

分子生物色谱用于中药活性成分筛选及质量控制方法的研究 总被引：16，自引：0，他引：16

汪海林邹汉法孔亮倪坚毅张玉奎《色谱》1999,17(2):123-127

报道了近期工作进展,首先阐述了分子生物色谱的基本原理及特点,然后介绍了分子生物色谱对多种中药、不同产地的同种中药活性成分谱图模式的比较,结合已有的工作对活性成分筛选方法、相互作用研究、质量控制方法发展做了细致的说明,并讨论了其发展方向及前景。相似文献

18.

近红外光谱结合CARS变量筛选方法用于液态奶中蛋白质与脂肪含量的测定 总被引：6，自引：1，他引：6

张华秀李晓宁范伟梁逸曾唐玉莲《分析测试学报》2010,29(5)

采用CARS(Competitive adaptive reweighted sampling)变量筛选方法建模,显著提高了液态奶中蛋白质与脂肪近红外模型的预测精度。用蒙特卡罗采样(Monte-Carlo sampling)方法先剔除奇异样本,再对光谱进行中心化与Karl Norris滤波降噪处理,通过CARS方法筛选出与样本性质密切相关的变量,建立预测蛋白质与脂肪含量的偏最小二乘法(PLS)校正模型,并与未选变量的PLS模型进行比较。以定标集相关系数(r2)及交互验证均方残差(RMSECV)和预测误差均方根(RMSEP)作为判定依据,确定了蛋白质与脂肪的最佳建模条件。蛋白质与脂肪校正模型的相关系数分别为0.975 0、0.995 1,RMSECV分别为0.194 8、0.136 3,RMSEP分别为0.113 3、0.140 1,预测结果优于未选变量的PLS模型及其他选变量方法,有效简化了模型,适于液态奶中脂肪和蛋白质的快速、无损检测。相似文献

19.

血红蛋白A1C的测定方法和用于此目的的酶及其生产方法

《化学分析计量》2006,15(5):77

本发明提供使用酶不经分离操作而特异地测定糖化血红蛋白的糖化β链N末端的方法和用于此的测定试剂盒。筛选从糖化血红蛋白或其片段的糖化β链N末端切割糖化氨基酸和／或糖化肽而不实质性地从糖化血红蛋白或其片段的糖化α链N末端切割糖化氨基酸和糖化肽的蛋白酶。通过使用通过该筛选方法获得的蛋白酶，提供了特异地测定糖化血红蛋白的糖化β链N末端的方法和测定试剂盒。根据本发明，可以不经分离操作而特异地测定糖化血红蛋白的糖化β链N末端。相似文献

20.

用于真实蛋白质结构预测的一种新的优化方法

卢本卓王存新王宝翰《化学物理学报(中文版)》2003,16(2):117-121

用"相对熵"作为优化函数,提出了一个有效快速的折叠预测优化算法.使用了非格点模型,预测只关心蛋白质主链的走向.其中只用到了蛋白质主链上的两两连续的Cα原子间的距离信息以及20种氨基酸的接触势的一个扩展形式.对几个真实蛋白质做了算法测试,预测的初始结构都为比较大的去折叠态,预测构象相对于它们天然结构的均方根偏差(RMSD)为5～7 A.从原理上讲,该方法是对能量优化的改进. 相似文献