首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
P2Y12受体拮抗剂是一类重要的抗血小板药物,研究分子活性与其结构参数的关系,对于合成新的P2Y12受体拮抗剂具有一定指导作用.选用178个结构多样的P2Y12受体拮抗剂分子作为数据集,随机选取了143个P2Y12受体拮抗剂作为训练集,剩余分子作为检验集.采用多元线性回归(MLR)方法和主成分回归分析(PCA)方法对每个分子的636个分子参数进行线性回归分析.MLR所建模型的结果为:训练集R2=0.800,检验集R2=0.834;PCA模型结果为:训练集R2=0.545,检验集R2=0.665.相比之下MLR法所建模型具有良好的预测性和可靠性.通过模型分析,确定了影响分子活性的关键因素.以上模型对筛选和合成新型高效P2Y12受体拮抗剂提供了一定理论指导.  相似文献   

2.
选用30个结构多样的caM抑制剂分子作为数据集,采用多元线性回归(MLR)方法及主成分回归分析(PCA)方法对每个化合物的194个分子参数进行回归分析,分别建立了各自的最优预测模型.结果表明:多元线性回归分析方法所建模型与主成分回归所建模型相对比,发现逐步筛选法为最优建模方法?该方法所建模型统计结果良好(R2=0.952,SEE为0.289),应用于检验集时结果也比较令人满意(R2=0.941,SEP为0.295),模型表现出较强的可靠性和预测性.  相似文献   

3.
肝细胞生长因子(HGF)/酪氨酸蛋白激酶(c-Met)介导的细胞信号是导致肿瘤细胞产生和转移的主要途径之一。c-Met抑制剂能够阻断HGF/c-Met信号,抑制人类肿瘤的转移发生。本文选用77个结构多样的吡唑啉酮类衍生物作为c-Met抑制剂分子的数据集,随机选取其中16个分子作为检验集,其余作为训练集,采用多元线性回归(MLR)和主成分回归分析(PCA)法对每个分子的648个参数进行回归分析,分别建立定量构效关系的最优预测模型。结果表明,多元线性回归中的逐步筛选法是最佳的建模方法,其所建模型统计结果良好(R2=0.81,SEE=0.37),应用于检验集的结果也较理想(R2=0.83,SEP=0.42),模型可靠性和预测能力较强,能直观反映影响活性的主要因素。此模型的确立有助于指导新型高效c-Met抑制剂药物的筛选和开发。  相似文献   

4.
为了构建310个有机物分子结构与其黏度之间的定量结构-性质关系(QSPR)模型,探讨影响有机物液体黏度的结构因素,首先运用迭代自组织数据分析技术(ISODATA)将样本集初步分类,划分为训练集和测试集,进而应用DRAGON2.1软件计算310个有机物分子的分子结构描述符,以蚁群算法(ACO)筛选分子描述符,得到5个参数,随后分别采用多元线性回归法(MLR)和支持向量机法(SVM)建立ACO-MLR模型和ACOSVM模型.结果表明,非线性ACO-SVM模型(相关系数R2train=0.9013,R2test=0.9026)的性能优于线性ACOMLR模型(R2train=0.7680,R2test=0.8725).ACO-MLR模型和ACO-SVM模型对测试集所得预测值与实验值的相关系数分别为0.934和0.950,预测效果令人满意.本文应用Williams图对模型的应用域进行了一定的研究,所建立的模型为工程上提供了一种根据分子结构预测有机物黏度的有效方法.  相似文献   

5.
紫杉醇是从紫杉或红豆杉树中提取的一种天然抗癌原料药,具有独特的抗癌机理。由于紫杉醇的种种限制,开发具有更高抗癌活性的类紫杉醇药物具有广阔的前景。紫杉烷二萜是以紫杉醇为母体,通过对其结构的不断修饰得到的一些二代紫杉醇类化合物。本文选用30个结构多样的紫杉烷二帖类化合物作为数据集,随机选取其中24个作为训练集,其它分子作为检验集,采用多元线性回归法(MLR)及主成分回归分析法(PCA)对每个化合物的195个分子参数进行回归分析,分别建立了定量构效关系的最优预测模型;并用检验集检验了所建模型的预测能力。结果表明,多元线性回归法所建模型与主成分回归法所建模型相对比,发现逐步筛选法为最优建模方法。该方法所建模型统计结果良好(R=0.782,SEE=0.202),应用于检验集时结果也比较令人满意(R=0.764,SEP=0.114),模型表现出较强的可靠性和预测性。模型的建立和主要影响因素的确定有助于指导新型紫杉醇类似物药物的筛选和研发。  相似文献   

6.
检验点激酶1(Chk1)是一种丝氨酸/苏氨酸蛋白激酶,可使受损癌细胞发生细胞周期阻滞并促进DNA损伤修复,降低放疗对肿瘤细胞的杀伤作用。抑制Chk1活性可消除细胞周期阻滞,阻碍肿瘤细胞的自我修复,导致其有丝分裂紊乱最终凋亡。本文采用多元线性回归(MLR)和主成分回归分析(PCA)方法,对164个噻吩和三唑酮类Chk1抑制剂分子的698个参数进行回归分析,分别建立定量构效关系预测模型。结果表明,多元线性回归中的逐步回归(stepwise)是最佳建模方法,所建模型的预测能力较强(训练集R=0.85,检验集R=0.88),运用拓扑电荷指数、原子核片段等20个参数直观反映了影响活性的主要因素。此模型的确立对设计和开发新型高效Chk1抑制剂具有指导意义。  相似文献   

7.
基于分子参数的药物小肠吸收预测模型   总被引:1,自引:0,他引:1  
选择100个化合物作为数据集,随机选取其中80个为训练集,其他分子为验证集,并为每个化合物分子计算了30个参数.通过采用五种不同多元线性回归分析方法对其训练模拟,建立了数学模型,并用验证集检验了所建模型的预测能力.结果发现向后筛选法为最优小肠吸收建模方法.由该法所建模型的统计结果良好(R2>0.80),应用于验证集时也表现出较强预测能力.该模型确定了对小肠吸收影响较大的分子参数,有助于指导进一步的新药筛选和开发.  相似文献   

8.
检验点激酶1(Chk1)是一种丝氨酸/苏氨酸蛋白激酶,可使受损癌细胞发生细胞周期阻滞并促进DNA损伤修复,降低放射治疗对肿瘤细胞的杀伤作用。抑制Chk1活性可消除细胞周期阻滞,阻碍肿瘤细胞的自我修复,导致其有丝分裂紊乱最终凋亡。本文采用多元线性回归(MLR)和主成分回归分析(PCA)法,对164个噻吩和三唑酮类Chk1抑制剂分子的698个参数进行回归分析,分别建立定量构效关系预测模型。结果表明,多元线性回归中的forward法(向前选择法)是最佳建模方法,所建模型的预测能力较强(训练集R=0.851,检验集  相似文献   

9.
采用三维全息原子场作用矢量(3D-HoVAIF)对32个吡咯类抗艾滋病药物进行结构参数化表征,并与其活性建立定量构效关系。分别采用多元线性回归(MLR)和偏最小二乘(PLS)进行建模,建模的复相关系数(R2cum)、交互校验复相关系数(Q2cum)和模型的标准偏差(SD)分别为R2cum=0.914、Q2cum=0.812、SD=0.236(MLR);R2cum=0.836、Q2cum=0.719、SD=0.314(PLS),结果均优于文献值(R2cum=0.667,Q2cum=0.581,SD=0.420)。所建模型具有良好的稳定性和预测能力,表明3D-HoVAIF能够较好地表征该类分子的结构,值得进一步推广应用。  相似文献   

10.
利用分子全息技术研究了129个5-羧基苯并咪唑类HCV NS5B聚合酶抑制剂的结构与活性之间的关系.讨论了分子碎片大小、碎片区分参数及全息长度对模型质量的影响.利用偏最小二乘法(partial least square,PLS)建立了一组以99个化合物为训练集的最优模型,该模型的交叉验证相关系数q~2=0.820,非交叉验证相关系数r~2=0.963,标准偏差SEE=0.213;用最优模型对由30个化合物组成的测试集进行预测,得到其相关系数r_(pred)~2=0.98,表明了该模型具有良好的预测能力及拟合能力.利用色码图对模型中不同原子及不同结构的贡献进行了解释,在此基础上根据最优HQSAR模型设计了几种具有良好抗HCV活性的苯并咪唑类HCV NS5B聚合酶抑制剂分子,为新型HCV NS5B聚合酶抑制剂的设计和优化提供了参考.  相似文献   

11.
王秀军*  龙汨 《物理化学学报》2012,28(11):2581-2588
由于引入各种内在近似, 密度泛函理论存在固有误差. 本文采用O3LYP/6-311+G(3df, 2p)//O3LYP/6-31G(d)计算了220个中小型有机分子的生成热(ΔfHcalcΘ), 随后应用神经网络(ANN)和多元线性回归(MLR)方法对ΔfHcalcΘ进行校正. 采用计算得到的生成热、零点能、分子中原子总数、氢原子个数、双中心成键电子数、双中心反键电子数、单中心价层孤对电子数、单中心内层电子数作为ANN和MLR的描述符. 以180个分子作为训练集构造ANN或MLR模型, 并对40 个独立测试集分子的ΔfHcalcΘ进行了预测. 结果表明: 经过ANN和MLR校正后,训练集分子生成热的理论计算值和实验值间的均方根偏差(RMSD)从24.7 kJ·mol-1分别降低到11.8、13.0 kJ·mol-1; 独立测试集分子的RMSD从21.3 kJ·mol-1分别降低到10.4、12.1 kJ·mol-1. 因此ANN模型的拟合和预测能力要明显优于MLR模型.  相似文献   

12.
冯长君  杨杰元  杨雪颖  杨沛艳  冯惠 《化学通报》2022,85(10):1249-1254
通过多元线性回归和人工神经网络方法建立66种多氯联苯生物降解速率常数(K1)的定量构效关系(QSAR). 基于电性距离矢量(Mk),建立了lnK1的最佳三参数(M91、M25和M15)线性模型,其传统相关系数(R2)、交叉验证系数(Rcv2)分别为0.833、0.809。经R2、Rcv2、VIF、FIT、AIC检验,所建模型具有较强的稳定性和良好的预测能力. 将M91、M25、M15作为人工神经网络的输入层结点,采用3:10:1的网络结构,利用BP算法获得了一个令人满意的lnK1模型,训练集、验证集、测试集和总体的R2依次为0.991、0.995、0.997和 0.993。与多元线性回归模型相比,非线性lnK1-BP模型具有更好的预测能力。这两种回归方法相辅相成,线性回归方法为神经网络模型提供了具体的物理解释,而神经网络方法为线性模型提供了更准确的预测结果。  相似文献   

13.
采用人工神经网络(ANN)建立了36种黑莓果酒香气成分的结构与色谱保留时间之间的定量关系(QSRR)模型。以36种黑莓果酒香气成分的分子连结性指数和电拓扑指数作为输入、保留时间作为输出,采用内外双重验证的办法分析和检验所得模型的稳定性,所构建网络模型的相关系数为0.9993、交叉检验相关系数为0.9949、标准偏差为0.1100、残差绝对值小于0.47,应用于外部预测集,外部预测集相关系数为0.9833。为了便于比较,也采用多元线性回归(MLR)法建立了QSRR模型,模型的相关系数为0.9904、交叉检验相关系数为0.9905、标准偏差为1.4896、残差绝对值小于4.32,外部预测集相关系数为0.8973。结果表明,ANN模型获得了比MLR模型更好的拟合效果。  相似文献   

14.
从20种天然氨基酸的41个randic molecular profiles、44个eigenvalue based indices和47个walk and path counts非零描述符分别进行主成分分析,得出一种新的氨基酸描述符——SVREW.将其应用于血管紧张素转化酶抑制三肽结构表征,应用多元线性回归(MLR)及偏最小二乘(PLS)建立定量构效关系模型,同时采用内部与外部双重验证的方法验证模型的稳定性.所建模型复相关系数(Rcum2)、留一法(LOO)交互校验相关系数(Rcv2)和外部样本校验相关系数(Qext2)分别为MLR(0.994,0.974,0.991),P LS(0.949,0.886,0.898).然后利用此多元线性回归方程设计出一系列血管紧张素转化酶抑制三肽化合物并预测了其活性,并且应用分子对接验证所设计药物的合理性.经研究表明SVREW描述符应用于ACE三肽结构表征所建模型的稳定性与预测能力均较好,有望成为多肽定量构效关系研究中一种有效的结构表征方法,并对新药物的发现和研究提供指导.  相似文献   

15.
采用本实验室新近提出的三维全息原子场作用矢量表征34个1-[(2-羟乙氧)甲基]-6-苯硫基胸腺嘧啶(HEPT)类抗艾滋病药物结构并与其活性建立定量构效关系模型. 采用逐步回归对变量进行筛选后, 运用多元线性回归(multiple linear regression, MLR)建模的复相关系数(R2cum)、交互校验的复相关系数(Q2cum)和模型的标准偏差(SD)分别为R2cum=0.928、Q2cum=0.883与SD=0.43, 均优于Hancsh报道的值(R2cum=0.911、Q2cum=0.863与SD=0.45). 模型具有良好的稳定性和预测能力, 表明三维全息原子场作用矢量能较好表征该类分子结构信息, 值得进一步推广应用.  相似文献   

16.
通过比较分子力场分析方法(Co MFA)研究取代喹啉类化合物对金黄色葡萄球菌抑菌活性(p M)的三维定量结构-活性相关(3D-QSAR)。12个化合物建立了预测模型,7个化合物作为验证集(含模板分子)。训练集的Co MFA模型显示立体场、静电场对生物活性贡献依次为49.8%、50.2%。该模型的交叉验证相关系数R2cv=0.650,非交叉验证相关系数R2=0.918,对测试集中的7个化合物的生物活性进行了预测,显示出较强的稳定性和良好的预测能力。通过分析Co MFA三维等势图发现,在取代喹啉类化合物抑菌机理中,R4取代基的强吸电性起主要作用,其次是其他取代基的疏水性作用。应用上述规律进行分子设计,获得了3个在理论上具有较高抑菌活性的新的取代喹啉衍生物,期待实验的验证。  相似文献   

17.
收集了42种多氯代二苯并呋喃的光解半衰期的实验值,并随机将样本分为训练集和测试集,训练集和测试集的样本数分别是32和10个。采用Gaussian-16软件中半经验PM6方法对PCDFs分子进行几何优化和频率分析。将稳定分子的几何参数交给Alvadsec软件计算其分子边邻接指数。采用多元线性回归(MLR)方法找到四个分子边邻接指数对PCDFs分子的光解半衰期值有显着影响。相关系数达到0.9456,Fisher值为56.97,1相似文献   

18.
采用分子电性距离矢量(Molecular Electronegativity Distance Vector,MEDV)表征稠环芳烃类化合物的分子结构.分别运用多元线性回归(Multiple Linear Regres-sion,MLR)和偏最小二乘回归(PLS)建立了稠环芳烃类化合物结构与其液相色谱(LC)保留值的定量结构一性质关系(QSPR)模型,同时采用内部及外部双重验证的办法对所建模型稳定性能进行分析和验证,建模计算值、留一法交互检验预测值和外部样本预测值的复相关系数Rcum、RLOO、Qext分别为0.9970,0.9950,0.9925(MLR);0.9930,0.9790,0.9917(PLS).结果表明,MEDV能较好地表征该类分子结构信息,所建QSPR模型具有良好的稳定性和预测能力.为稠环芳烃类化合物分离、纯化、检测等方法的建立,提供有效的理论依据.  相似文献   

19.
构建147个有机物分子结构与其热导率值之间的定量结构-性质关系(QSPR)模型, 探讨影响有机物热导率的结构因素. 以147个化合物作为样本集, 随机选择118个作为训练集, 29个作为测试集. 应用CODESSA软件计算了组成、拓扑、几何、静电和量子化学等描述符, 通过启发式方法(HM)筛选得到5个结构参数并建立线性回归模型; 用所选5个结构参数作为支持向量机(SVM)的输入, 建立非线性的支持向量机回归模型. 预测结果表明: 支持向量机回归模型的性能(复相关系数R2=0.9240)虽略低于启发式回归模型的性能(R2=0.9267), 但是支持向量机方法预测性能(R2=0.9682)高于启发式方法的预测性能(R2=0.9574), 对于QSPR模型来说, 预测性能更重要. 因此, 总体来说支持向量机方法优于启发式方法. 支持向量机方法和启发式方法的提出为工程上提供了一种根据分子结构预测有机物热导率的新方法.  相似文献   

20.
本文采用了按氢分类的分子电距矢量(H-MEDV)对19个含氟取代苯类化合物进行了结构表征。采用多元线性回归(MLR)方法建立了含氟取代苯类化合物的定量结构-毒性关系(QSAR)的5变量模型;上述模型对19个含氟取代苯类化合物毒性预测与实验值较好的吻合,其复相关系数(R)为0.918,标准偏差(SD)为0.382,结果表明所建模型具有较好的稳定性和预测能力。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号