首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 156 毫秒
1.
随着大量分子描述符应用于QSAR/QSPR,如何筛选出具有良好稳定性和预测能力的描述符集,成为亟待解决的一个瓶颈问题.将63个有机化合物的1664个描述符经过初步预选后,利用偏最小乘(PLS)方法进行变量筛选,获得42个重要描述符;随机选择43个有机物,针对透聚乙烯膜性能进行训练研究,得优良估计能力和良好稳定性模型(A=6,r2=0.9647,RMSE=0.213,q2=0.8364,RMSV=0.467);对模型外部20个有机物进行预测,表明模型具有良好预测能力(rp2=0.9306,RMSP=0.326).PLS变量筛选法可以快速有效地筛选与活性密切相关的重要描述符,进而构建具有良好稳定性和预测能力的QSAR模型.  相似文献   

2.
为了预测分子的抗真菌活性,计算了表征分子的电子、拓扑、几何结构和分子形状等特征的67个分子描述符,并用于支持向量学习机对分子抗真菌活性分类模型的建立和活性预测.分别用留一法和五重交叉法对模型进行了验证.在五重交叉验证中,根据分子三维结构的相似性,首先把所研究的94个分子分成若干类,再分别从每一类中随机选择若干个分子组成若干个训练集,剩余的分子构成相应的测试集.结果表明,用上述两种验证方法得到的结果相近,且所建立的模型具有较高的预测性,交叉验证的预测正确率达到84.0%.  相似文献   

3.
与传统的非甾体类消炎药相比,选择性环氧化酶-2抑制剂具有无胃肠道粘膜损伤,溃疡和肾功能障碍等严重的副作用,设计选择性环氧化酶-2抑制剂具有重要意义。本文用支持矢量学习机和神经网络两种机器学习方法建立选择性环氧化酶-2抑制剂的活性预测模型,以期为选择性环氧化酶-2抑制剂药物的合成提供先导化合物。我们将467个环氧化酶-2抑制剂用Kennard-Stone方法分为训练集,验证集和独立测试集,对每一抑制剂分子我们计算了463个包含组成描述符和拓扑描述符的分子描述符来表征其分子结构,并通过F-Score方法选取最重要的分子描述符用于分类模型的建立。结果表明,SVM方法通过变量筛选后具有很好的预测能力,其预测正确率达到93.30%。  相似文献   

4.
基于支持向量机方法的HERG钾离子通道抑制剂分类模型   总被引:1,自引:0,他引:1  
对human ether-a-gō-gō related genes(HERG)钾离子通道(钾通道)抑制剂,计算了表征分子组成、电荷分布、拓扑、几何结构及物理化学性质等特征的1559个分子描述符.采用Fischer Score(F-Score)排序过滤和Monte Carlo模拟退火法相结合从中筛选与HERG钾通道抑制剂分类相关的分子描述符.采用支持向量机(SVM)方法,分别以IC50=1.0、10.0μmol·L-1为分类标准,建立了三个分类预测模型.对367个训练集分子,用五重交叉验证.得到正、负样本的平均预测精度分别为84.8%-96.6%、80.7%-97.7%,其总的平均预测精度为87.1%-97.2%,优于其它文献报道结果.对97个外部测试集分子,所建三个模型的总样本预测精度在67.0%-90.1%之间,接近或优于其它文献报道结果.  相似文献   

5.
应用随机森林方法、开放源代码软件-CDK(Chemistry Development Kit)描述符与170个化合物的训练数据集[其中96个为磷糖蛋白(P-gp)底物], 建立了P-gp底物的识别模型. 研究了CDK描述符与P-gp底物识别的关系, 结果表明, 原子极化性和电荷偏面积等分子属性对P-gp底物识别起到重要作用. 该模型对训练集的预测正确率为99.42%; 对外部测试集(42个化合物, 其中24个为P-gp底物)的预测结果为P-gp底物、非底物及总测试集的识别正确率分别为87.50%, 83.33%和85.71%. 212个化合物数据集上的Leave-One-Out交叉验证识别正确率为77.4%.  相似文献   

6.
为了预测人体免疫缺陷蛋白酶抑制剂的活性, 计算了表征分子的组成和拓扑特征的462个分子描述符, 用Kennard-Stone方法和随机方法进行了训练集和测试集设计, 用Monte Carlo 模拟退火方法进行变量筛选, 并分别用神经网络, 逻辑回归, k-近邻和支持向量学习机方法建立了HIV-1蛋白酶的抑制剂模型. 结果表明支持向量学习机优于其余机器学习方法, 用SVM方法所建立的最优模型的最后预测正确率达到98.24%.  相似文献   

7.
分子映射(MOLMAP)指数是以分子的化学键描述符为基础,通过Kohonen自组织映射依据一定的算法而衍生.化学键描述符是由化学键的物理化学性质,如两端原子的电荷差和拓扑性质,键连杂原子数量等所组成.本文将分子映射指数应用于4075个有机物质(Ames实验结果:2305个结构有诱变性,1770个结构无诱变性)的变异性预测.通过随机森林,分别采用三种类型的指数建立模型:(1)采用不同维数的分子映射指数;(2)采用全局分子描述符;(3)将分子映射指数与全局分子描述符相结合.整个数据集的集外(out-of-bag)交叉验证的正确预测率达到85.4%.为了检验模型的稳定性,采用所建模型预测源于另一数据库的472个化合物,正确预测率为86.7%,与此前的研究相比,两个预测结果均有所提高.  相似文献   

8.
药物的水溶解度与其吸收密切相关。本文利用一种新的计算方法,VolSurf,预测药物的水溶解度并测定有利于药物水溶解度的主要分子特征。被测化合物包括26个结构不同的药物,通过偏最小二乘分析法,对药物水溶解度实验值与分子特征进行相关,得到较好的模型(r2=0.90,q2=0.77)。将化合物分为训练集和预测集进行相关分析,结果表明以18个化合物所建立的训练集模型对其余8个化合物有较好的预测能力,预测的标准偏差(SDEP)为0.59。参数分析表明分子与水相互作用的3个局部能量最小值越小,且它们之间的距离越大,对其水溶解度越有利;亲水性占主导因素的分子有高的水溶解度;分子的疏水性越强,在水中的溶解性越弱;大分子的溶解度较小分子溶解度低。  相似文献   

9.
为预测埃坡霉素类衍生物的抗癌活性, 定义了一套表征分子形状的描述符, 即K阶形状参数, 并计算了67个表征分子的电子、拓扑和几何结构的分子描述符. 描述符经遗传算法筛选, 用于建立基于支持向量学习机(SVM)的抗癌活性分类模型; 用留一法和5重交叉验证法对SVM模型参数进行了优化. 结果表明模型具有较高的预测性且两种方法得到相近结果, 交叉验证的预测正确率达80.6%; 经筛选后的描述符有30个, 其中含有5个K阶形状参数, 这些描述符对埃坡霉素类衍生物的抗癌活性的模型建立具有比较重要的作用.  相似文献   

10.
GABAA受体是中枢神经系统内重要的抑制性受体,有广泛的神经生理活性.由于镇静/抗惊厥药物在临床上的广泛应用,使得其中苯并二氮杂作用位点尤为重要.我们用比较分子场法(CoMFA)对一系列咪唑苯并二氮杂类化合物(BZ)与五种重组受体亚型的亲和力进行了结构活性关系研究,得到的一组模型都有较高的交叉验证系数.并在此基础上,建立了非交叉验证的一组PLS模型.用该组模型对随机选择的6个化合物组成的测试集进行了预测,都得到了相当满意的结果,表明所建立的一组模型具有良好的预测能力.本研究对于设计高亲和力的BZ受体的配基和研究GABAA受体的模型有指导意义.  相似文献   

11.
海水中铁(Ⅲ)-二元有机酸盐配合物的光化学反应研究   总被引:1,自引:0,他引:1  
采用实验室模拟的方法研究了高压汞灯模拟日光照射下铁(Ⅲ)-二元有机酸盐配合物在天然海水中的光化学反应.结果发现,在二元有机酸盐配体的存在下,铁(Ⅲ)发生光化学反应生成还原态的铁(Ⅲ),铁(Ⅲ)会被溶液中的氧再氧化为铁(Ⅲ).铁(Ⅲ)的光还原反应速率受到配体浓度、pH、光强以及温度的影响.在二元有机酸与Fe(Ⅲ)浓度配比大于2的情况下,Fe(Ⅲ)-二元有机酸盐配合物的光还原反应初期铁(Ⅲ)浓度的增长符合一级动力学反应规律,100min后浓度趋于稳定,方程式为[Fe(Ⅲ)]t=kOA[OA]·[Fe(Ⅲ)]ini×[1-exp{-(kOA[OA]+kox)t}]/(kOA[OA]+kox).光强升高和pH降低都能加快光还原反应速率,而改变温度则基本上对光还原反应速率无影响,证明铁(Ⅲ)的光还原反应为自由基引发的电子转移过程.  相似文献   

12.
本文应用一种组合遗传算法和共轭梯度法的支持向量机(GA-CG-SVM)方法建立了药物诱导磷脂质病分类预测模型.首先对描述符进行了优化,选出了19个描述符用于模型的构建,所建模型对训练集的预测准确率为81.6%,对测试集的预测精度为87.5%,说明所建SVM分类模型不仅能正确预测训练集药物诱导的磷脂质病,也对其他化合物具...  相似文献   

13.
14.
15.
16.
17.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号