首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
2.
3.
4.
支持向量机,支持向量回归和分子对接的计算方法已广泛应用于化合物的药理活性计算。为了提高计算的准确性和可靠性,拟以细胞色素P450酶1A2为研究载体,运用建立的联合SVM-SVR-Docking计算模型预测潜在的CYP1A2抑制剂。其中,建立的最优SVM定性模型训练集,内部测试集和外部测试集的准确率分别为99.432%,97.727%和91.667%。最优SVR定量模型训练集和测试集的R和MSE分别为0.763,0.013和0.753,0.056。实验表明两个模型具有较高的准确性和可靠性。通过对SVM和SVR模型结果的比较分析,发现连接性指数、分子构成描述符和官能团数目等分子描述符可能与CYP1A2抑制剂的辨识和活性预测密切相关。随后利用分子对接技术分析化合物与CYP1A2的结合构象及相互作用的稳定性。形成氢键相互作用的关键氨基酸包括THR124,ASP320;形成疏水相互作用的关键氨基酸包括ALA317和GLY316。所获得模型可用于天然产物化学成分中CYP1A2潜在抑制剂的活性计算及其介导的药物-药物相互作用预测提供理论指导,也为合理联合用药提供一定参考。共获得20个对CYP1A2具有潜在抑制活性的化合物。部分结果与文献结果相互印证,进一步说明了模型的准确性和联合计算策略的可靠性.  相似文献   

5.
6.
7.
8.
In this investigation, three-class classification models of aqueous solubility (logS) and lipophilicity (logP) have been developed by using a support vector machine (SVM) method combined with a genetic algorithm (GA) for feature selection and a conjugate gradient method (CG) for parameter optimization. A 5-fold cross-validation and an independent test set method were used to evaluate the SVM classification models. For logS, the overall prediction accuracy is 87.1% for training set and 90.0% for test set. For logP, the overall prediction accuracy is 81.0% for training set and 82.0% for test set. In general, for both logS and logP, the prediction accuracies of three-class models are slightly lower by several percent than those of two-class models. A comparison between the performance of GA–CG–SVM models and that of GA–SVM models shows that the SVM parameter optimization has a significant impact on the quality of SVM classification model. Electronic supplementary material  The online version of this article (doi:) contains supplementary material, which is available to authorized users. Hui Zhang and Ming-Li Xiang are contributed equally.  相似文献   

9.
10.
近红外光谱结合化学计量学方法对癌症的辅助诊断已有了文献报道.该文测定了77例不同生理阶段的子官内膜组织病理切片的近红外光谱,对其分别进行多元散射校正(MSC)、正交信号校正(OSC)以及二者联用的预处理方法,采用拉丁配分法选择3/4样本作为训练集,1/4样本作测试集,建立支持向量机(SVM)模型进行分类,并与基于同样预...  相似文献   

11.
在大气环境中,采用激光诱导击穿光谱技术与支持向量机算法相结合,对来自不同厂家不同颜色的20种工业塑料进行分类研究。首先对分类结果有影响的实验参数进行优化,在最佳的实验参数条件下进行光谱采集,采用6条非金属元素特征谱线,有效缩短了训练支持向量机分类模型所需时间,从而提高了塑料的分类效率。实验结果表明,利用碳、氢、氧、氮等主量非金属元素对这些工业塑料样品进行分类,测试集1 000个光谱数据中有996个识别正确,算术平均识别精度达到99.6%。在选取较少的主量非金属特征谱线的情况下,结合采用支持向量机算法,可以实现激光诱导击穿光谱技术对更多类型的塑料制品快速、高精度分类,为激光诱导击穿光谱技术在实现塑料分类方面提供了数据参考。  相似文献   

12.
A joint clustering and classification approach is proposed.This approach exploits unlabeled data for efficient clustering,which is applied in the classification with support vector machine(SVM) in the case of small-size training samples.The proposed method requires no prior information on data labels,and yields better cluster structures.Through cluster assumption and the notions of support vectors,the most confident k cluster centers and data points near the cluster boundaries are labeled and used to train a reliable SVM classifier.Our method gains better estimation of data distributions and mitigates the unrepresentative problem of small-size training samples.The data set collected from Landsat Thematic Mapper(Landsat TM-5) validates the effectiveness of the proposed approach.  相似文献   

13.
基于近红外光漫反射谱技术的检测分析具有简单,快捷,安全等优势而被广泛应用于各行各业。应用近红外光谱分析技术实现不同煤种的快速分类,该方法可以替代费时费力费财的传统化学分析方法。同时首次将置信学习机(confidence machine)引入近红外分析中,实现了对分析结果的风险评估。采集了来自不同矿区共四种不同煤种(肥煤,焦煤,瘦煤和贫瘦煤)的199个煤样本的近红外光谱,通过机器学习的方法针对煤的近红外光谱构建了煤种分类器来实现煤种的快速分类。在近红外分析中引入了置信学习机的分析方式,结合支持向量机(SVM),构建了离线和在线的CM-SVM分类器。置信学习机是一种概率方法,使用概率(CM-SVM)来取代分类超平面(SVM)进行分类,不仅分类效果好于传统的SVM,达到了95.48%的分类率,还能同时给出每个样本分类结果的置信度,可靠度等风险信息。另外,CM-SVM通过对置信水平的设定,得到不同置信度下预测区间,该区间的预测正确率是与置信水平严格对应的,对于产品质量控制有非常重要的意义。置信学习机同时是一种在线的学习模型,新样本的不断加入会提高模型的性能,非常适合于工业现场的在线分析。在线的CM-SVM模型随着样本数的增加,预测结果的置信度有所提高,对工业现场近红外分析有重要意义。  相似文献   

14.
大量废弃的塑料制品给生态环境造成严重破坏,当务之急是要对塑料进行分类回收。传统的分类方法普遍存在成本高,效率低,操作复杂等问题,不能满足工业生产的需要。激光诱导击穿光谱技术由于具备简单灵活,快速灵敏等优点,在物质鉴别领域有广泛应用。采用激光诱导击穿光谱技术结合主成分分析(PCA)和支持向量机(SVM)算法对20种塑料进行分类识别研究。由于目前有关塑料分类识别速率的研究报道较少,该实验在保证识别准确率的前提下,进一步研究和分析实验过程耗费的时间,满足工业生产中快速分类的要求。每种塑料采集100组光谱数据,随机选取50组数据作为训练集建立模型,余下50组作为测试集测试模型的分类识别效果,所以训练集和测试集各有1 000组光谱数据。将训练集的数据不加处理地输入SVM中进行训练,并采用5折交叉验证建立最佳模型,此时测试集的识别准确率为99.90%,建模时间为1小时58分41.13秒,预测时间为11.96 s。由此可见,单纯使用SVM算法可以得到很高的准确率,但是需要耗费大量时间。为了提高实验效率,引入主成分分析算法,将原来的高维数据变换成低维数据,并用降维后的数据训练模型。针对不同的主成分个数,均采用随机训练十次再取平均值的方法获得相关数值。实验表明,当选取主成分个数为13时,得到相应的识别准确率为99.80%,而PCA处理时间为1.44 s,建模时间为12.16 s,预测时间仅为0.02 s。虽然PCA算法结合SVM算法在对20种塑料进行分类识别时准确率有轻微下降,但是大大减少了模型训练的时间,实验效率得到很大程度的提高。结果表明,结合两种算法辅助激光诱导击穿光谱可以对塑料进行快速准确的分类识别。  相似文献   

15.
16.
棉花精量播种技术目前已经在新疆兵团全面推广,该技术能精确实现一穴一粒的农艺技术指标,但是也对高质量棉种的筛选提出了更高的要求。为了避免播种往年活力不足的棉种而导致发芽率降低的问题,结合机器学习和近红外(NIR)高光谱成像技术(HSI)进行棉种年份精确鉴别,实现棉种的快速无损筛选。采集2016年—2019年近四年外观无明显差异的棉种各360粒,共1 440粒棉种(按照3∶1∶1划分训练集、验证集和测试集)作为样本,按照每批60粒采集915~1 698 nm范围的棉种高光谱图像,去除首尾两端噪声大的光谱,保留1 002~1 602 nm范围的光谱为原始数据。利用Savitzky-Golay(SG)平滑算法对光谱进行预处理,采用主成分载荷方法(PCA-loading)选取13个特征波段,基于全部光谱数据和特征波段(±10 nm)数据建立逻辑回归(LR)、偏最小二乘判别分析(PLS-DA)、支持向量机(SVM)、循环神经网络(RNN)、长短记忆网络(LSTM)和卷积神经网络(CNN)六种分类模型。使用全光谱数据建模时,六种分类模型在测试集上的鉴别准确率分别为96.27%,98.98%,99.32%,96.95%,97.63%和100%,其中CNN和SVM模型取得了较好的结果;使用特征光谱数据建模时,六种分类模型在测试集上的鉴别精度分别为93.56%,97.29%,98.30%,95.25%,94.24%和99.66%,其中CNN和SVM模型仍有较好的分类结果。结果表明,使用全光谱数据建模时,六种分类模型都可以实现较高精度的棉种年份鉴别,使用特征光谱数据建模时CNN和SVM模型的鉴别精度仍可达到98%;其中深度学习方法优于传统机器学习方法,但是传统机器学习方法仍能保持较好的鉴别准确率。因此,结合近红外高光谱成像技术和机器学习方法能够实现棉种年份的高精度鉴别,为棉花精量播种过程中的优质棉种选种技术提供理论依据和方法。  相似文献   

17.
宁夏盐池县荒漠草地属于中温带干旱气候,由于过度利用出现不同程度的退化,退化指示种比重增大,造成不同荒漠草地群落组成差异也很大,如何区别不同荒漠草地植物,并据此对退化指示种进行动态监测是了解荒漠草地退化程度的关键。目前随机森林(RF)、支持向量机(SVM)与K-邻近(KNN)分类模型被广泛应用于森林植物和农作物的遥感分类,并取得了较好的分类识别效果,但针对草地尤其是荒漠草地植物的分类识别研究较少。因此使用ASD地物光谱仪于7月在宁夏盐池二步坑、冯记沟、高沙窝、麻黄山不同荒漠草地采集了32种植物作样本获得442条光谱进行光谱特征分析。筛选出7个植被指数:归一化植被指数705(NDVI705)、绿通道植被指数(GNDVI)、光化学植被指数(PRI)、土壤调节植被指数(OSAVI)、可视化气压阻抗指数(VARI)、植被衰减指数(PSRI)和归一化水指数(NDWI)作为随机森林模型(RF)、支持向量机(SVM)模型、K-邻近(KNN)模型的原始变量,对32种荒漠草地植物进行分类识别,并通过分类模型精度的比较筛选较优模型。结果表明:(1)不同植物光谱反射率均符合绿色植物特征,但各植物原始光谱不同波段之间存在明显差异,植物原始光谱水分吸收波段差异明显,且有红边蓝移现象;(2)RF,SVM和KNN三个分类模型对32种植物的分类精度分别达到了0.98,0.94和0.98,识别效果较好,但3种分类模型均对白莲蒿与北芸香、虫实与甘草发生了误判;(3)随机森林模型重要性指标中NDWI与PRI为区分荒漠草地植物的关键指标,说明荒漠植物冠层水分与类胡萝卜素含量是影响荒漠草地植物光谱分类的重要因素。试验利用随机森林模型(RF)、支持向量机(SVM)与K-邻近(KNN)分类方法,建立了主要植物的分类模型。  相似文献   

18.
19.
20.
黄精药材品质优劣与基原植物产地环境因子密切相关,建立简单、快速且能够准确鉴别药材产地的方法对保证其质量可控及用药安全具有重要的理论意义和应用前景。研究中以云南、四川和广西9个产地的133份滇黄精Polygonatum kingianum coll. et Hemsl根茎为试验材料,采集衰减全反射-傅里叶变换红外光谱(ATR-FTIR)和紫外-可见光光谱(UV-Vis)数据预处理后分别建立单一光谱随机森林(Random forest, RF)模型;将ATR-FTIR与UV-Vis数据直接串联完成低级融合,提取两种光谱的主成分数(PCs)和潜在变量(LVs)以实现中级(中级融合PCs和中级融合LVs)和高级数据融合(高级融合PCs和高级融合LVs),基于不同数据融合策略分别建立RF模型;比较不同模型的正确率(ACC)、灵敏度(SEN)和特异性(SPE),筛选产地鉴别最佳模型。结果显示,不同产地滇黄精ATR-FTIR和UV-Vis峰型相似,吸光度略有差异,ATR-FTIR显示14个共有峰,与糖类、甾体皂苷、黄酮类和生物碱类物质有关,其UV-Vis共有峰主要位于272及327 nm处,与黄酮类物质有关;ATR-FTIR、UV-Vis和低级融合的RF模型,训练集和预测集ACC分别为(76.34%,95.00%),(80.65%,95.00%)和(83.87%,100.00%),但SEN和SPE值较低,故不宜采用;中级融合PCs和中级融合LVs的RF模型的SEN和SPE分别为大于0.91和0.98,训练集ACC分别为91.40%和97.85%,预测集ACC均为97.50%;高级融合PCs和高级融合LVs的RF训练集ACC分别为77.42%和97.85%,预测集ACC均为95.00%,高级融合PCs的RF模型鉴别效果较差,高级融合LVs的RF模型存在过拟合现象;模型鉴别能力为中级融合LVs>中级融合PCs>低级融合> UV-Vis>ATR-FTIR>高级融合PCs;提取LVs对产地鉴别的方法优于PCs;中级融合LVs建立的RF模型鉴别ACC最高,SEN和SPE大于0.98,模型性能最佳。该方法可为黄精药用资源的科学评价提供理论依据和技术支撑。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号