首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
本文精选了50味平性药及50味对照非平性药作为研究对象;从各味药的有效成分入手,利用其所含有的特定的骨架及官能团信息直观地进行了数字化表征;采用模式识别中的支持向量机方法进行了分类研究,挑选最优特征时,总正确率最高可以达到73%,表明了中药的有效成分与其药性之间确实存在一定的相关关系。并且通过对识别率的比较发现,平性药药性的不显著本质上可能是由于其本身所含有效成分更高的分子多样性。本文对探索平性药药性的物质基础具有一定的指导作用。  相似文献   

2.
依据中药大黄的近红外光谱信息,采用最小二乘双胞胎支持向量机( LSTSVM)算法,通过MATLAB软件编程,建立参数可优化识别模型,实现了对中药大黄的真伪鉴别.将实验材料98个大黄样品随机划分为训练集和测试集,对于训练集60个样品采用留1/5法交叉验证优化模型参数,以所选最优化参数结合训练集样品的近红外光谱建立最优识别模型,对测试集的38个样品的真伪迸行识别,识别率可达97.4%.结果表明,LSTSVM算法是一种有效的识别方法,可依据中药大黄的近红外光谱对其真伪进行快速识别.同时,本研究将大黄样品6次随机划分为训练集和测试集,建模预测平均识别率为93.4%,表明采用LSTSVM算法建立识别模型具有较好的稳健性.  相似文献   

3.
以支持向量机(SVM)和线性判别分析(LDA)对200条禽流感病毒、100条B型流感和100条C型流感病毒蛋白共400条为训练集样本,从表征序列的200个整体与局部变量中以逐步(stepwise)方法选取24个变量作为LDA模型的输入建立线性识别模型,病毒蛋白总识别率达99.8%,留一法交互检验总识别率为99.4%.从原始200变量中经主成分分析得16个主成分作为SVM的输入,以径向基核函数(RBF)SVM建立非线性识别模型,病毒蛋白总识别率为99.8%,留一法交互检验总识别率为99.2%.以100条禽流感、50条B型流感和50条C型流感病毒编码蛋白质共200条为测试集样本,得LDA模型,对其总识别正确率为95.4%,SVM模型对其总识别正确率为96.5%.识别结果表明,两个模型都可较好识别禽流感病毒蛋白,并且SVM对禽流感病毒蛋白的识别结果优于LDA.  相似文献   

4.
支持向量机分类和回归用于肽的QSAR研究   总被引:4,自引:0,他引:4  
周鹏  曾晖  李波  周原  李志良 《化学通报》2006,69(5):342-346
使用支持向量机技术对两类肽化合物体系进行了分类和回归研究,并将其系统地与K最邻近法、多元线性回归、偏最小二乘、人工神经网络进行了比较。结果表明,对于小样本、非线性问题,支持向量机具有较强的稳定性能及泛化能力,在大多数情况下能够得到优于传统方法的建模效果。对于分类问题,支持向量机对训练集和测试集都达到了100%的分类正确率;对于回归问题,支持向量机虽对训练集样本拟合效果略低于人工神经网络,但对外部测试集却表现出较强的预测能力。  相似文献   

5.
应用随机森林方法、开放源代码软件-CDK(Chemistry Development Kit)描述符与170个化合物的训练数据集[其中96个为磷糖蛋白(P-gp)底物], 建立了P-gp底物的识别模型. 研究了CDK描述符与P-gp底物识别的关系, 结果表明, 原子极化性和电荷偏面积等分子属性对P-gp底物识别起到重要作用. 该模型对训练集的预测正确率为99.42%; 对外部测试集(42个化合物, 其中24个为P-gp底物)的预测结果为P-gp底物、非底物及总测试集的识别正确率分别为87.50%, 83.33%和85.71%. 212个化合物数据集上的Leave-One-Out交叉验证识别正确率为77.4%.  相似文献   

6.
分别采用支持向量学习机、人工神经网络、调节性逻辑回归和K-最临近等机器学习方法对761个二氢叶酸还原酶抑制剂建立了其活性分类预测模型. 采用组成描述符和拓扑描述符表征抑制剂的分子结构及物理化学性质, 使用Kennard-Stone方法进行训练集的设计, 并用Metropolis Monte Carlo模拟退火方法作变量选择. 结果表明, 支持向量学习机优于其它机器学习方法, 所得到的最优模型具有较好的预测结果, 其预测正确率为91.62%. 说明通过合适的训练集设计及变量选择, 支持向量学习机方法可以很好地用于二氢叶酸还原酶抑制剂的活性分类预测.  相似文献   

7.
将主成分分析(PCA)用于肝功能检测数据特征提取,然后用支持向量机(SVM)对乙肝、丙肝、肝硬化、正常人样本建立分类模型。采用高斯径向基函数(RBF)为核函数,调节核函数参数C及σ以建立最佳支持向量机模型。该模型对训练集的识别率为99.3%,对预测集的预测率为96.4%。结果表明:PCA-SVM法建立的肝病分类模型能较好的区分乙肝、丙肝、肝硬化及正常人,且分类效果优于传统支持向量机及人工神经网络(ANN)分类模型。  相似文献   

8.
陈国华  夏之宁  陆瑶 《化学学报》2010,68(11):1137-1142
选取25条CPP和16条非CPP作为训练集样本, 以61条CPP和21条非CPP为预测集样本. 利用氨基酸的z-Scale对肽链进行编码, 分别使用原始72个自交叉协方差变量和它们的主成分矢量进行线性判别(LDA)和支持矢量机(SVM)分类研究. 当采用LDA方法时, 对于训练集的预测以及它们的留一法交互检验, 均获得比较优越的结果, 但对预测集的预测总的识别率的最优结果仅为57.3%. 分别利用主成分和原始变量集作为SVM的输入建立的非线性识别模型, 对训练集的总识别率分别为85.4%和100%, 留一法交互检验的总识别率分别为80.5%和75.6%, 对预测集的最优总识别正确率为74.4%. 识别结果表明SVM能够比较好的提取原始变量间的细微模式变化, 对CPP总的识别结果优于LDA.  相似文献   

9.
基于自组织映射神经网络的中药注射剂质量快速鉴别方法   总被引:3,自引:0,他引:3  
刘雪松  施朝晟  程翼宇  瞿海斌 《分析化学》2007,35(10):1483-1486
将近红外光谱分析技术与人工神经网络相结合,研究提出一种基于自组织映射神经网络的近红外光谱神经元分类模型,用于对中药注射剂产品的近红外光谱进行计算分析,可实现对注射剂质量的快速鉴别。以3个不同厂家生产的参麦注射剂为研究对象,考察本方法的分类能力,其分类正确率达到96.4%,优于参与比较的判别式偏最小二乘法(90.5%)、反向传播神经网络(88.1%)和支持向量机(90.5%)。  相似文献   

10.
为提高激光诱导击穿光谱技术(Laser-induced breakdown spectroscopy,LIBS)对鲜肉品种的识别率,采用支持向量机结合主成分分析算法辅助LIBS技术对鲜肉品种进行识别.对鲜肉切片用载玻片压平,采用LIBS技术对鲜肉组织(猪肉、牛肉和鸡肉)表面进行光谱数据的采集,每种鲜肉采集150幅光谱并进行随机排列,取前75幅光谱作为训练集建立模型,后75幅作为测试集测试建模结果.研究选取K、Ca、Na、Mg、Al、H、O等元素的49条归一化谱线数据进行主成分分析,并用所得数据建立支持向量机分类模型.结果表明,通过主成分分析降维,输入变量从49个优化减少到18个,模型建模速度从88.91 s降至55.52 s,提高了支持向量机的建模效率;并使预测集的平均识别率提高到89.11%.本研究为激光诱导击穿光谱技术在鲜肉品种快速分类领域提供了方法和数据参考.  相似文献   

11.
在色谱图基线校正和色谱峰匹配基础上,提出以40个银杏叶提取物HPLC指纹图谱的色谱图轮廓作为输入,相应的提取物总抗氧化活性作为输出,建立最小二乘支持向量机回归模型,并对包含10个样本的测试集进行了预测.最小二乘支持向量机的测试集预测误差均方根(RMSEP)为0.0230,预测结果优于目前普遍使用的误差反向传播神经网络和偏最小二乘回归.与采用色谱峰面积为分析变量的模型预测结果比较表明:采用消除干扰后的色谱图全谱轮廓保留了样本的全部信息,预测结果更好  相似文献   

12.
Near-infrared spectroscopy (NIRS) was applied for direct and rapid collection of characteristic spectra from Rhizoma Corydalis, a common traditional Chinese medicine (TCM), with the aim of developing a method for the classification of such substances according to their geographical origin. The powdered form of the TCM was collected from two such different sources, and their NIR spectra were pretreated by the wavelet transform (WT) method. A training set of such Rhizoma Corydalis spectral objects was modeled with the use of the least-squares support vector machines (LS-SVM), radial basis function artificial neural networks (RBF-ANN), partial least-squares discriminant analysis (PLS-DA) and K-nearest neighbors (KNN) methods. All the four chemometrics models performed reasonably on the basis of spectral recognition and prediction criteria, and the LS-SVM method performed best with over 95% success on both criteria. Generally, there are no statistically significant differences in all these four methods. Thus, the NIR spectroscopic method supported by all the four chemometrics models, especially the LS-SVM, are recommended for application to classify TCM, Rhizoma Corydalis, samples according to their geographical origin.  相似文献   

13.
The immune system is concerned with the recognition and disposal of foreign or "non self" molecules or cells that enter the body of an immunologically competent individual. The generation of an immune response depends on the interaction of components, namely, the immunogen (nonself or foreign cell or molecule), antibody producing humoral immune system, and sensitized lymphocyte producing cellular immune system. An immunogen possesses surface structures referred to as epitopes; the precise pattern of each epitope enables an individual's immune system to recognize cells or molecules as self or immunogens. During the recognition process, the specific cells known as macrophages identify the epitope structures on the immunogen and save them in the form of short peptides 10-18 amino-acids-long known as immune dominant peptides (IDPs). IDPs are then bound with surface proteins on macrophages known as MHC protein complexes. The macrophages then present this IDP-MHC complex to a T cell that possesses a specific receptor that is specific for the foreign epitope on the IDP bound to MHC complex. This initiates an immune system cascade that results in the disposal of the immunogen. The study and accurate prediction of T-cell epitopes is, thus, very important for designing vaccines against pathogenic diseases. The present study applied the newly developed biosupport vector machine to the T-cell epitope data. This new algorithm introduces a biobasis function into the conventional support vector machines so that the nonnumerical attributes (amino acids) in protein sequences can be recognized without a feature extraction process, which often fails to properly code the biological content in protein sequences. The prediction accuracy of a 10-fold cross validation is 90.31%, compared with 87.86% using support vector machines reported as the best compared with other algorithms in an earlier study.  相似文献   

14.
15.
16.
灰色系统理论在中药色谱指纹图谱模式识别中的应用研究   总被引:2,自引:0,他引:2  
魏航  林励  张元  王莲婧  陈沁群 《色谱》2013,31(2):127-132
建立了基于灰色系统理论的中药色谱指纹图谱模式识别模型。运用基于范数与信息熵赋权法的灰色关联分析,求出各待比较图谱特征变量数据序列与理想图谱特征变量数据序列之间的灰色关联度,并依据模糊匹配中的“最大匹配度”原则进行判断,从而达到品种识别和质量评价的目的。该模型在56批次不同品种化橘红药材样品的高效液相色谱分析中取得较满意的结果: 熵权与范数的灰色关联分析均能准确识别出毛橘红与光橘红两个品种,克服了传统相似度或灰色关联在化橘红色谱指纹图谱分析中的误判问题;对药材中化学成分的种类与含量十分接近的毛橘红不同栽培品种的识别率超过92.85%。此外,该模型计算量较少,整个模式识别过程通过计算机编程实现,操作简单。实验结果显示,灰色系统理论在中药色谱指纹图谱模式识别中有良好的适应性。  相似文献   

17.
分别以支持向量机(SVM)和KStar方法为基础, 构建了代谢产物的分子形状判别和代谢反应位点判别的嵌套预测模型. 分子形状判别模型是以272个分子为研究对象, 计算了包括分子拓扑、二维自相关、几何结构等在内的1280个分子描述符, 考查了支持向量机、决策树、贝叶斯网络、k最近邻这四种机器学习方法建立分类预测模型的准确性. 结果表明, 支持向量机优于其他方法, 此模型可用于预测分子能否被细胞色素P450酶催化发生氧脱烃反应. 代谢反应位点判别模型以538个氧脱烃反应代谢位点为研究对象, 计算了表征原子能量、价态、电荷等26个量子化学特征, 比较了决策树、贝叶斯网络、KStar、人工神经网络建模的准确率. 结果显示, KStar模型的准确率、敏感性、专一性均在90%以上, 对分子形状判别模型筛选出的分子, 此模型能较好地判断出哪个C―O键发生断裂. 本文以15个代谢反应明确的中药分子为验证集, 验证模型准确性, 研究结果表明基于SVM和KStar的嵌套预测模型具有一定的准确性, 有助于开展中药分子氧脱烃代谢产物的预测研究.  相似文献   

18.
19.
《Analytical letters》2012,45(15):2560-2569
A new approach for discrimination of adulterated milk is reported using two-dimensional infrared (IR) correlation spectroscopy by multiway principal component analysis (MPCA) and least squares support vector machines (LS–SVM). First, the synchronous two-dimensional spectra of pure and adulterated milk were calculated. Then, MPCA was used to reduce the dimensions, extract features of two-dimensional correlation data set, and distinguish adulterated milk and pure milk. Finally, a LS-SVM model was developed using the scores of the first thirteen principal components from synchronous two-dimensional correlation spectra computed by MPCA as the input variables. The ratios of correct classification were 100% and 96.3% for calibration set and prediction set, respectively. The area under the receiver operating characteristic curves (ROC) of 0.991 for prediction set was obtained by LS–SVM. The results indicate that two-dimensional correlation infrared spectra combined with MPCA–LS–SVM may be a rapid screening technique for discrimination of adulterated milk with good accuracy.  相似文献   

20.
乔亚丽  刘喆  沈爱金  郭志谋  刘艳芳  陈相银  徐青  梁鑫淼 《色谱》2020,38(12):1440-1448
中药穿山甲为鳞鲤科动物穿山甲的鳞甲,常用于治疗乳汁不通、痈肿疮毒、风湿痹痛等症,饮片来源上经常存在基源不清、等级不明的问题。针对以上问题,目前已发展出了多种分析方法,包括薄层色谱、质谱和DNA检测,但由于特异性低、设备成本高、步骤繁琐等不足,以上方法均不适合作为穿山甲质量监测的常规手段,而色谱指纹谱技术恰好可以弥补以上不足。该文旨在建立穿山甲的色谱指纹谱,并探讨其在等级及基源鉴别方面的可行性。穿山甲粉末经1 mol/L HCl加热水解得供试液,色谱柱采用Waters Symmetry 300 C18,以0.1%(v/v)三氟乙酸/水、0.1%(v/v)三氟乙酸/乙腈为流动相,280 nm为检测波长,采用梯度洗脱获得穿山甲指纹谱。经考察,该方法的精密度、日内日间重复性及样品稳定性均表现良好(RSD<5%)。以12批中华穿山甲一等品的平均指纹谱为对照指纹谱,同时确认17个共有峰,继而以共有峰绝对峰面积为原始数据,计算样品指纹谱与对照指纹谱的相似度。结果表明,中华穿山甲与其他动物来源穿山甲的相似度不高于0.776,体现了相似度评价在基源鉴别上的有效性;但不同等级穿山甲之间交叉严重,表明相似度评价在等级鉴别上的局限性。以24批不同等级中华穿山甲为分析对象建立判别分析模型,经十折交叉验证,模型无偏差正确率为95.83%,说明该模型在等级区分上可行性很高。该文通过建立穿山甲的色谱指纹谱,并结合不同数据处理方法验证了其在基源鉴别和等级区分方面的可行性,为保证穿山甲临床用药的科学性、准确性提供新的思路。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号