期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

张亚超李梦龙郭延芝文志宁高楠莎覃洁萍邓家刚《化学研究与应用》2010,22(1)

本文精选了50味平性药及50味对照非平性药作为研究对象;从各味药的有效成分入手,利用其所含有的特定的骨架及官能团信息直观地进行了数字化表征;采用模式识别中的支持向量机方法进行了分类研究,挑选最优特征时,总正确率最高可以达到73%,表明了中药的有效成分与其药性之间确实存在一定的相关关系。并且通过对识别率的比较发现,平性药药性的不显著本质上可能是由于其本身所含有效成分更高的分子多样性。本文对探索平性药药性的物质基础具有一定的指导作用。相似文献

2.

近红外光谱法最小二乘双胞胎支持向量机的应用研究

宋相中陈昌洲闵顺耕何雄奎李铮米津锐张录达《分析化学》2012,40(6):950-954

依据中药大黄的近红外光谱信息,采用最小二乘双胞胎支持向量机( LSTSVM)算法,通过MATLAB软件编程,建立参数可优化识别模型,实现了对中药大黄的真伪鉴别.将实验材料98个大黄样品随机划分为训练集和测试集,对于训练集60个样品采用留1/5法交叉验证优化模型参数,以所选最优化参数结合训练集样品的近红外光谱建立最优识别模型,对测试集的38个样品的真伪迸行识别,识别率可达97.4％.结果表明,LSTSVM算法是一种有效的识别方法,可依据中药大黄的近红外光谱对其真伪进行快速识别.同时,本研究将大黄样品6次随机划分为训练集和测试集,建模预测平均识别率为93.4％,表明采用LSTSVM算法建立识别模型具有较好的稳健性. 相似文献

3.

支持向量机和线性判别分析用于禽流感病毒编码蛋白识别

梁桂兆陈泽聪杨善彬梅虎周原舒茂杨力杨胜喜郑小林陈国华周鹏田菲菲廖春阳吴世容李根容李德静何留甘孟瑜高剑坤陈国平王贵学龙莎景举华曾晖张巧霞张梦军杨娟仝建波王娇娜刘永红李波仇亮加蔡绍皙赵娜杨艳苏霞利宋健陈美霞陈刚张雪姣孙家英李经纬邓婕彭传友李志许罗南廖立敏吴玉乾朱万平苏勤亮卢大军李军黄振虎周萍李志良《中国科学B辑》2007,37(6)

以支持向量机(SVM)和线性判别分析(LDA)对200条禽流感病毒、100条B型流感和100条C型流感病毒蛋白共400条为训练集样本,从表征序列的200个整体与局部变量中以逐步(stepwise)方法选取24个变量作为LDA模型的输入建立线性识别模型,病毒蛋白总识别率达99.8%,留一法交互检验总识别率为99.4%.从原始200变量中经主成分分析得16个主成分作为SVM的输入,以径向基核函数(RBF)SVM建立非线性识别模型,病毒蛋白总识别率为99.8%,留一法交互检验总识别率为99.2%.以100条禽流感、50条B型流感和50条C型流感病毒编码蛋白质共200条为测试集样本,得LDA模型,对其总识别正确率为95.4%,SVM模型对其总识别正确率为96.5%.识别结果表明,两个模型都可较好识别禽流感病毒蛋白,并且SVM对禽流感病毒蛋白的识别结果优于LDA. 相似文献

4.

支持向量机分类和回归用于肽的QSAR研究 总被引：4，自引：0，他引：4

周鹏曾晖李波周原李志良《化学通报》2006,69(5):342-346

使用支持向量机技术对两类肽化合物体系进行了分类和回归研究,并将其系统地与K最邻近法、多元线性回归、偏最小二乘、人工神经网络进行了比较。结果表明,对于小样本、非线性问题,支持向量机具有较强的稳定性能及泛化能力,在大多数情况下能够得到优于传统方法的建模效果。对于分类问题,支持向量机对训练集和测试集都达到了100%的分类正确率;对于回归问题,支持向量机虽对训练集样本拟合效果略低于人工神经网络,但对外部测试集却表现出较强的预测能力。相似文献

5.

基于随机森林与Chemistry Development Kit描述符的P-gp底物识别

马广立赵筱萍程翼宇《高等学校化学学报》2007,28(10):1885-1888

应用随机森林方法、开放源代码软件-CDK(Chemistry Development Kit)描述符与170个化合物的训练数据集[其中96个为磷糖蛋白(P-gp)底物], 建立了P-gp底物的识别模型. 研究了CDK描述符与P-gp底物识别的关系, 结果表明, 原子极化性和电荷偏面积等分子属性对P-gp底物识别起到重要作用. 该模型对训练集的预测正确率为99.42%; 对外部测试集(42个化合物, 其中24个为P-gp底物)的预测结果为P-gp底物、非底物及总测试集的识别正确率分别为87.50%, 83.33%和85.71%. 212个化合物数据集上的Leave-One-Out交叉验证识别正确率为77.4%. 相似文献

6.

机器学习方法用于二氢叶酸还原酶抑制剂的活性预测

陈晓梅饶含兵黄文丽李泽荣《高等学校化学学报》2007,28(11):2171-2178

分别采用支持向量学习机、人工神经网络、调节性逻辑回归和K-最临近等机器学习方法对761个二氢叶酸还原酶抑制剂建立了其活性分类预测模型. 采用组成描述符和拓扑描述符表征抑制剂的分子结构及物理化学性质, 使用Kennard-Stone方法进行训练集的设计, 并用Metropolis Monte Carlo模拟退火方法作变量选择. 结果表明, 支持向量学习机优于其它机器学习方法, 所得到的最优模型具有较好的预测结果, 其预测正确率为91.62%. 说明通过合适的训练集设计及变量选择, 支持向量学习机方法可以很好地用于二氢叶酸还原酶抑制剂的活性分类预测. 相似文献

7.

主成分分析-支持向量机用于肝病分类模型

张云佳方亚平黄田海张婧谭福元孙李娜李梦龙《化学研究与应用》2008,20(2):113-116

将主成分分析(PCA)用于肝功能检测数据特征提取,然后用支持向量机(SVM)对乙肝、丙肝、肝硬化、正常人样本建立分类模型。采用高斯径向基函数(RBF)为核函数,调节核函数参数C及σ以建立最佳支持向量机模型。该模型对训练集的识别率为99.3%,对预测集的预测率为96.4%。结果表明:PCA-SVM法建立的肝病分类模型能较好的区分乙肝、丙肝、肝硬化及正常人,且分类效果优于传统支持向量机及人工神经网络(ANN)分类模型。相似文献

8.

支持矢量机和线性判别分析对细胞穿透肽的识别

陈国华夏之宁陆瑶《化学学报》2010,68(11):1137-1142

选取25条CPP和16条非CPP作为训练集样本, 以61条CPP和21条非CPP为预测集样本. 利用氨基酸的z-Scale对肽链进行编码, 分别使用原始72个自交叉协方差变量和它们的主成分矢量进行线性判别(LDA)和支持矢量机(SVM)分类研究. 当采用LDA方法时, 对于训练集的预测以及它们的留一法交互检验, 均获得比较优越的结果, 但对预测集的预测总的识别率的最优结果仅为57.3%. 分别利用主成分和原始变量集作为SVM的输入建立的非线性识别模型, 对训练集的总识别率分别为85.4%和100%, 留一法交互检验的总识别率分别为80.5%和75.6%, 对预测集的最优总识别正确率为74.4%. 识别结果表明SVM能够比较好的提取原始变量间的细微模式变化, 对CPP总的识别结果优于LDA. 相似文献

9.

基于自组织映射神经网络的中药注射剂质量快速鉴别方法 总被引：3，自引：0，他引：3

刘雪松施朝晟程翼宇瞿海斌《分析化学》2007,35(10):1483-1486

将近红外光谱分析技术与人工神经网络相结合,研究提出一种基于自组织映射神经网络的近红外光谱神经元分类模型,用于对中药注射剂产品的近红外光谱进行计算分析,可实现对注射剂质量的快速鉴别。以3个不同厂家生产的参麦注射剂为研究对象,考察本方法的分类能力,其分类正确率达到96.4%,优于参与比较的判别式偏最小二乘法(90.5%)、反向传播神经网络(88.1%)和支持向量机(90.5%)。相似文献

10.

支持向量机结台主成分分析辅助激光诱导击穿光谱技术识别鲜肉品种

朱毅宁杨平杨新艳李嘉铭郝中骇李秋实郭连波李祥友曾晓雁《分析化学》2017,45(3)

为提高激光诱导击穿光谱技术(Laser-induced breakdown spectroscopy,LIBS)对鲜肉品种的识别率,采用支持向量机结合主成分分析算法辅助LIBS技术对鲜肉品种进行识别.对鲜肉切片用载玻片压平,采用LIBS技术对鲜肉组织(猪肉、牛肉和鸡肉)表面进行光谱数据的采集,每种鲜肉采集150幅光谱并进行随机排列,取前75幅光谱作为训练集建立模型,后75幅作为测试集测试建模结果.研究选取K、Ca、Na、Mg、Al、H、O等元素的49条归一化谱线数据进行主成分分析,并用所得数据建立支持向量机分类模型.结果表明,通过主成分分析降维,输入变量从49个优化减少到18个,模型建模速度从88.91 s降至55.52 s,提高了支持向量机的建模效率;并使预测集的平均识别率提高到89.11%.本研究为激光诱导击穿光谱技术在鲜肉品种快速分类领域提供了方法和数据参考. 相似文献

11.

基于最小二乘支持向量机的色谱指纹图谱预测银杏叶总抗氧化活性 总被引：1，自引：1，他引：0

姚卫峰胡育筑牟玲丽余伯阳《分析化学》2009,37(3)

在色谱图基线校正和色谱峰匹配基础上,提出以40个银杏叶提取物HPLC指纹图谱的色谱图轮廓作为输入,相应的提取物总抗氧化活性作为输出,建立最小二乘支持向量机回归模型,并对包含10个样本的测试集进行了预测.最小二乘支持向量机的测试集预测误差均方根(RMSEP)为0.0230,预测结果优于目前普遍使用的误差反向传播神经网络和偏最小二乘回归.与采用色谱峰面积为分析变量的模型预测结果比较表明:采用消除干扰后的色谱图全谱轮廓保留了样本的全部信息,预测结果更好相似文献

12.

Discrimination of Rhizoma Corydalis from two sources by near-infrared spectroscopy supported by the wavelet transform and least-squares support vector machine methods

Yanhua LaiYongnian Ni Serge Kokot 《Vibrational Spectroscopy》2011,56(2):154-160

Near-infrared spectroscopy (NIRS) was applied for direct and rapid collection of characteristic spectra from Rhizoma Corydalis, a common traditional Chinese medicine (TCM), with the aim of developing a method for the classification of such substances according to their geographical origin. The powdered form of the TCM was collected from two such different sources, and their NIR spectra were pretreated by the wavelet transform (WT) method. A training set of such Rhizoma Corydalis spectral objects was modeled with the use of the least-squares support vector machines (LS-SVM), radial basis function artificial neural networks (RBF-ANN), partial least-squares discriminant analysis (PLS-DA) and K-nearest neighbors (KNN) methods. All the four chemometrics models performed reasonably on the basis of spectral recognition and prediction criteria, and the LS-SVM method performed best with over 95% success on both criteria. Generally, there are no statistically significant differences in all these four methods. Thus, the NIR spectroscopic method supported by all the four chemometrics models, especially the LS-SVM, are recommended for application to classify TCM, Rhizoma Corydalis, samples according to their geographical origin. 相似文献

13.

Prediction of T-cell epitopes using biosupport vector machines

Yang ZR Johnson FC 《Journal of chemical information and modeling》2005,45(5):1424-1428

The immune system is concerned with the recognition and disposal of foreign or "non self" molecules or cells that enter the body of an immunologically competent individual. The generation of an immune response depends on the interaction of components, namely, the immunogen (nonself or foreign cell or molecule), antibody producing humoral immune system, and sensitized lymphocyte producing cellular immune system. An immunogen possesses surface structures referred to as epitopes; the precise pattern of each epitope enables an individual's immune system to recognize cells or molecules as self or immunogens. During the recognition process, the specific cells known as macrophages identify the epitope structures on the immunogen and save them in the form of short peptides 10-18 amino-acids-long known as immune dominant peptides (IDPs). IDPs are then bound with surface proteins on macrophages known as MHC protein complexes. The macrophages then present this IDP-MHC complex to a T cell that possesses a specific receptor that is specific for the foreign epitope on the IDP bound to MHC complex. This initiates an immune system cascade that results in the disposal of the immunogen. The study and accurate prediction of T-cell epitopes is, thus, very important for designing vaccines against pathogenic diseases. The present study applied the newly developed biosupport vector machine to the T-cell epitope data. This new algorithm introduces a biobasis function into the conventional support vector machines so that the nonnumerical attributes (amino acids) in protein sequences can be recognized without a feature extraction process, which often fails to properly code the biological content in protein sequences. The prediction accuracy of a 10-fold cross validation is 90.31%, compared with 87.86% using support vector machines reported as the best compared with other algorithms in an earlier study. 相似文献

14.

Prediction of the isoelectric point of an amino acid based on GA-PLS and SVMs 总被引：1，自引：0，他引：1

Liu HX Zhang RS Yao XJ Liu MC Hu ZD Fan BT 《Journal of chemical information and computer sciences》2004,44(1):161-167

相似文献

15.

Modeling and predicting the solute polarity parameter in reversed‐phase liquid chromatography using quantitative structure–property relationship approaches

《Journal of separation science》2017,40(23):4495-4502

相似文献

16.

灰色系统理论在中药色谱指纹图谱模式识别中的应用研究 总被引：2，自引：0，他引：2

魏航林励张元王莲婧陈沁群《色谱》2013,31(2):127-132

建立了基于灰色系统理论的中药色谱指纹图谱模式识别模型。运用基于范数与信息熵赋权法的灰色关联分析,求出各待比较图谱特征变量数据序列与理想图谱特征变量数据序列之间的灰色关联度,并依据模糊匹配中的“最大匹配度”原则进行判断,从而达到品种识别和质量评价的目的。该模型在56批次不同品种化橘红药材样品的高效液相色谱分析中取得较满意的结果: 熵权与范数的灰色关联分析均能准确识别出毛橘红与光橘红两个品种,克服了传统相似度或灰色关联在化橘红色谱指纹图谱分析中的误判问题;对药材中化学成分的种类与含量十分接近的毛橘红不同栽培品种的识别率超过92.85%。此外,该模型计算量较少,整个模式识别过程通过计算机编程实现,操作简单。实验结果显示,灰色系统理论在中药色谱指纹图谱模式识别中有良好的适应性。相似文献

17.

支持向量机与KStar模型预测细胞色素P450酶催化的氧脱烃反应

王丹张燕玲乔延江《物理化学学报》2011,27(2):343-351

分别以支持向量机(SVM)和KStar方法为基础, 构建了代谢产物的分子形状判别和代谢反应位点判别的嵌套预测模型. 分子形状判别模型是以272个分子为研究对象, 计算了包括分子拓扑、二维自相关、几何结构等在内的1280个分子描述符, 考查了支持向量机、决策树、贝叶斯网络、k最近邻这四种机器学习方法建立分类预测模型的准确性. 结果表明, 支持向量机优于其他方法, 此模型可用于预测分子能否被细胞色素P450酶催化发生氧脱烃反应. 代谢反应位点判别模型以538个氧脱烃反应代谢位点为研究对象, 计算了表征原子能量、价态、电荷等26个量子化学特征, 比较了决策树、贝叶斯网络、KStar、人工神经网络建模的准确率. 结果显示, KStar模型的准确率、敏感性、专一性均在90%以上, 对分子形状判别模型筛选出的分子, 此模型能较好地判断出哪个C―O键发生断裂. 本文以15个代谢反应明确的中药分子为验证集, 验证模型准确性, 研究结果表明基于SVM和KStar的嵌套预测模型具有一定的准确性, 有助于开展中药分子氧脱烃代谢产物的预测研究. 相似文献

18.

Structure-activity relationship study of oxindole-based inhibitors of cyclin-dependent kinases based on least-squares support vector machines 总被引：1，自引：0，他引：1

Li J Liu H Yao X Liu M Hu Z Fan B 《Analytica chimica acta》2007,581(2):333-342

相似文献

19.

Characterization of Adulterated Milk by Two-Dimensional Infrared Correlation Spectroscopy

《Analytical letters》2012,45(15):2560-2569

A new approach for discrimination of adulterated milk is reported using two-dimensional infrared (IR) correlation spectroscopy by multiway principal component analysis (MPCA) and least squares support vector machines (LS–SVM). First, the synchronous two-dimensional spectra of pure and adulterated milk were calculated. Then, MPCA was used to reduce the dimensions, extract features of two-dimensional correlation data set, and distinguish adulterated milk and pure milk. Finally, a LS-SVM model was developed using the scores of the first thirteen principal components from synchronous two-dimensional correlation spectra computed by MPCA as the input variables. The ratios of correct classification were 100% and 96.3% for calibration set and prediction set, respectively. The area under the receiver operating characteristic curves (ROC) of 0.991 for prediction set was obtained by LS–SVM. The results indicate that two-dimensional correlation infrared spectra combined with MPCA–LS–SVM may be a rapid screening technique for discrimination of adulterated milk with good accuracy. 相似文献

20.

穿山甲色谱指纹谱的建立及其在基源鉴别和质量等级区分方面的应用

乔亚丽刘喆沈爱金郭志谋刘艳芳陈相银徐青梁鑫淼《色谱》2020,38(12):1440-1448

中药穿山甲为鳞鲤科动物穿山甲的鳞甲,常用于治疗乳汁不通、痈肿疮毒、风湿痹痛等症,饮片来源上经常存在基源不清、等级不明的问题。针对以上问题,目前已发展出了多种分析方法,包括薄层色谱、质谱和DNA检测,但由于特异性低、设备成本高、步骤繁琐等不足,以上方法均不适合作为穿山甲质量监测的常规手段,而色谱指纹谱技术恰好可以弥补以上不足。该文旨在建立穿山甲的色谱指纹谱,并探讨其在等级及基源鉴别方面的可行性。穿山甲粉末经1 mol/L HCl加热水解得供试液,色谱柱采用Waters Symmetry 300 C18,以0.1%(v/v)三氟乙酸/水、0.1%(v/v)三氟乙酸/乙腈为流动相,280 nm为检测波长,采用梯度洗脱获得穿山甲指纹谱。经考察,该方法的精密度、日内日间重复性及样品稳定性均表现良好(RSD<5%)。以12批中华穿山甲一等品的平均指纹谱为对照指纹谱,同时确认17个共有峰,继而以共有峰绝对峰面积为原始数据,计算样品指纹谱与对照指纹谱的相似度。结果表明,中华穿山甲与其他动物来源穿山甲的相似度不高于0.776,体现了相似度评价在基源鉴别上的有效性;但不同等级穿山甲之间交叉严重,表明相似度评价在等级鉴别上的局限性。以24批不同等级中华穿山甲为分析对象建立判别分析模型,经十折交叉验证,模型无偏差正确率为95.83%,说明该模型在等级区分上可行性很高。该文通过建立穿山甲的色谱指纹谱,并结合不同数据处理方法验证了其在基源鉴别和等级区分方面的可行性,为保证穿山甲临床用药的科学性、准确性提供新的思路。相似文献