首页 | 本学科首页   官方微博 | 高级检索  
     检索      

分类先验特征选择算法在代谢组学数据变量筛选中的应用
引用本文:王娅妮,杜丽晶,郭拓,肖雪.分类先验特征选择算法在代谢组学数据变量筛选中的应用[J].分析测试学报,2023(4):423-431.
作者姓名:王娅妮  杜丽晶  郭拓  肖雪
作者单位:1. 陕西科技大学 电子信息与人工智能学院,陕西 西安 710021; 2. 上海交通大学 药学院,上海 200240; 3. 广东药科大学 中医药研究院,广东 广州 510006
基金项目:陕西省教育厅科学研究计划项目(20JK0532)
摘    要:该文提出了基于无监督判别投影特征选择的支持向量机方法(UDPFS-SVM)用于标志物筛选。UDPFS-SVM首先通过无监督判别投影算法(UDPFS)引入分类先验信息、添加正则化与惩罚函数等约束自适应地获得具有稀疏性的判别投影矩阵,然后根据获得的矩阵求得相应低维代谢矩阵,最后建立支持向量机(SVM)分类模型寻找生物标志物。所提出的方法能够同时进行模糊学习与稀疏学习,并可合理利用变量之间的依赖关系。通过UDPFS-SVM与偏最小二乘判别分析(PLS-DA)方法对高脂血症大鼠血浆代谢组学数据进行变量筛选,并采用方差分析、ROC曲线、线性判别分析(LDA)对筛选得到的生物标志物进行评价。结果表明,两种方法均发现8个生物标志物。方差分析显示UDPFS-SVM方法获得的生物标志物均具有显著性差异,且显著性差异值均大于PLS-DA;ROC结果显示UDPFS-SVM结果为1.00,比PLS-DA结果高0.05;LDA显示UDPFS-SVM获得的生物标志物在高脂血症样本中可以更好地消除组内代谢差异,区分组间代谢差异,说明UDPFS-SVM方法在高脂血症生物标志物发现上优于PLS-DA,为生物标志物的发现提供了一种新思路。

关 键 词:变量筛选    无监督判别投影    分类先验信息    非线性    高维小样本    代谢组学

Application of Classification Prior Feature Selection Algorithm in Screening Metabonomic Data Variables of Hyperlipidemia
WANG Ya-ni,DU Li-jing,GUO Tuo,XIAO Xue.Application of Classification Prior Feature Selection Algorithm in Screening Metabonomic Data Variables of Hyperlipidemia[J].Journal of Instrumental Analysis,2023(4):423-431.
Authors:WANG Ya-ni  DU Li-jing  GUO Tuo  XIAO Xue
Abstract:
Keywords:variable screening  unsupervised discriminative projection  classified prior information  non-linear  high-dimensional and small samples  metabonomics
点击此处可从《分析测试学报》浏览原始摘要信息
点击此处可从《分析测试学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号