首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于多特征融合的细胞特异性lncRNA的亚细胞定位预测
引用本文:杨佳宏,陈颖丽,盖智敏,刘姝含.基于多特征融合的细胞特异性lncRNA的亚细胞定位预测[J].内蒙古大学学报(自然科学版),2024(2):173-182.
作者姓名:杨佳宏  陈颖丽  盖智敏  刘姝含
作者单位:内蒙古大学物理科学与技术学院
基金项目:国家自然科学基金资助项目(62361047,32160216);
摘    要:长链非编码RNA(long non-coding RNA,lncRNA)在细胞生物学过程和疾病发展中扮演着关键性角色。由于lncRNA的亚细胞定位和其生物学功能密切相关,因此确定lncRNA的亚细胞定位具有重要意义。目前已有一些基于机器学习的方法来识别lncRNA的亚细胞位置,但在识别人类lncRNA的细胞特异性定位方面的相关工作仍然有限。该模型对人类细胞系lncRNA亚细胞定位问题进行了研究,提取了k-mer、CKSNAP、SRS和TSS特征信息,并对各类特征信息进行了融合,基于XGBoost和LightGBM结合的算法来预测人类细胞系lncRNA的亚细胞位置,并通过10倍交叉检验对模型进行了评估。结果表明,该模型预测人类细胞系lncRNA亚细胞定位的方法与现有的预测方法相比,预测成功率均有一定改进,其基准数据集的AUROC值最高达到92.26%。

关 键 词:细胞系特异性  长链非编码RNA  二级结构  特征融合  梯度提升决策树
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号