基于多特征融合的细胞特异性lncRNA的亚细胞定位预测 |
| |
引用本文: | 杨佳宏,陈颖丽,盖智敏,刘姝含.基于多特征融合的细胞特异性lncRNA的亚细胞定位预测[J].内蒙古大学学报(自然科学版),2024(2):173-182. |
| |
作者姓名: | 杨佳宏 陈颖丽 盖智敏 刘姝含 |
| |
作者单位: | 内蒙古大学物理科学与技术学院 |
| |
基金项目: | 国家自然科学基金资助项目(62361047,32160216); |
| |
摘 要: | 长链非编码RNA(long non-coding RNA,lncRNA)在细胞生物学过程和疾病发展中扮演着关键性角色。由于lncRNA的亚细胞定位和其生物学功能密切相关,因此确定lncRNA的亚细胞定位具有重要意义。目前已有一些基于机器学习的方法来识别lncRNA的亚细胞位置,但在识别人类lncRNA的细胞特异性定位方面的相关工作仍然有限。该模型对人类细胞系lncRNA亚细胞定位问题进行了研究,提取了k-mer、CKSNAP、SRS和TSS特征信息,并对各类特征信息进行了融合,基于XGBoost和LightGBM结合的算法来预测人类细胞系lncRNA的亚细胞位置,并通过10倍交叉检验对模型进行了评估。结果表明,该模型预测人类细胞系lncRNA亚细胞定位的方法与现有的预测方法相比,预测成功率均有一定改进,其基准数据集的AUROC值最高达到92.26%。
|
关 键 词: | 细胞系特异性 长链非编码RNA 二级结构 特征融合 梯度提升决策树 |
|
|