基于多信息融合的长链非编码RNA的亚细胞定位预测 |
| |
引用本文: | 尤晓庆,郭东华,陈颖丽.基于多信息融合的长链非编码RNA的亚细胞定位预测[J].内蒙古大学学报(自然科学版),2020,51(4):402-410. |
| |
作者姓名: | 尤晓庆 郭东华 陈颖丽 |
| |
作者单位: | 内蒙古大学物理科学与技术学院,呼和浩特010021;内蒙古大学物理科学与技术学院,呼和浩特010021;内蒙古大学物理科学与技术学院,呼和浩特010021 |
| |
基金项目: | 国家自然科学基金;国家自然科学基金 |
| |
摘 要: | 长链非编码RNA(lncRNA)的亚细胞位置信息对于了解其复杂的生物学功能和生物学过程具有重要的意义。建立了一个lncRNA的亚细胞定位数据集,包括细胞核、细胞质基质、核糖体和外泌体四个位置,提取了lncRNA的多种特征信息,并对各类特征进行了特征融合。在利用SMOTE(Synthetic Minority Oversampling Technique)方法对数据集进行平衡优化的基础上,采用支持向量机(SVM)算法对lncRNA的亚细胞定位进行分类预测。Jackknife检验结果显示总体预测成功率可达98.54%,表明所提取的特征信息对于lncRNA的亚细胞定位预测有很好的效果,可以为了解lncRNA的生物学功能提供帮助。
|
关 键 词: | 长链非编码RNA 序列特征 亚细胞定位 SMOTE 特征融合 |
本文献已被 CNKI 万方数据 等数据库收录! |
|