scSimseq:非参数单细胞RNA测序数据模拟方法 |
| |
引用本文: | 林炳清,庄泽帆.scSimseq:非参数单细胞RNA测序数据模拟方法[J].应用概率统计,2023(6):813-831. |
| |
作者姓名: | 林炳清 庄泽帆 |
| |
作者单位: | 深圳大学数学与统计学院 |
| |
摘 要: | 随着新一代测序技术的广泛使用,单细胞RNA数据逐渐成为研究的主流对象.然而,直接从生物体上获取单细胞RNA数据往往需要付出不小的成本.如何简单快捷地获取这些数据便是一个重要的问题.为了满足对比实验的需要,单细胞RNA数据的模拟方法通常除了模拟数据的统计量和原始数据接近以外,还需要在模拟数据中能够保留原数据的基因和细胞样本.在这里我们介绍了一种基于数据的模拟方法,在保留原数据的基因和细胞样本的基础上,不但可以低成本地模拟单细胞RNA数据,同时保证模拟结果和原数据在大部分特征上相似.通过大量数值实验证明,本文介绍的方法在基因表达的离散程度、0表达比例、表达异常值等方面都优于其他模拟方法,而且和实际数据更加接近.
|
关 键 词: | 生物信息学 单细胞RNA数据 非参数方法 模拟数据 |
|
|