牦牛测序数据缺失值填充的方法比较 |
| |
引用本文: | 秦婕,王嘉博,益西康珠,钟金城.牦牛测序数据缺失值填充的方法比较[J].西南民族大学学报(自然科学版),2022(3):245-249. |
| |
作者姓名: | 秦婕 王嘉博 益西康珠 钟金城 |
| |
作者单位: | 1. 青藏高原动物遗传资源保护与利用教育部重点实验室;2. 青藏高原动物遗传资源保护与利用四川省重点实验室 |
| |
基金项目: | 国家肉牛牦牛产业技术体系项目(CARS-37);;四川省科技项目(2021YJ0269,2021YJ0266);;中央高校基本科研业务费专项基金资助(2021NYYXS11); |
| |
摘 要: | 快速准确的基因组分型技术已经在动植物遗传分析、人类遗传疾病治疗预测中被广泛使用,然而高通量深度测序数据的成本高,且多种测序数据进行联合分析时往往共有的基因位点会非常少,基因组测序数据的基因型填充技术可以用来解决这两种问题.牦牛是青藏高原特有大型家畜,其独特的遗传结构、群体构成以及基因组复杂度使牦牛测序数据更不容易被准确的填充.为了解决牦牛测序数据含有较多缺失值的问题,用编写的StochasticImpute函数、R语言中的impute.knn算法和BEAGLE软件三种方法,探讨不同的缺失率条件下的填充匹配率、相关性和填充耗时.结果表明,在测序数据较少的情况下,BEAGLE软件是三种填充方法中填充准确率最高的,然而StochasticImpute函数和impute.knn算法填充耗时较短.这些结果表明,利用基因型填充的方法可以填充数据较少并且含有较多缺失值的牦牛测序数据.
|
关 键 词: | 牦牛 基因型填充 填充匹配率 相关性 填充耗时 |
|
| 点击此处可从《西南民族大学学报(自然科学版)》浏览原始摘要信息 |
| 点击此处可从《西南民族大学学报(自然科学版)》下载免费的PDF全文 |