首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
急性白血病可分为急性淋巴细胞白血病(ALL)和急性髓系白血病(AML)两大亚型,准确诊断是治疗急性白血病的前提和关键。本文基于急性白血病的基因芯片数据,结合两样本T检验、Wilconxon秩和检验、系统聚类法以及变量选择方法监督式分组套索法(supervised group lasso,SGLasso)筛选出对急性白血病分型(AML、ALL)有显著意义的基因,根据训练组数据建立关于急性白血病分型的逻辑回归模型,并对训练组和检验组中患者的病型作拟合和预测,验证该模型的预测精度。  相似文献   

2.
提出一种基于基因表达谱数据筛选差异表达基因的新方法;介绍了筛选差异表达基因常见方法-错误发现率方法(False Discovery Rate,FDR,),分析了多重假设检验p值性质,并根据p值性质提出了一种筛选差异表达基因新方法-单位γ度量法(Unit Measure-γ,UM-γ),建立了计算机模拟基因表达谱数据模型,制定了假阴性率、假阳性率、灵敏度、特异度以及总体错误率等作为考核指标,并使用基因表达谱模拟数据进行计算、比较;单位γ度量法估计非差异表达基因个数具有较高的稳定性和准确性;单位γ度量法既能够同时控制假阳性、假阴性以及总体错事件的发生,又能在一定程度上提高筛选结果的灵敏度和变异度;新提出的方法能有效、准确且稳定的对模拟数据差异表达基因进行筛选.  相似文献   

3.
为了探讨高维基因芯片基因表达谱数据筛选差异表达基因的方法,分析比较t检验法、秩和检验法、BON法、SIDAK法及ALSU法5种算法的差异表达基因筛选效率;采用模拟实验对t检验法、ALSU法等5种算法进行比较,并使用第一类、第二类错误率、总体错误率、筛选差异表达基因数及其均方根误差等5种指标进行评价;t检验法、秩和检验法计算结果过于灵敏,筛选差异表达基因个数较多,会促使筛选差异表达基因中假阴性事件的发生,BON法、SIDAK法筛选结果过于保守,筛选的差异表达基因个数较少,假阳性事件发生率较为显著,ALSU法能较稳定的抑制第一、二类错误率的发生,同时ALSU法筛选结果受系统扰动误差影响较笺LSU方法能够稳定的、高效的筛选差异表达基因,在使用高纬基因表达谱数据筛选差异表达基因时应首选ALSU法.  相似文献   

4.
基于神经网络MIV值分析的肿瘤基因信息提取   总被引:1,自引:0,他引:1  
运用统计学及数据挖掘相关知识,以结肠癌基因表达图谱为研究对象,综合运用GB指数、BP神经网络、小波变换等方法对问题给出求解的过程和结果.首先采用GB综合指数对无关基因进行筛选,选择两组备用基因的交集(114个)作为信息基因,降低基因维度.其次,用基因间的强相关性剔除冗余基因,利用BP神经网络对基因进行错判数计算,选取错判率最低、基因子集中基因数量最少的基因特征组,再利用平均影响值(MIV)方法进行基因筛选,最后进行错判数计算,最终确定含有12个基因的子集为最优基因组合.第三步,将每组基因表达值看做基因信号,运用小波转换法对基因数据进行去噪,去噪后特征基因减少为8个.  相似文献   

5.
对乳腺癌基因芯片试验结果进行数据分析,寻找在正常组织与癌组织中呈现差异表达的基因.运用微阵列芯片显著性分析(SAM)方法进行差异表达基因的筛选,并使用permutation算法计算错误发现率(FDR).一些呈现差异表达的基因被筛选出来,其中一部分基因已被数篇文献报道过,认为它与乳腺癌发病相关.SAM方法比较适用于对基因芯片实验的结果进行相关基因的初步筛选,筛选出的基因可用于为进一步的研究提供候选基因.  相似文献   

6.
本文建立基于动态变异和随机转录的人类生命量化模型,对个人生物分子间相互作用和基因通路信息进行定理研究.据此筛选出代谢综合症的4个生理指标:中心肥胖指数、血压强度、血糖含量和血脂浓度.用ClinicalTrials.gov的临床数据求解模型得到,当推荐代谢综合症指数大于0.066时,患者患有代谢综合症,因此认为该指数为代谢综合症的一项数据特征.另一方面,对可能引发代谢综合症的许多并发症的21个基因通路进行了筛选,得出了PTP1B等影响最大的5个基因通路,并认为他们是代谢综合症的关键基因通路.  相似文献   

7.
GLRT和LS_SVM应用于基因表达数据分类   总被引:1,自引:0,他引:1  
为快速、准确地对基因芯片表达数据进行分类,提出了一种新型的基因芯片表达数据分类模型.该模型首先使用广义似然比检验(GLRT)有效鉴别出表达有显著性差异的基因.然后,将这些表达有显著性差异的基因用于最小二乘支持向量机(LS_SVM)的训练,从而建立了基于GLRT+LS_SVM的基因芯片表达数据分类模型.该模型在处理数据量大、维数高、样本量小、非线性等特点的基因芯片数据时有很大优势,可以广泛用于处理基因芯片数据.  相似文献   

8.
基于贝叶斯统计方法的两总体基因表达数据分类   总被引:1,自引:0,他引:1  
在疾病的诊断过程中,对疾病的精确分类是提高诊断准确率和疾病治愈率至 关重要的一个环节,DNA芯片技术的出现使得我们从微观的层次获得与疾病分类及诊断 密切相关的基因功能信息.但是DNA芯片技术得到的基因的表达模式数据具有多变量小 样本特点,使得分类过程极不稳定,因此我们首先筛选出表达模式发生显著性变化的基因 作为特征基因集合以减少变量个数,然后再根据此特征基因集合建立分类器对样本进行分 类.本文运用似然比检验筛选出特征基因,然后基于贝叶斯方法建立了统计分类模型,并 应用马尔科夫链蒙特卡罗(MCMC)抽样方法计算样本归类后验概率.最后我们将此模型 应用到两组真实的DNA芯片数据上,并将样本成功分类.  相似文献   

9.
所建立的模型及所得的结论有利于利用数据库中已有的基因信息快速筛选出潜在的癌症相关基因,模型一和模型二以基因表达水平限值和差异显著性水平为分类要素,将基因分为两类.模型三利用逐步优化思想建立优化模型,确定出六组基因标签.模型四利用小波分析法去噪及相关性检验法,重新确定基因标签,包含8种特征基因,对癌症样本的检测率降低了,...  相似文献   

10.
基因表达是细胞内部过程的中心环节,其建模与分析一直是人们关注的焦点.转录水平上的两类代表性基因表达模型(即构成式表达模型和爆发式表达模型)已经被广泛研究,特别是m RNA的分布已经解析地给出,但对于同时考虑转录和翻译的完整基因表达模型,如何解析地导出m RNA和蛋白质的分布以及它们的联合分布的问题至今未得到解决.本文应用作者自己发展起来的二项矩方法解决了此数学问题,尤其是给出了基因产物分布及有关统计量的解析表示.此外,本文还讨论了基因表达噪声的可调性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号