首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
选取家鼠基因组中核糖核蛋白基因序列作为研究对象,采用Smith-Waterman局域比对法研究了内含子序列之间的相互匹配特征。结果表明,大多数第一内含子的长度分布在98 bp左右,第一内含子GC含量大多分布在43%~45%之间。第一内含子与其他相应内含子最佳匹配片段的长度多集中在27 bp左右,其GC含量约为58%,且最佳匹配片段的匹配率达到75%以上。进一步分析发现,不同GC含量的最佳匹配片段在第一内含子中的相对位置呈现出不同的分布规律。  相似文献   

2.
内含子序列通过与相应mRNA序列的匹配参与基因表达调控。采用Smith-Waterman局部比对方法,以拟南芥全基因组基因序列为基础,获得了内含子序列与其对应的外显子连接序列的最佳匹配片段。为了揭示两者之间的序列匹配特征,给出匹配频率在外显子序列上的分布。研究发现,匹配频率分布在外显子的边界存在显著差异,长内含子序列和第一个内含子序列对外显子连接序列的分布偏好明显区别于其他内含子序列。对于长片段、低GC含量以及高配对率的最佳匹配片段在外显子连接序列上游EJC(exon-exon junction complex)结合区域分布有明显的最小值。结果显示内含子序列和编码序列存在共同进化关系。  相似文献   

3.
剪切后的内含子对基因的表达调控过程仍发挥着重要的作用,发现内含子通过与相应mRNA的相互作用来实现这些功能的.用改进后的Smith-Waterman算法进行局域比对,对线虫、果蝇、小鼠和人类的线粒体上核糖核蛋白基因的内含子与相应编码序列做匹配性比对分析,发现内含子的中部序列与编码序列存在较强的相互作用,三类内含子上的匹配频率分布显示了各自的特征.在编码序列上有多个最佳匹配区域和禁配区域,推测这些禁配区域可能是蛋白质复合体的结合区域.最佳匹配片段的GC含量分布范围较广,覆盖了其它三类序列分布范围.高等真核生物最佳匹配片段的平均长度比低等真核生物要长一些.结论表明最佳匹配片段的序列特征符合RNA-RNA相互作用的一般规律,内含子应该是一类调控基因表达的功能片段.  相似文献   

4.
根据外显子在密码子三个位点上的分布不均匀性 ,引入非均匀指标 H I,来研究线虫基因外显子与内含子的序列特征 .通过推广 H I参数 ,定义干涉指标 R,对外显子和内含子的多个片段的特征进行研究 ,得到了 R值分布以及与外显子和内含子片段的关系 .  相似文献   

5.
模式生物的外显子、内含子和基因间序列的识别   总被引:1,自引:0,他引:1  
基于核酸序列在剪切位点上保守性、组分的不同和编码序列阅读框架的3周期性,模式生物全基因组序列分为外显子、内含子和基因间序列三类.三个标准离散源分别由64个三联体在整条序列上的概率和4个碱基序列首尾(剪切位点附近)共30个位点上的概率共同构成.某条序列的类型就由该序列的离散量同相应区间上三个标准离散量的离散增量确定.结果表明:具有184个信号参数的离散量预测比只有64个三联体参数的结果要高出5%,总体预测成功率:线虫为87.37%,拟南芥为91.08%,果蝇为92.28%,原核生物大肠杆菌的二种序列预测率为92.88%,酵母菌为94.88%.  相似文献   

6.
UTR区中的内含子对基因的表达调控过程发挥着重要的作用,它通过与相应mRNA的序列匹配方式发生相互作用并实现对基因的表达调控。采用Smith-Waterman算法进行局域比对,获得UTR区中的内含子与相应mRNA序列之间的最佳匹配片段。分析6个物种mRNA序列上最佳匹配片段的序列特征及匹配频率的分布规律,并分析这种相互作用分布的普适性。结果发现:最佳匹配片段的配对率和平均长度分布与siRNA和miRNA的结合特征一致; UTR区中的内含子与相应mRNA序列上的UTR序列存在较强的相互作用,低GC片段倾向与3′UTR区作用,而高GC片段倾向结合到5′UTR区。结论表明最佳匹配片段的序列特征符合RNA-RNA相互作用的一般规律,内含子序列应该是一类调控基因表达的功能片段。UTR区中的内含子与mRNA序列是协同进化的,通过相互作用完成应有的功能。  相似文献   

7.
以拟南芥、葡萄和水稻3种植物的基因序列为研究样本,采用Smith-Waterman算法进行局域比对后,获得mRNA序列和相应内含子序列之间的最佳匹配片段.然后分析了mRNA序列上最佳匹配片段序列特征及匹配频率的分布规律,同时分析了这种相互作用分布的保守性.研究发现,UTR区与内含子存在较强的相互作用,低GC片段倾向与3...  相似文献   

8.
选取线粒体核糖体蛋白基因序列为样本,采用Smith-Waterman方法,通过局部比对得到了每个物种基因的第一内含子与其它内含子序列之间的最佳匹配片段.以此为基础,分析了第一内含子序列特征及其与同基因中其它内含子的相互匹配特性.结果显示:大多数线粒体核糖体蛋白基因的第一内含子长度小于200 bp,且在40 bp处出现峰...  相似文献   

9.
将拟南芥(A.tha liana)和线虫(C.eleg ans)的基因序列中的外显子按第一外显子,中间外显子和最后外显子划分成三类.分别将外显子/内含子剪切位点、翻译起始和终止位点附近的三联体的3个位点作为3条子链,以各条子链的不同碱基个数作为离散源参数,共12个离散源参数,计算各类外显子离散量.用离散增量实现了对三种序列类型的预测,预测成功率都达到80%以上;并且统计了剪切位点附近的碱基相对频数,结果比较了由于三联体所取位置及个数不同而造成的对预测结果的差异,说明了剪切位点附近碱基的保守性.  相似文献   

10.
把基因组中的内含子、外显子和基因间序列分为三类序列,从这些序列中取64种三核苷的重复出现次数作为离散源的状态参数,计算三类序列的标准离散量,比较待测序列的离散量与三个标准离散量之间的离散增量值,由离散增量的最小值决定待测序列属于哪一类.本文用离散增量方法对线虫和酵母序列进行预测,结果表明,对酵母内含子预测的敏感性为81.5%,对外显子预测的敏感性为88.5%、特异性为99.6%,对基因间序列预测的敏感性为65.4%、特异性为87.5%;若以在相同长度区间的序列为标准离散源,预测相应长度区间的序列,对线虫内含子的预测的敏感性为82.2%、特异性为94.2%,对外显子预测的敏感性为91.1%、特异性为97.5%,对基因间序列预测的敏感性为78.8%。  相似文献   

11.
对果蝇胚胎低表达和高表达水平基因内含子的序列结构进行分析,发现2种表达水平的基因内含子序列特征有明显差异.高表达基因的内含子一般比低表达基因的长,其中高表达基因第1内含子的平均长度是低表达基因的2.62倍,第2内含子的平均长度是低表达基因的1.79倍.两类基因第1内含子中的CpG岛含量最高,并且高表达基因内含子中CpG岛含量要高于低表达基因.此外,与低表达基因相比,TATA box、CAAT box和GC box在高表达基因内含子中出现的频数明显要高些,尤其是在第1内含子中.作者还提取出果蝇胚胎2种表达水平基因第1内含子中高频出现的6-mer简单重复序列,发现一些重复序列与实验得到的转录因子结合位点相符合.这些结果提示内含子特别是第1内含子有可能调控果蝇胚胎基因的转录从而影响基因的表达水平.  相似文献   

12.
内含子序列“三碱基组”的信息分析   总被引:2,自引:0,他引:2  
在对编码序列的碱基分布作大量统计分析的基础上,对内含子序列中G、C的分布作了统计分析.发现内含子在“三碱基组”的意义下,第一位上(G+C)含量占优势.如果将同一基因的外显子三联密码和内含子“三碱基组”做比较,发现在内含子中出现而外显子中没有的那些三碱基组,它们大多属于Lió所列出的“非偏爱”密码  相似文献   

13.
14.
利用隐马尔可夫模型训练中不同结构的DNA序列的L值分布范围不同的特点,对传统多类投票模型进行改进,提出一种优于传统算法的快速训练算法,该算法只需训练出一类隐马尔可夫模型参数.对DNA内含子和外显子序列进行识别,平均识别率达到了90.8%.与支持向量机相比,隐马尔可夫模型在解决多分类问题方面具有优势,不但计算时间少,而且识别率高.  相似文献   

15.
针对基因选择性剪接的多序列比对算法研究   总被引:3,自引:0,他引:3  
为对真核基因的选择性剪接形式进行准确、快速、有效的研究 ,提出了一种启发式多序列比对算法。该算法借助引导树启发序列之间的两两段对段比对 ,通过建立序列相似性估计模型 ,给出了一种由序列间相同词数估计序列相似程度的方法。利用这种方法构造引导树 ,大大缩短了其构造时间。通过采用序列间的段对段比对 ,克服了间隙罚分问题 ,更准确地反映了真核基因的选择性剪接形式。引导树构造方法的改进和快速局部比对算法的采用 ,使得算法运行速度大大高于一般算法。该算法为真核基因的选择性剪接研究提供了一种新的有效途径  相似文献   

16.
从猪肝脏提取基因组作为模板,分别扩增了Klf4、Klf5和Egr2的第3、第2和第1内含子,长度分别为916、1027和1342bp,并通过其两端连接的部分外显子序列与Genbank序列比对加以确认,并和人相应基因内含子作长度和序列同源性比较。结果表明,由内含子比对得出的这些基因在人和猪间的保守程度与这些基因在氨基酸水平上比对得出的保守程度相一致。  相似文献   

17.
研究含外显子8的prosaposin蛋白亚型(PsapE8)与同源异型框蛋白Rhox5蛋白间的相互作用. 重叠延伸PCR法扩增PsapE8的cDNA序列,将其按照通读框方式分别克隆至pGBKT7和pGADT7酵母双杂交载体中构建pGBKT7-PsapE8和 pGADT7-PsapE8重组质粒. 酵母双杂交实验检测PsapE8与Rhox5蛋白在酵母体内的结合;体外转录翻译S35标记的PsapE8蛋白,GST pull-down实验检测PsapE8与Rhox5蛋白在体外的结合情况. 成功地构建了pGBKT7-PsapE8和 pGADT7-PsapE8重组质粒,酵母双杂交实验表明PsapE8蛋白在酵母体内可以结合Rhox5蛋白;GST pull-down实验再次验证了两者在体外的结合;表明含有外显子8的prosaposin蛋白亚型PsapE8可以与Rhox5蛋白相结合.  相似文献   

18.
牦牛kappa-酪蛋白基因第4外显子的克隆测序及多态性研究   总被引:13,自引:0,他引:13  
依据普通牛的kappa-酪蛋白基因序列设计引物进行PCR扩增,测定了牦牛kappa-酪蛋白基因第4外显子全序列及部分第4内含子序列,用HindⅢ和PstⅠ切割PCR产物发现,在牦牛群体中具有和普通牛相同的单倍体型.进一步对60个牦牛个体进行群体分析后发现,牦牛群体中的基因频率和基因型频率与普通牛的群体有着很大的差异.  相似文献   

19.
基于Brogaard等2012年给出的酵母全基因组单碱基精度的核小体定位图谱,从中提取出酵母基因组全部的核小体中心序列和连接序列.计算k-mer(k取4、5、6和8)在两类序列中的相对频率,分析两类序列中k-mer的使用差异.按照k-mer相对使用频率对数增序的方式排列模体,得到两类序列k-mer相对频率对数比的分布.结果显示模体长度越长两类序列的使用差异越明显,当k>7以后差异分布逐渐稳定.按照中心序列8-mer相对频率增序的方式排列模体,发现在相对频率小于0.5的区域,两类序列的8-mer使用差异显著.分别计算了7个抽样点附近中心序列偏好的8-mer和连接序列偏好的8-mer的G+C含量和二核苷含量.结果显示两类序列模体的G+C含量随着相对频率的增大而逐步减小,中心序列更加偏好GC和CG二核苷,而连接序列更加偏好GG二核苷和CC二核苷.这些主要的差异特征与实验分析结果一致.  相似文献   

20.
 为了了解鲤IGF2b基因与鲤生长性状之间的关系,以建鲤为试验材料,克隆了IGF2b基因内含子,分析其基因组序列的特点,构建了IGF2基因的慢病毒载体,同时观察其在293T细胞中的表达活性。结果获得鲤IGF2b 5 173 bp长度的基因组DNA序列(HM755899),共有3个内含子,4个外显子;在3′非翻译区存在2个CpG岛,在5′端非翻译区存在(T)n重复序列;除此之外,成功构建了慢病毒载体质粒Lenti-IGF2b-IRES-EGFP,转染293T细胞后,产生的重组慢病毒颗粒出现高表达绿色荧光,荧光定量PCR检测发现IGF2b基因在293T细胞中高表达。这些结果将为研究IGF2b基因在多态性、表达方面与鲤生长性状之间的关联奠定基础。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号