首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
高通量转录组测序的数据分析与基因发掘   总被引:3,自引:0,他引:3  
周华  张新  刘腾云  余发新 《江西科学》2012,30(5):607-611
高通量转录组测序(RNA-seq)是在转录组水平上进行深度测序的一项技术,为真核生物转录组学的研究开创了新平台,但同时测序所得到的海量数据的生物信息学分析成为科研工作者的一大挑战。对转录组测序技术进行了阐述,重点介绍了转录组测序后的数据分析,以及在真核生物尤其是非模式物种中的基因发掘方法。  相似文献   

2.
【目的】湿地松是南方地区优先推广的优质产脂树种。但湿地松分子遗传基础薄弱,基因组序列信息匮乏,影响了湿地松基因组学的深入研究。目前,湿地松分子研究所用的SSR标记主要来自其他近缘种或利用公共数据库中有限的基因序列资源开发的SSR标记,其多态性和通用性较差。为解决这一问题, 笔者根据湿地松转录组测序数据开发EST-SSR位点,并揭示其在转录组序列中的分布类型及特征,为湿地松分子标记辅助育种奠定基础。【方法】利用MISA软件对转录组序列进行SSRs查找和分布特征分析。查找标准参数设置为: 单核苷酸重复>10次,二核苷酸重复>6次,三、四、五、六核苷酸重复>5次。根据SSR位点两端的保守区域,利用Primer3.0设计并随机挑选120对SSR引物,通过琼脂糖电泳和毛细管电泳对来自美国和吉安的113份家系个体进行遗传多样性分析,确定引物多态性。【结果】79 574条unigenes序列中搜索到3 818个SSR位点,出现频率为4.80%,平均18.27 kb出现1个SSR位点,3 373个unigenes含有SSR位点,SSR发生频率(含SSR位点的序列数/搜索序列总数)为4.24%,其中2 980条序列含1个SSR位点,含1个以上SSR位点的序列有393条。在检测到的3 818个SSR标记中,单核苷酸分布最多,其次是二核苷酸和三核苷酸,SSR数量分别占总数的63.54%、19.15%和16.27%,而四、五、六核苷酸重复类型所占比例较小,分别为0.52%、0.13%和0.31%。SSR重复单元的重复次数分布在5~22次之间,除单核苷酸重复外的1 391个SSR中,重复5次的数量最多,为498个(35.80%);重复6次和7次的次之,分别为417个(29.98%)和198个(14.23%);重复10次以上的仅有38个(2.73%)。在检测到的731个二核苷酸重复SSR中,最常出现的重复单元为AT/AT,数量为491个(12.86%),AG/CT和AC/GT两种类型的重复单元出现的次数次之,分别为156(4.09%)和81个(2.12%)。在检测到的621个三核苷酸重复中,AAT/ATT是出现频率最高的单元,共139个(3.64%),其次是AAG/CTT,共122个(3.20%)。3 818个SSR中有24.59%的位置未知,其余的SSR则分布在非编码区域(untranslated region,UTR)或者编码区(coding sequence,CDS)上,分布数量表现为3'UTR>5'UTR>CDS。参试的120对SSR引物,有92对扩增成功(76.78%),其中24对呈现多态(20%)。24对引物(13个二核苷酸重复、7个三核苷酸重复和4个四核苷酸重复)共检测出81个等位基因,每个位点的等位基因数为2~9,平均为3.38个。多态性信息含量(polymorphism information content,PIC)为0.103~0.726,平均为0.349。【结论】通过对湿地松转录组数据的挖掘,共获得 3 818个SSR位点,主要重复单元为AT/AT和AAT/ATT,可扩增出多态性位点的引物重复单元以二、三核苷酸重复为主。基于湿地松转录组序列的SSR标记开发是可行的。  相似文献   

3.
利用MISA软件对黄姑鱼转录组测序数据进行分析,共检索到微卫星(simple sequence repeats,SSR)位点12 254个,其中单碱基、二碱基、三碱基重复分别约占42.70%、32.11%、23.44%,四碱基、五碱基、六碱基重复仅分别约占1.60%、0.09%、0.06%。随机选出80个二至六碱基重复来设计PCR引物,有38对引物通过扩增可获得目的条带。利用南海海区野生黄姑鱼样本对其中的18个具有多态性的SSR位点进行扩增效果验证和评价,结果显示:18个SSR的平均等位基因数为7.67,平均有效等位基因数为4.571,平均观测杂合度为0.3984,平均期望杂合度为0.7518,平均多态信息含量为0.6799,其中有15个位点表现出高多态性(多态信息含量0.5)。与传统方法相比较,利用转录组测序数据开发微卫星标记更加省时、高效。  相似文献   

4.
为了深入探究花粉基因表达的规律,应用单细胞技术对拟南芥花粉细胞进行了单细胞转录组测序.花粉单细胞RNA-seq结果表明,与叶片转录组相比,成熟花粉中大部分基因表达较低,可能与花粉转录沉默有关.花粉中富集果胶代谢、细胞骨架和钙信号转导等通路,与细胞壁形成和花粉管生长相关.花粉还富集组蛋白甲基化因子,说明花粉中存在表观遗传学调控.应用RT-PCR鉴定出6个花粉特异性表达且功能未知的基因,其中大多数为十字花科特有.总之,本研究精确定量了花粉细胞的基因表达谱,揭示出拟南芥花粉转录组的复杂性和独特性.  相似文献   

5.
以根状茎、茎、叶、花、果荚及种子6个部位为样品,利用PacBio技术对七叶一枝花进行了全长转录组测序,并对测序数据进行了生物信息学分析.研究共获得52537个平均长度为2607 bp的高质量isoforms,其中40725条isoforms得到注释.GO注释中,4596个isoforms分为生物学过程、细胞组成和分子功...  相似文献   

6.
分析云南松转录组中的SSR位点信息的分布及其序列特征,为SSR引物的开发做前期工作.从80000条转录组Unigene序列中,搜索到2455个SSR,出现频率为3.07%,分布的平均距离29 kb.SSR以三、二核苷酸占优势,分别占总数42.73%和27.25%,而以四核苷酸的较少,仅占总数的0.98%.重复片段长度12~25bp,其中近90%的集中在12~20bp,平均16.09bp.AT/AT与AGC/CTG和AAG/CTT为二、三核苷酸优势重复基元,分别占基元总数的16.66%、9.65%和8.39%.从2899对引物中随机挑选32对引物用于检测,24对成功扩增.云南松转录组SSR位点出现的频率较高,分布距离较近,基元类型丰富,重复次数较高,具有较高的多态性潜力.云南松转录组产生的Unigene是开发SSR的有效来源,获得的SSR引物可为云南松种质资源的遗传变异研究提供更多的标记.  相似文献   

7.
碧桃花瓣转录组微卫星特征分析   总被引:2,自引:0,他引:2  
为开发碧桃转录组微卫星信息,利用454高通量测序技术,对其花瓣转录组序列进行SSR位点发掘,结果发现含SSR的序列4 705条,共得到5 668个SSR,平均每3.49 kb出现1个SSR。微卫星序列主要以三碱基重复为主,约占总数的42.66%。笔者共发现516种碱基重复基元,所占比例最高的为(AG/CT)n(18.34%),其次是(AAG/CTT)n(12.42%)。微卫星多为重复长度小于20 bp的短序列,长度大于20 bp的微卫星仅占总数的12.13%。研究还发现碧桃花瓣微卫星的频率和长度呈显著负相关(P0.05),相关系数为-0.246。  相似文献   

8.
为探究维生素C调控秀丽隐杆线虫寿命通路相关基因,设置空白对照组(0 mg/mL维生素C组)、0.4 mg/mL维生素C组、0.8 mg/mL维生素C组以及1.6 mg/mL维生素C组,构建维生素C处理秀丽隐杆线虫模型,检测维生素C与秀丽隐杆线虫寿命关系。空白对照组和处理组利用Illumina HiSeq基因转录组测序。通过本位数据库(Gene Ontology, GO)和通路显著性富集分析数据库(Kyoto Encyclopedia of Genes and Genomes, KEGG)挖掘影响秀丽隐杆线虫寿命的差异表达基因。研究发现,0.8 mg/mL维生素C处理下,秀丽隐杆线虫寿命相较于其他浓度明显延长,lips-10基因表达明显上调且参与秀丽隐杆线虫寿命相关通路调节过程,表明维生素C能够影响秀丽隐杆线虫寿命,调控其相关衰老过程。  相似文献   

9.
糙苏为我国民间常用的传统草药,具有消肿、续筋接骨、祛风化痰、通络止痉、安胎等作用,三萜皂苷类化合物为其主要的生物活性成分.对糙苏组织转录组测序,挖掘其三萜皂苷生物合成途径相关基因,探究糙苏三萜皂苷化合物生物合成的分子基础.利用Trinity软件对测序结果获得的Unigenes数据进行过滤组装,并结合KEGG、GO数据库对Unigenes进行注释,预测糙苏三萜皂苷代谢的生物合成途径关键基因.结果获得了参与萜类化合物骨架生物合成的Unigenes数量为73条,39条Unigenes编码19个与萜类生物合成的关键酶,且有23条基因参与萜类物质骨架代谢途径(途径编号为ko00900),19条基因参与了倍半萜类物质代谢途径(途径编号为ko00909),涉及萜类物质骨架合成代谢途径相关酶共有15种,以及三萜代谢途径相关酶有10种.本研究获取了糙苏的三萜皂苷合成相关候选基因核苷酸和氨基酸序列,为糙苏三萜皂苷物质体外表达和生物合成奠定理论基础.  相似文献   

10.
脆蛇转录组序列的分析和系统发育定位(英文)   总被引:1,自引:0,他引:1  
脆蛇是一种类似于蛇但是又具有蜥蜴的特征的爬行动物,这些矛盾的特性与脆蛇的系统发育分类学有密切的关系.脆蛇在传统中药中也有很多治疗作用.基于这些方面,本研究利用高通量测序方法对脆蛇胃肠道的转录组序列进行检测,组装和注释.最终获得4.6 Gbp高质量的数据,组装获得58 959个单一的基因,其中35 708(60.56%)个单一基因与数据库的基因相匹配.为了确定脆蛇与蛇和蜥蜴的同源进化关系,对同源基因家族和系统进化树进行了分析,结果显示脆蛇的转录组序列更接近于蛇而不是蜥蜴.除此之外还鉴定了10 613 cSSR标签,其中1 644个标签根据严格的标准能够用至少一个引物获得.本研究第一次揭示了脆蛇胃肠道的转录组序列,确定其在系统发育学上的定位.这些序列和标签为脆蛇的研究提供了重要的资源.  相似文献   

11.
应用MISA软件对波纹巴非蛤转录组测序数据进行分析,共获得7378个微卫星标记,从中选取95个位点设计引物,并在一个野生波纹巴非蛤群体中进行分析验证,结果显示:95个位点中能够扩增出清晰条带的位点有30个,其中15个位点表现为单态,15个位点呈现多态.使用15个多态位点进行波纹巴非蛤群体的遗传多样性分析,结果表明:这15个位点的等位基因数为2~9,平均等位基因数为4.733,平均有效等位基因数为2.438,平均观测杂合度和平均期望杂合度分别为0.270、0.516,平均多态信息含量为0.457.  相似文献   

12.
【目的】随着二代测序技术的不断发展,转录组测序技术在许多物种里已被广泛地应用于基因差异表达分析和基因注释研究。现有的多种基因差异表达分析软件,分析步骤多而且复杂,不同分析方法其结果差别也较大,这给研究者分析实际数据带来了不少困难。为了简化基因差异表达分析的过程,利用现有的软件开发一个集成的软件包。【方法】针对Trinity、TopHat+Cufflinks和HISAT2+StringTie 3种比较成熟的基因差异表达分析流程,考虑研究对象有无参考基因组序列、样本数据是否有重复、单端还是双端测序、不同基因表达量的计算方法以及不同的基因差异表达显著性检验方法等因素,将多种转录组测序数据分析软件整合起来形成一个集成的软件包。【结果】 使用Perl语言开发了一个名为findDEG软件包用于转录组测序数据的基因差异表达分析。软件包共分为3个模块,即Trinity、TopHat+Cufflinks和HISAT2+StringTie模块。Trinity模块提供3种计算转录本表达量方法和4种差异表达基因显著性检验方法,TopHat+Cufflinks模块可供用户选择新版或旧版的Cufflinks分析方案,HISAT2+StringTie模块则只有一种分析方案。该软件包可以自由下载使用,其网址为http://www.bioseqdata.com/findDEG/findDEG.htm。采用新版和旧版的Cufflinks分析方案以及一种Trinity组合方法,分别对小叶杨在正常和干旱胁迫条件下的转录组数据进行了分析。结果两种Cufflinks方法分别识别出了53和33个差异表达基因,其中25个是相同的; Trinity方法识别了高达1 641个差异表达基因,其中与Cufflinks两种方法相同的分别有14和3个。【结论】 新开发的软件包findDEG有十多种基因差异表达分析方案可供选择,采用一键的方式进行数据计算分析,避免了中间环节参数输入和结果利用等操作步骤,使用方便。  相似文献   

13.
为寻找三叶木通雌雄花性别分化的相关基因,从基因的表达水平上揭示三叶木通雌雄分化的分子机制.以三叶木通雌雄分化期的花芽为材料,采用高通量测序技术,对自然状态下三叶木通的雌性花芽与雄性花芽进行转录组测序,通过生物信息学对雌雄花芽的转录本进行分析,筛选差异表达基因.将雌花与雄花Unigene进行表达量分析,筛选表达量高且可信...  相似文献   

14.
采用Illumina测序平台对灰树花菌(Griflola frondosa)原基进行转录组测序,获得了大量转录组信息.结显示果,测序得到38 189个非冗余Unigene,在Nr数据库中有31 454个Unigene被注释;与KEGG数据库比对,共有1 832个Unigene被注释,分属20条生物通路;在COG数据库中注释可划分为25类;与GO数据库进行注释可分为分子功能、细胞组分和生物过程3个主类和60个二级亚类.  相似文献   

15.
转录组测序技术已广泛应用于生命科学的各个领域.羊作为被最早驯化的家养动物之一,在人类日常生活中有着不可取代的作用.文章主要从绵山羊肉品质、毛绒生长、泌乳等方面应用转录组测序进行了阐述,为今后绵山羊的分子育种工作提供参考.  相似文献   

16.
冷胁迫是限制植物生长和分布,降低作物产量的重要环境因子.冷驯化是温带植物对抗冷胁迫的有效手段.本研究以具有耐寒能力的高山植物牛皮杜鹃(Rhododendron chrysanthum Pall.)作为研究对象,探究冷驯化前后牛皮杜鹃的基因表达和代谢通路的变化.基于转录组数据的测序结果:常温组和驯化组的总reads分别为...  相似文献   

17.
通过对伴有颈部淋巴结转移和不伴颈部淋巴结转移的甲状腺乳头状癌组织与癌旁正常组织提取RNA进行转录组高通量基因测序,经过基因本体注释分析及京都基因和基因百科全书通路富集分析,构建蛋白互作网络(PPI)找出核心差异基因,在GEPIA网站对核心差异基因进行相关性分析和无复发生存期分析.取只在伴有颈部淋巴结转移组中表达的差异基...  相似文献   

18.
本实验旨在对绵羊肌肉转录组进行组装分析,以丰富绵羊的基因组并为进一步对绵羊的相关基因的分子遗传学研究奠定基础。选取Illumina Hiseq 2000测序平台对杜泊羊和小尾寒羊的骨骼肌转录组文库进行了高通量测序,并对测序数据进行从头组装分析。结果表明:两个测序文库共得到103058824个长为2×90bp的高质量的测序序列,经从头组装共产生了145524个unigenes。两个文库间有5718个unigenes差异表达,经GO注释分析后发现它们主要分布在细胞、细胞过程和结合条目中。将两个文库的unigenes进一步组装得到70348个平均长为863bp的all-unigenes,其中35201个被注释到Nr数据库,12219个被注释到COG数据库,并与KEGG数据库中的258个功能通路中的蛋白质和氨基酸新陈代谢通路密切相关。  相似文献   

19.
为研究月季插穗在不定根发生过程中的关键基因调控机理,利用Illumina平台测序技术对切花月季品种‘卡罗拉’插穗的3个发育阶段(不定根未启动期、愈伤组织形成期和不定根伸长期)插穗基部1 cm皮层进行转录组测序分析,结果表明:月季插穗不定根发生的3个阶段中,在不定根未启动期与愈伤组织形成期之间共筛选出差异表达基因5 033个,其中2 313个基因上调,2 720个基因下调;在愈伤组织形成期与不定根伸长期之间共筛选出差异表达基因1 865个,其中1 332个基因上调,533个基因下调;GO功能分析表明,差异表达基因主要参与生物过程、分子功能和细胞组分3大功能;KEGG富集分析结果表明,差异表达基因主要参与植物激素信号转导、次生代谢产物的合成以及碳水化合物的合成等代谢通路;将月季插穗生根过程中差异性最为显著的8个基因通过实时荧光定量PCR检测其转录水平变化,结果表明: 实时荧光定量PCR的验证结果与转录组测序结果基本一致.  相似文献   

20.
基于色木枫的转录组数据初步设计166对引物,并根据琼脂糖凝胶电泳与Sanger测序结果筛选出其中的26对核低拷贝基因引物.在东亚63个种群的182个个体中大批量扩增所开发引物,单倍型多样性范围为0.45~0.97,核苷酸多样性为(1.90~18.03)×10?3;9~15对引物可在金钱槭、茶条槭、青榨槭和鸡爪槭中扩增;STRUCTURE聚类结果与之前核微卫星研究结果类似,且展示了更多的谱系地理结构,结果表明引物多态性高、拓展性强、具有可靠性.本研究的转录组数据为槭属的研究提供重要遗传信息,所用方法被证明可以有效开发大量核低拷贝基因引物,已开发出的26对引物将为色木枫的进化历史和槭属系统发育研究提供丰富有效的分子标记.   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号