【中英文题目】
利用RenSeq和sMrt测序技术可以加速马铃薯抗晚疫病基因的克隆
Accelerated cloning of a potato late blight–resistance gene using renseq and sMrt sequencing
【基本信息】
期刊:Nature Biotechnology
年份:2016
IF: 43.113
【摘要】
受到马铃薯晚疫病病菌引起的晚疫病的影响,马铃薯和番茄的全球产量大幅度下降。大部分的商业化马铃薯品种为易感晚疫病品种,而一些野生的马铃薯品种则表现出不同的抗性,因此可以作为研究抗晚疫病病菌(Rpi)相关基因的有效资源。已经有抗性育种研究发现了Rpi基因,但是耗时很多。文章报道了也升双倍体非块茎培育的茄科植物龙葵(Solanum americanum)包含了多个Rpi基因,同时,结合利用单分子实时测序技术获得的抗性基因(R基因)来克隆Rpi-amr3i,这项技术能够对无特征表型种质的完整核苷酸结合、富含亮氨酸重复受体(NLR)基因及其转录调控元件和复合多NLR位点进行从头组装。因此,SMRT RenSeq可以被应用于设计抗病作物,快速克隆R基因。
【研究思路】
取材:
本研究所用材料来自温室培育下的S. americanum sensu lato. S. americanum(茄科植物)
P. infestans晚疫病病菌来自波兰植物育种和驯化研究所
文库构建及测序策略:
使用DNeasy Plant Mini Kit提取新叶中的基因组DNA,构建gDNA文库;
使用TRI-Reagent (Sigma-Aldrich, MO, USA)和Direct-zol RNA MiniPrep Kit提取RNA,构建cDNA文库
之后,BGI(华大)进行WGS测序,测序深度约30×
信息分析:
![利用RenSeq和sMrt测序技术可以加速马铃薯抗晚疫病基因的克隆 利用RenSeq和sMrt测序技术可以加速马铃薯抗晚疫病基因的克隆]()
【研究结果】
1、对于MiSeq和PacBio RenSeq测序reads组装结果的比较
植物在检测到体内的病原菌时会迅速激活防御系统抵抗疾病的发生,及时激活防御系统依赖于细胞表面受体或者细胞内免疫受体对于病原菌的识别,特别是亮氨酸富集重复蛋白家族(NLR)。植物参考基因可以被用来挖掘NLR基因的相关信息,生物素标记RNA序列文库(RenSeq)可以用来合成并克隆NLRs相关的未测序单元,但是,大量拷贝数以及高度重复编码序列将会影响到全NLR基因的从头组装的精确性。
为了加速Rpi基因(抗晚疫病)的克隆,以及省略掉细菌人工染色体和质粒文库的构建,文章重新定义了RenSeq来捕获和测序NLR片段,长达3.2kb. 本研究结合长读段SMRT测序技术(SMRT RenSeq)对NLR进行富集研究,并对NLR短读段和长读段的组装进行比较、将CLC或SPAdes NLR组装并比对到长读段的contigs上进一步证明SMRT RenSeq在捕获>1kb两侧启动子和终止子时的优越性(图1a)。图1a-c中,序列信息还表现出可能的调控元件,包括启动子和终止子序列。通过对长读段和短读段组装(SPAdes和CLC)结果的比较发现,SMRT RenSeq产生的reads可以组装成完整的基因,包括调控元件。
![利用RenSeq和sMrt测序技术可以加速马铃薯抗晚疫病基因的克隆 利用RenSeq和sMrt测序技术可以加速马铃薯抗晚疫病基因的克隆]()
图1 比较MiSeq和PacBio RenSeq测序reads组装结果 (a)由SP2271 ROI reads组装得到的长33-kb的Contig_7,包括四个完整的类R2 NLR基因和一个部分的NLR基因,同时,与相应的MiSeq reads组装得到的contigs进行比较(Contig_7下面)。其中,紫色箭头表示预测ORFs,黑色表示PacBio ROI read的测序深度;(b)长DNA文库可以得到启动子和终止子区域,比较PacBio ROI和MiSeq得到的contigs,分别用不同的颜色表示其邻近5’区域的长度,其中,PacBio ROI得到的2.5 kb的contigs用蓝色表示,3.5 kb的用深粉色表示,MiSeq利用CLC得到的contigs用绿色表示,利用SPAdes得到的contigs用深蓝色表示;(c)利用PacBio ROI reads组装得到的Rpi-amr3i contig的详细示意图,黄色表示ORF区域,NLR包含的典型的蛋白质结构域:紫色表示卷曲螺旋(CC),蓝色表示核苷酸结合位点(NB-ARC),绿色表示亮氨酸富集重复(LRR)。用来组装Rpi-amr3 contig的ROI reads用黑色表示
2、对SP2271(茄科) NLRs的NB-ARC结构域的系统发育分析
图2是对SP2271 NLRs的NB-ARC结构域构建的系统发育树,表现出茄科植物的典型结构,其中TIR-NLR和CC-NLR的比例为1:4.7,与Brassicaceae(十字花科)相反。另外,与马铃薯和番茄的NLR系统发育树进行比较发现一个特定分支的扩展(CNL-10)以及一个新分支的出现(CNL-17)。
![利用RenSeq和sMrt测序技术可以加速马铃薯抗晚疫病基因的克隆 利用RenSeq和sMrt测序技术可以加速马铃薯抗晚疫病基因的克隆]()
图2 SP2271 NLRs的系统发育树 基于泊松模型的最大似然法得到的系统进化树显示,363个注释的NLR基因的NB-ARC结构域主要聚集在31个功能特征的植物R基因(红色和蓝色字体表示,CED4作为外群);每个主分支的boostrap值大于等于70%的分别标记在图中,TIR-NLR(TNL)分支用黄色背景表示,标签表示的是基因ID;系统进化树以一定的比例绘制而成,树枝的长度与每个位点的替换数目成正比。
3、候选基因Rpi-amr3i确实具有抵抗P. infestans(晚疫病)的作用
SMRT-RenSeq有利于快速测定Rpi候选基因序列,通过PCR对这六个候选NLRs的ORFs进行扩增,随后对Nicotiana benthamiana(烟草的一种)进行瞬时表达研究(图3)证明了候选基因Rpi-amr3i的功能。接下来,本研究创造出携带有Rpi-amr3i的稳定转基因作物,这样的作物表现出抵抗所有的P. infestans病原菌的能力(图3b)。这些结果均证实Rpi-amr3i对于抵抗晚疫病病毒P. infestans的功能。
![利用RenSeq和sMrt测序技术可以加速马铃薯抗晚疫病基因的克隆 利用RenSeq和sMrt测序技术可以加速马铃薯抗晚疫病基因的克隆]()
图3 对N. benthamiana(烟草的一种)和稳定的转基因马铃薯进行短暂互补分析发现候选基因Rpi-amr3i确实具有抵抗P. infestans(晚疫病)的作用 (a) 双载体pICSLUS0003ø35S 侵染N. benthamiana叶子后,要么六个Rpi-amr3候选基因中的一个(阳性控制)过表达,要么GFP(阴性控制)过表达。随后接种P. infestans发现,只有R2和Rpi-amr3i没有被感染(如图所示),而在其他Rpi-amr3候选基因以及GFP控制组中则发生严重感染。Rpi-amr3a对应的表型与所有不起作用的参考基因一样。(b)转基因双倍体马铃薯“Line26” (Solynta B.V.)在固有调控元件下表达Rpi-amr3i抵抗P. infestans病原菌。相反,携带有无功能参考基因Rpi-amr3a的对照组植物则表现出大面积的芽孢化和坏死病变。
【研究结论】
1、本研究运用SMRT RenSeq技术,即通过将两种测序技术——“RenSeq”(抗性基因ENrichment SEQuencing)和“SMRT”(单分子实时测序)相结合,让寻找、定义和引入遗传抗性的过程,更快和更容易。
2、野生马铃薯近缘种Solanum americanum携带着几个抗性基因,本研究通过使用新技术,迅速分离出一个新的抗性基因——Rpi-amr3。
3、希望这项新技术将提高商业作物收成,并将带来更高的产量,显著减少对环境的影响,并最终降低生产者和消费者的成本。
【所用软件和数据库】
CLC Assembly Cell:一种高性能计算机解决方案,用于下一代测序数据的从头组装以及有参组装
Geneious R8:一款功能强大的用于分子生物学以及NGS分析的工具,它结合了所有主要的生物信息学分析工具
BWA(Burrows-Wheeler Aligner ):是一款十分优秀的序列比对软件,它主要应用二代测序后的大量短小片段与参考基因组之间的定位比对
Savant Genome Browser:适用于高通量测序数据的基因组浏览器,序列注释,可视化和分析工具,用于基因组数据的一个桌面可视化和分析浏览器
Samtools:是一系列处理BAM格式序列的应用,它从SAM(Sequence Alignment/Map)格式输入或者输出为SAM格式,可以进行排序,合并和建立索引,并且允许快速地检索任意区域的读段(reads)
CDD数据库:保守结构域数据库(Conserved Domain Database)是NCBI Entrez查询和检索系统的一部分,并且也能够通过http://www.ncbi.nlm.nih.gov/Structure/cdd/cdd.shtml访问,CDD提供了带有保守结构域足迹定位和从这些足迹中推断的功能位点的蛋白质序列注释。