Identification of regulatory networks and hub genes
controlling soybean seed set and size using RNA sequencing
analysis
用转录组分析识别控制大豆种子形成和大小的调控网络与核心基因Journal of Experimental Botany, IF= 5.8,2016.11
摘要:为了识别控制大豆种子形成和大小的调控网络与核心基因,用转录组分析了三个早期发育时期的种子,用了两种基因型(大小相反的的种子),以大豆种子形成以及发育为基础这两组初步的数据为动态的基因表达网络提供了全面和系统的观点。利用两两比对和加权基因共表达网络分析,鉴别出了共表达和核心基因模块。尤其重要的是发现了大种子大小的变化和发育时期的特殊模块,大多数候选调控种子大小的调控因子包括参与激素信号途径和转录因子,在早期发育时期会瞬时和特异诱导。大豆油菜素类固醇信号受体酶同源染色体被认为是在种子早熟时期控制种皮网络的核心基因,过表达候选种子大小调控基因GmCYP78A5, 发现转基因大豆种子大小和重量都有所增加。总之,本文分析鉴别出了许多潜在的关键调控因子,控制大豆种子形成、大小、产量,因此,为理解大豆种子发育分子网络提供了新的视野。
研究思路
取材: 大种子品种豌豆28(V1) 、小种子品种Peixian Layanghuang (V2),受精后5–7, 10–14, 20–24 天的种子即种子形成 (S1), 种子生长(S2), 种子早熟时期 (S3)这三个时期的样品,三个生物学重复。

测序策略:PE100, Illumina HiSeq 2000
文库构建:24个文库
研究思路:

研究结果
两个品种在S1,S2,S3时期种子的大小、形状、物质成份都有所不同,同一品种在这三个时期的种子也不相同,在S3时期,种子的大小和贮藏物质含量都显著增加。通过转录组测序分析发现,总共有47 848, 47 715, 42 894,和 34 579转录本在V1品种的S1, S2, S3-1,以及 S3-2 中表达, 相似的是,有48 218, 48 109, 41 530, 和 33 446转录本在V2品种基因型中的各个时期表达图1A。

主成分分析显示八个样本可以明显地分成四个组S1, S2, S3-1,和 S3-2 (Fig. 2B). V1 和 V2 来自同一时期被聚类到一起,表明所有的转录组表达谱与V1和 V2 在不同的发育时期相似。在V1和V2的四个样本中表达的重叠基因如图1C、D所示。

图. 1. 在种子发育时期全部的基因表达谱
(A)在每个样本中检测到的转录本数量 (B)转录组数据主成分分析
(C, D) 在四个组织(C) V1 和 (D)V2中的表达不同的转录本韦恩图
鉴别两种基因型的不同的表达基因
通过FPKM分析DEGs, 在S1 时期, 双端比较V1S1 versus V2S1显示973 个基因的表达显著不同(图2A),V1与V2相比,这些基因中有489 个显著上调,484个基因显著下调 。在S2 时期, 485 和 476个基因显著上调或下调。在S3 时期, 310 和222基因显著上调或下调。 在 S3 子叶样本中, 241 个基因显著表达不同,V1S3-2和 V2S3-2, 152 个基因上调,89 个基因下调。 在两个品种的3个发育时期 S1, S2, S3-1 以及 S3-2的DEGs 的数量如(图2B)所示 。

图2.V1与V2品种中差异基因表达分析

图 3. 热图比较种子发育每个时期的DEGs ,显著过表达的DEGs功能分类S1(A), S2 (B), S3-1 (C), S3-2 (D)。
基因过滤后得到7359个基因用来 WGCNA分析,基于两两相关对所有样本构建共表达网络。 聚类到同一模块的基因之间关联性很强。总共分为12个明显的模块用不同的颜色标记(图5A),系统发育树的主枝定义为模块。很明显,其中4个共表达模块构成的基因在每个样本类型中都高度表达如(图5B)红色下划线表示。


图4.在种子不同发育时期V1和V品种的 加权基因共表达网络分析WGCNA
(A)层次聚类树显示由WGCNA分析鉴别出的共表达模块,在树中的每个叶子代表一个基因,主要的树枝由12个模块构成,用不同的颜色标记。
(B)模块-样本关联,每一行与模块关联,用和图A中一致的颜色标记,每个模块中基因的数量在左边显示,每个模块中转录因子的数量通过插入成分的数量显示,每个柱子与特异的组织和重复区相关联,在行中每个单元的颜色与纵列相交表示模块和组织型的相关系数。相关性高的在模块区用红色下划线标出。
对这12个用不同颜色标记的模块进行聚类和共表达网络分析,主要核心基因编码细胞色素P450,细胞分裂素合酶,豆荚蛋白,过氧化物酶,ABA反应结合因子,植物G-box结合因子,转录因子TGA, EREBP-like 因子, MADS-box 转录因子, AP2-like 因子(ANT), 同源异型亮氨酸拉链蛋白,DNA导向 RNA 聚合酶 II 亚型 RPB7等多种物质。数个 BR 生物合成基因富集在种皮,表明在种皮发育过程中BR信号调控网络起着重要的作用。

图5. 共表达网络分析阶段特殊模块,红色区域代表得到的候选核心基因。



图6. 在转基因大豆中,过表达细胞色素P450-GmCYP78A5 (Glyma.05G019200) 能增加种子的大小,RT-PCR分析 Glyma.05G019200在 Williams 82 中的表达水平。