Long non-coding RNAs display higher natural expression variation than protein-coding genes in healthy humans
Genome Biology ,IF=10.81,2016.01
健康人群中长链非编码RNA(lncRNA)比蛋白编码序列表现出更高的表达变异性
研究背景:近几年,长链非编码RNA(lncRNA)的功能研究倍受关注,越来越多的研究表明lncRNA主要发挥调节基因表达的作用,而且其数量在人类基因组中比蛋白编码基因还要多,lncRNA可以作为疾病发展的标志物。准确鉴定不同组织样本的lncRNA具有重要的生物学意义。
研究材料:10名健康志愿者(5男5女),各采集静脉血45ml,其中7名志愿者间隔采血3次。
建库策略:提取各血液样本total RNA:
1. 去除rRNA,建链特异性文库;
2. 不去除rRNA,采用oligo(dt) 磁珠富集RNA,建普通转录组文库。
测序策略:1. 测序平台
Illumina HiSeq 2000
2. 测序策略
PE50 PE100
研究结果:
1. 鉴定到lncRNA位点
对10个健康志愿者的血液白细胞样本RNA进行测序,获得的reads与参考基因组序列进行比对,鉴定到1,591个lncRNA loci,表达6,249条lncRNA转录本,10,092个mRNA loci,表达132,864条mRNA转录本。
2. lncRNA类别鉴定
根据最近的蛋白编码基因的相对位置,将lncRNAs分为三类:intergenic lncRNA最多(42%),antisense lncRNA占33%,bidirectional lncRNA占25%。将鉴定到的血液白细胞lncRNA与公共数据库比对,发现46%的转录本在公共数据库中不存在;把其他组织的测序结果用于比较分析,最终发现17%的lncRNA是新发现的。
3. lncRNA表达水平分析
对7名多时间点献血的样本中lncRNA和mRNA表达水平的再现性进行比较分析,发现lncRNA的表达水平在不同时期存在差异,在不同个体也有差异,而mRNA的表达水平则相对稳定。证明lncRNA的表达再现性比mRNA差。而对公共注释的lncRNA分析其在样本间的差异性,则发现其表达水平变异性降低。
4. 分析比较lncRNA与mRNA 表达差异
为了进一步验证lncRNA比mRNA表达变异性大的现象,对脂肪、动脉、小脑、心脏、肺、肌肉、神经、甲状腺等组织的RNA-seq数据进行分析,发现随着组织样本的增加,lncRNA相比mRNA,表达水平的变异性逐渐增大。
![LncRNA测序 LncRNA测序]()
研究结论:想要全面系统了解lncRNA的注释信息,需要建立能够准确识别低丰度和高组织特异性表达转录本的方法。本研究发现,样本之间的表达变异性(样本越多变异性越大)也是lncRNA的新特征,为研究药物治疗靶点提供更多思考依据。