什么是三代全长转录组?

三代全长转录组(iso-seq),是基于Pacbio三代测序平台对物种进行mRNA进行测序研究,因其读长较长,不需要打断拼接,就可以获得5’,3’UTRploy A tail 的完整转录本,克服了传统二代测序读长较短,转录本拼接较短,转录本结构不完整的缺点,因其可直接获得单个mRNA分子5’端到3’端高质量全部转录本信息而得名。


全长转录组的优势

读长超长,无需进行打断和拼接,可直接获得全长转录本的完整信息。

发现更多的新基因、可变剪切,精准定位融合基因,改善基因组注释等。

直接获取正义链、反义链及部分LncRNA信息。

结合二代数据,可以得到准确的基因和转录本表达定量。


全长转录组应用方向

在动植物方面:

1. 挖掘生物胁迫和非生物胁迫对动植物的生理,发育影响,结合RNA-seq筛选不同环境下的差异表达基因或转录本,增加对胁迫和耐受相关调控网络的理解。

2. 研究不同发育时期转录组的动态变化,可以准确识别不同时期的转录本结构变化,结合RNA-seq可研究不同时期的基因或转录本的表达变化,有助于阐明生物生长发育的调控机理。

3. 研究生物合成或代谢机制,鉴定完整转录本,对重要代谢通路的关键基因或转录本进行深入探究,突破以往利用二代测序技术对生物的重要次级代谢产物生物合成的研究而无法准确预测剪接亚型的限制。

在医学方面:

1. 获得病变组织/细胞的全长转录组,筛选治疗靶点/研究预后相关信息。

2. 发现复杂疾病中的基因结构变异和融合基因,鉴定肿瘤/疾病中的特异性Isoform。

3. 进行药物响应研究或基因变异与疾病耐药性的相关分析。

4. 可变剪切因子分析,驱动基因的结构变异,疾病关键候选基因的筛选等。

作者结合了PacBio 长读长(Iso-Seq)和Illumina RNA-seq测序全面研究了胃癌(GC)转录组。文章对10个GC细胞系进行了全长转录组分析,涵盖四种主要的GC分子亚型(染色体不稳定型、Epstein-Barr阳性,基因组稳定,微卫星不稳定)。鉴定了60239个非冗余全长转录本,与当前的转录组数据库相比,超过66%是新的。新的转录本更可能是细胞系和亚型特有的,表达水平较低,外显子数量较多,有较长的转录本/编码序列长度。大多数新的转录本第一外显子是可替换的,与其他选择性剪接类别相比,它们的表达水平更高表现出更高的可变性。总之,作者观察到25%的检测到的基因使用替代启动子,大多数(84.2%)已知/新启动子对在编码序列有潜在变化。将这些替代启动子比对到TCGA 的GC样本中,鉴定了几种与癌症相关的转录本,包括新的癌基因变体。肿瘤特异性转录本往往会改变蛋白质编码序列与其他亚型相比。对结果数据的分析表明,新的转录本可能提供更多的预后信息。研究结果为深度研究GC和其他胃肠道恶性肿瘤提供了丰富的全长转录组信息。

可变剪切一种转录后调节机制,从单个前体mRNA产生不同的mRNA分子,在中枢神经系统的发育和功能中发挥重要作用,作者使用iso-seq在人类和小鼠皮层中生成全长转录序列,确定了现有基因组注释中不存在的新转录本,包括比对到预测的新基因(未注释)的转录本,以及包含多个外显子的融合转录本。尽管某些基因在物种间存在显著差异,但人类和小鼠皮层之间转录多样性的整体模式是相似的。我们还确定了可变剪切的发育变化,以及人类胎儿和成人皮质之间转录本的差异使用。文章的数据证实了可变剪切在大脑皮层中的重要性,它极大地增加了转录多样性,并代表了大脑中基因调控的一个重要机制,为科学研究提供人类和小鼠皮层的转录水平数据。

(点击左下角阅读原文了解pacbio测序原理及分析流程。)

擎科生物可提供:全长转录组,二代转录组测序等服务。

联系ngs@tsingke.com.cn即刻开聊,现在下单即有好礼相送,具体可联系当地销售经理!

 

参考文献

[1] Huang K K ,  J  Huang,  Wu J , et al. Long-read transcriptome sequencing reveals abundant promoter diversity in distinct molecular subtypes of gastric cancer[J]. Genome Biology, 2021, 22(1).

[2] Leung S K ,  Jeffries A R ,  Castanho I , et al. Full-length transcript sequencing of human and mouse cerebral cortex identifies widespread isoform diversity and alternative splicing[J].