公司新闻

RNA融合基因分析示例

浏览量:6790 / 发布时间:2021-11-19

背景

NGS 理论上可以检测样本内所有已知及未知的融合事件。目前已报道的约 10,000 个基因融合事件中,有近 90% 是通过 NGS 方式鉴定的[1]。由于融合多发生在内含子区域且断点位置不固定,故融合基因一般基于 RNA 层面检测,常见方法有转录组测序 (RNAseq) 和杂交捕获测序 (RNA-Capseq)。本文主要介绍这两种方法的分析示例。

融合基因分析常用 FusionCatcher[2]、STAR-fusion 等软件进行,这些软件原理上均是先利用内部比对程序将 Reads 比对至参考基因组;再挑选存在 softclip 的 Reads,将其中 softclip 掉的序列部分再次与参考基因组比对,寻找潜在的融合伴侣。有些软件还会将数据与自建的数据库比对,以进一步提高准确性。融合分析的难点在于结果的验证,不仅需要借助 IGV 等工具对融合断点附近的 Reads 进行可视化及二次比对,以过滤假阳性结果并及验证真阳性;还应通过 Sanger 测序,从实验层面再一次确认融合事件。

如果仅检测已知融合事件,还有一种简单易行的方法:预先构建包含断点位置及融合转录本序列等信息的融合转录本库;再将测序数据与融合转录本库比对,通过跨断点的 Reads 存在与否,即可判断融合事件。作为参考的融合转录本库,一般基于 cosmic、TCGA、FusionGDB 等数据库信息构建。需要特别注意,各数据库使用的参考基因组版本及融合转录本 ID 号间存在差异,应统一转录本描述信息,否则会影响融合断点的精确定位及比对的成功率。


材料与方法

融合分析标准品

Seraseq® FFPE NTRK Fusion RNA Reference Material 标准品包含实体瘤中普遍存在的 16 种 RNA 融合。我们将标准品用 K562 细胞系 RNA 按不同比例稀释成:100%、50%、12.5%、3.13%、0.78% 和 0.20% 共计 6 个梯度,模拟不同拷贝数的融合事件情形。


捕获测序

100 ng 不同梯度的标准品利用 NadPrep® Total RNA-To-DNA Module 搭配 NadPrep® DNA 通用型文库构建试剂盒构建预文库,再分别进行:转录组测序(RNAseq)、去除 rRNA 测序(rRNA-depleted RNAseq,NEBNext rRNA Depletion Kit v2) 和RNA Panel 捕获测序。RNA 捕获 Panel 分别为:NanOnco Plus Panel v2.0 (下文简称为 Onco V2),靶向实体瘤研究中被广泛关注的 565 个基因的全部编码区和融合相关的内含子等区域;OncoFu Elite (for RNA) Panel v1.0 (简称下文 OncoFu E),靶向实体瘤研究中最为常见或有临床意义的融合相关的 105 个基因,适用于 RNA 水平的融合、变异和基因表达信息的富集。测序模式为 NovaSeq,PE150。


分析方法

已知融合事件分析:纳昂达内部工具。先将测序数据与预构建的参考融合转录本库比对,过滤去除未比对成功的 Reads 并保留跨融合断点的 Reads (Spanning Reads)。

未知融合分析:FusionCatcher,默认参数。


已知融合事件的分析示例

基于标准品中 16 种已知融合事件信息,我们预先构建了相应的融合转录本作为参考转录本库。然后使用已知融合分析工具 (纳昂达科技自行开发) 对基于标准品的 RNAseq、rRNA-depleted RNAseq 和 RNA Panel 捕获数据进行比对分析,并获取 Spanning Reads。为便于比较,以每百万比对 Reads 中支持的 Spanning Reads (FRPMMR) 进行数据量均一化。对于未经稀释的标准品,RNA Panel 捕获测序的结果均有足量的 Spanning Reads 支持融合事件的存在,Onco V2 和 OncoFu E 在融合位点的 FRPMMR 值分别 >30.3和 >194.6,而 RNAseq 和 rRNA-depleted RNAseq 中大部分融合位点的 FRPMMR 值均 <2 (图 1 A)。

对梯度稀释标准品的进一步测试结果表明,同等数据量情况下 OncoFu E 融合富集效果更为明显(图 1 B)。主要原因在于 OncoFu E 更专注于融合基因的捕获,Panel Size 较小,故数据利用率更高。此外,OncoFu E 针对 RNA 中的 UTR 区域进行了优化设计,因此也更适用于一些特殊融合事件的捕获,例如融合断点常存在于 UTR 区域的基因 ERG。对于低拷贝数情形下,部分融合位点 FRPMMR 值偏离较大的情形,我们认为是由于样本制备和实验过程中产生的初始融合事件数波动导致的,这也同时导致了低拷贝数时个别融合事件检测不到 (图 1 B 中的黑点)。 


图1A
图1B

 图 1 | 已知融合的分析示例。

A. RNAseq、rRNA-depleted RNAseq 和 RNA Panel (OncoFu E 和 Onco V2) 捕获测序数据的检测结果;

B. 0.20%~100% 梯度稀释标准品捕获测序数据中 OncoFu E 的 FRPMMR 值分别与 Onco V2 的比值,即两者捕获差异倍数 Fold Change (FC)。


已知融合的 Spanning Reads 可在 IGV 软件中直观的观察到。图 2 为构建的 EML4-ALK 融合参考转录本上的 Spanning Reads 比对分布,可发现 Reads 跨断点且分布均匀,并与参考转录本完美匹配,证明该融合转录本真实存在。


图片2

 图 2 | EML4-ALK 融合在参考转录本上的 Spanning Reads 比对分布。


未知融合事件分析示例

当使用 FusionCatcher 软件模拟对标准品的未知融合分析,像其它融合分析一样,将得到数百甚至更多个疑似融合,这其中包含大量的假阳性预测,一般均需要进一步的鉴别。常用的鉴别方法是结合软件中的 Spanning Reads 数和可视化人工核查,二者缺一不可。

表 1 | 不同检测方法下的FRPMMR值 (部分)

表1


标准品中 16 个相关融合断点的 FRPMMR 值见表 1。可以看到,FusionCatcher 检测融合基因时,其效果与融合转录本比对法结果极为相近,均能得到大量支持融合断点的 Spanning Reads。同等数据量的情况下,捕获测序较 RNAseq 或 rRNA-depleted RNAseq 有更好的富集效果;OncoFu E 富集效果也显著优于 Onco V2 (图 3)。


图3

图 3 | FusionCatcher 融合分析示例。


以 EML4-ALK 融合事件为例,在 EML4 基因的融合断点有 ≥3 条 Spanning Reads,这些 Reads 的融合断点左侧部分完美匹配,但是在右侧均被 softclip 并保持一致性,此时可认为很可能存在基因融合 (图4 A) 。将断点右侧被 softclip 序列 (图 4 B,最下方的黑色线段) 重比对,可发现均位于 ALK 基因的融合断点附近。同理,也可对 ALK 基因上有 softclip 的序列进行比对进行交叉印证。由此,我们可以判断 EML4-ALK 融合事件非常可能真实存在。


图片4a
图片4b

左右滑动查看更多

▶ 图 4 | EML4-ALK 融合相关 Spanning Reads。


欲了解更多详情,欢迎联系当地销售或400 8717 699 & support@njnad.com。


订购信息




产品名称

规格

货号

RNA To DNA 模块

NadPrep® Total RNA-To-DNA Module, 96 rxn

1002402

文库构建模块

NadPrep® DNA Library Preparation Module (for MGI), 96 rxn

NadPrep® DNA Library Preparation Kit (for Illumina®), E96

1002212

1002103

杂交试剂 

NadPrep® Hybrid Capture Reagents, 96 rxn

1005101

通用封闭

NadPrep® NanoBlockers (for Illumina®), 96 rxn

NadPrep® NanoBlockers (for MGI, SI), 96 rxn

NadPrep® NanoBlockers (for MGI, DI), 96 rxn

1006102

1006205

1006208

Panel

NanOnco Plus Panel v2.0, 96 rxn

OncoFu Elite (for RNA) Panel v1.0, 96 rxn

1001111E

1001511



关于纳昂达科技

纳昂达科技 成立于 2011 年,秉承 “Nano Trans More ”的核心理念和 “靶向精准,用心服务诊断”的奋斗宗旨,致力于为科研院校、医疗机构、临检单位、产业公司、测序服务商等提供专业化和高质量的靶向测序产品与闭环解决方案。

公司深耕精准靶向领域,目前拥有 MGI 和 Illumina 双测序平台多款文库构建试剂盒和全套液相杂交试剂产品。明星产品还包括全外显子 Panel、泛实体瘤和血液肿瘤 Panel 以及呼吸道病毒 Panel 等,并提供全面完善的双平台捕获探针定制化服务。

面积 > 2,000 平米的高通量测序研发中心和 > 2,500平米的GMP级别(YY/T0287-2017idt ISO13485:2016)体外诊断试剂生产基地为产品创新与生产质量保驾护航。纳昂达的销售网络覆盖全国并已外延至海外地区。

公司将与客户共成长,对客户的需求全力以赴,为全球用户提供靶向测序解决方案和 IVD 试剂原料。