全外显子测序(Whole Exome Sequencing, WES)仅对人基因组约 2% 的区域测序,便可覆盖绝大多数基因的编码序列和 > 99%(临床基因组资源库,ClinGen)的疾病相关区域。借助 WES 可检测基因的点突变、小片段插入缺失、基因重排及拷贝数变异等信息。随着测序成本的下降,其在基础研究、遗传病筛查、肿瘤分子诊断方面得到广泛的应用。
文库构建 |
封阻序列 |
靶向捕获 |
测序平台 |
NadPrep® NanoBlockers
(for Illumina®) |
Illumina® Systems |
||
MGISEQ / DNBSEQ™ |
相关产品仅限研究使用,不用于临床诊断。
图 1. Exome Plus Panel v2.0 在MGISEQ-2000 和 Illumina NovaSeq 6000平台的捕获表现。利用 NadPrep® 系列建库试剂盒进行文库构建,搭配Exome Plus Panel v2.0进行杂交。
图 2. Exome Plus Panel v2.0 对不同gDNA文库的捕获表现。利用 NadPrep® 文库构建试剂盒(for MGI)建库,MGISEQ-2000(PE100)测序模式,利用BWA比对到参考基因组 GRCh37/hg19,按照reads数计算。 A. 捕获数据比对率均>99%,捕获效率>92%;B. 捕获数据均可达到 >99% 的区域覆盖>0.2x平均测序深度;C. 覆盖均一性和一致性表现无显著差异; D. 不同GC含量区域覆盖无偏好性。
注:人类男性基因组DNA(Promega-male, G1471);肿瘤结构变异5% gDNA标准品(菁良,GW-OGTM001);肿瘤SNV 1-25% gDNA标准品(菁良,GW-OGTM004);肿瘤SNV 野生型 gDNA 标准品(菁良,GW-OGTM005)。
WES 分析中,文库构建和靶向捕获步骤中有不少潜在“雷区”需要注意,躲过这些“雷区”才可能获得稳定可靠的 WES 测序数据。以下是较常见的问题和考虑。
样本起始量与质量是靶向测序分析的基石。尤其是对于低频突变的准确检测,足够的原始拷贝数是先决条件。为保证足够的样本文库分子进入全外显子捕获测序分析,我们推荐参考表 1,并根据实际的样本情况来确定起始量。
表1. 全外显子靶向测序样本要求
|
要求 |
解决对策 |
样本质量 |
DNA 无严重降解 |
FFPE 样本来源的 DNA 常有不同程度的降解,需先对片段完整性进行评估。低质量样本可采用修复试剂进行处理。 |
样本纯度 |
OD260 / OD280 = 1.8-2.0(无蛋白、RNA 污染)
OD260 / OD230 = 2-2.5(无有机物污染) |
使用蛋白酶 K 去除蛋白;RNA 酶去除 RNA;采用磁珠纯化去除多余的盐离子和有机物。 |
样本起始量 |
gDNA(无严重降解)
FFPE DNA(片段长度 > 500 bp) |
gDNA ≥ 50 ng(取决于样本质量)
FFPE DNA ≥ 100 ng(取决于样本质量) |
在接头连接步骤,我们推荐根据 Input DNA 及片段大小确定接头用量。针对外显子捕获的文库构建,推荐 DNA 样本片段化范围为 150 ~ 350 bp。常见接头浓度为 15 μM;当 Input DNA ≥ 500 ng 时,适度增加接头用量可以提高文库产出量;当 Input DNA ≤ 25 ng 时,接头应稀释后使用。
我们建议根据样本类型、片段化 Input DNA 和文库预期产量调整 PCR 循环数,切忌文库过度扩增。用于 WES 的 DNA 文库,推荐通过循环数控制文库产出至 600 ~ 1,000 ng,随后单个文库取 500 ng 进入杂交体系。外显子捕获测序的重要评价指标之一—重复率(Duplication rate),和扩增数有着直接关系:扩增数越多,因扩增产生的完全一致的文库分子越多,测序数据重复率也相应增加,有效的测序数据量则被削减。
文库的混杂是指多个样本文库混合进入单次捕获实验。相较于单个文库捕获,混杂后捕获可有效提高生产速度、显著节约成本。混杂比(样本进入杂交反应的文库含量 / 该样本的出库总量)直接影响进入捕获步骤的文库丰度。过低的混杂比引入的测序数据的重复率(Duplication rate)较高,从而降低可用于分析的有效数据量。
此外,进行混合捕获时,若期望多个文库对应的测序数据量一致,则建议每个文库等比混合;若根据不同的检测目的,期望不同的数据量产出,则建议按比例混合进入杂交体系。
在进行人类全外显子捕获时,应根据测序平台和文库类型使用对应的封阻序列(表 2)以及封闭基因组重复序列的 Human Cot-1 DNA。以上组分可以降低接头间和重复序列间的非特异性结合,进而降低脱靶率,提升有效的捕获数据比例。
表2. 不同测序平台推荐的封阻序列
测序平台 |
封阻序列 |
MGISEQ / DNBSEQ™ |
NadPrep® NanoBlockers (for MGI) |
Illumina® |
NadPrep® NanoBlockers (for Illumina®) |
在 NGS 杂交洗脱操作中,即使温度发生了轻微改变,也会对外显子捕获的中靶率以及 GC 偏好性产生影响。测序数据中的 GC 偏好将直接影响捕获数据的整体均一性。洗脱温度的偏离,会导致极端 GC 含量区域捕获的偏差或导致非特异性捕获的增加。
我们建议依据样本类型、混杂文库总量和杂交时间调整外显子 panel 捕获后的扩增循环数,避免过度扩增。以 Exome Plus Panel 为例,在快速杂交(4h)和过夜杂交(16h)的情况下,推荐常规 gDNA 样本按表 3 选择扩增循环数。
表3. NadPrep®建库体系推荐的WES捕获后扩增循环数
杂交时间
1-Plex
(500 ng)
4-Plex
(2 μg)
8-Plex
(4 μg)
12-Plex
(6 μg)
MGISEQ / DNBSEQ™
4 h
12
10
9
8
16 h
11
9
8
7-8
Illumina®
4 h
10
8
7
6
16 h
9
7
6
5-6