公司新闻

【指南发布】CNV分析怎么做?看看这些实用建议!

浏览量:12557 / 发布时间:2020-11-06


拷贝数变异(Copy Number Variations, CNV)是由于基因组上存在1 kb以上的片段复制或缺失异常而导致的。现有研究表明, CNV 涉及到多种人类疾病的分子机制。对肿瘤患者进行 CNV 分析不仅可为肿瘤分子分型、用药、预后等临床管理提供指导,还有助于发现潜在的致病基因,为靶向药的开发提供新思路[1]


全基因组测序(Whole Genome Sequencing, WGS)已逐渐取代 SNP 芯片成为 CNV 分析金标准[2]。考虑到肿瘤标本的倍性、纯度和异质性,为了满足高覆盖率和低成本的要求,基于二代测序(Next-generation Sequencing, NGS)的靶向分析,如外显子测序(Whole Exome Sequencing, WES)和特定区域靶向测序(Targeted Next-Generation Sequencing, Tg-NGS),正越来越多地应用于 CNV 检测。


为了评估多款 Panel 产品用于 CNV 分析的表现,并对使用不同 Panel 进行 CNV 评估提出建议,以达到为用户提供参考价值的目标,纳昂达利用肿瘤 CNV 标准品和真实肿瘤样本(胰腺癌和结直肠癌组织)分别对多款 Panel 评估 CNV 的能力进行了分析,并对各影响条件给出相应的分析建议。


CNV分析简介


目前基于 NGS 的靶向捕获检测 CNV 主要依靠 Read-Depth 方法,即基因组区域的覆盖深度与拷贝数之间的关联性。根据检测方式可分为三类:单样本,配对的样本和对照,以及样本和群体正常参考对照。单样本分析由于没有参考对照,仅能检测与参考基因组相比较下的绝对拷贝数;配对样本分析时,可检测与对照相比较下的相对拷贝数差异;而基于人群的研究中,正常样本组的分布可用于分析检测肿瘤样本中的CNVs。


分析材料与方案


材料来源:肿瘤CNV标准品(肿瘤结构变异5% gDNA标准品和肿瘤野生型 gDNA 标准品,菁良,货号分别为 GW-OGTM001、GW-OGTM005)和真实肿瘤样本(2 例胰腺癌和6 例结直肠癌样本)的 WES 和 Tg-NGS 均在 Illumina 和 MGISEQ 双平台上进行。

分析方法:已知拷贝数来源于数字 PCR 或低深度 WGS(~350bp insert size)。CNVkit、Varscan2、cnv_facets 用于 WES 数据的 CNV 分析;CoNVaDING 和 DECoN 软件用于 Tg-NGS 数据的 CNV 分析;TitanCNA 用于 WGS 数据的 CNV 分析,具体软件信息见表1。


表1. 分析软件列表

CNV分析_修改表-1



通过此次分析评估,我们发现 CNV 在染色体上多呈现大片段(>1kb)异常,因此捕获 Panel 的大小和区域设计分布影响 Tg-NGS 下的 CNV 检测。对于 WGS、WES、Tg-NGS 涵盖不同大小的染色体区域的NGS技术,检测对应数据中 CNV 时应使用相符合的软件。我们的评估结果软件或算法以及判读定义都会影响 CNV 检出的效率及准确性。


对于 WES 数据检测 CNV,我们建议:1)按照软件要求提供对照样品数,一般情况下对照数据集应≥1。CNVkit 软件要求对照样本≥1,Varscan2 和 cnv_facets 要求肿瘤与对照配对分析;2)测序深度应满足软件分析要求;3)根据数据集训练结果合理自定义拷贝数扩增和缺失的阈值;4)使用多个 CNV 检测软件互补分析。


更多实验详情及分析总结,联系我们 support@njnad.com,获得 NAD-CNV 分析指南白皮书。


参考文献

[1] Kumaran M, Cass C E, Graham K, et al. Germline copy number variations are associated with breast cancer risk and prognosis[J]. Scientific reports, 2017, 7(1): 1-15.

[2] Zhou B, Ho S S, Zhang X, et al. Whole-genome sequencing analysis of CNV using low-coverage and paired-end strategies is efficient and outperforms array-based CNV analysis[J]. Journal of medical genetics, 2018, 55(11): 735-743.