01
HLA 简介
HLA(人类白细胞抗原,Human Leukocyte Antigen)由 6 号染色体上一类编码 MHC(主要组织相容性复合体,Major Histocompatibility Complex)基因生成。HLA 以高度的多态性成为人类重要的遗传标记,在免疫应答和调控中发挥着重要作用。HLA 等位基因的分类命名法由 WHO HLA系统命名委员会确定,数据库中已正式命名的 HLA-I 型(HLA-A、B、C)和 HLA-II 型(HLA-DRB、DQB1等)等位基因,已达到 31675个 (IMGT / HLA 数据库 2022.01)。
HLA 与许多自身免疫性和传染性疾病的敏感性和耐药性有关。近期有研究称 HLA-A*24 型人群的 T 细胞对新冠病毒免疫反应更强[1]。HLA 配型相合程度,是器官、骨髓和干细胞移植成功与否的关键因素。此外,肿瘤患者的 HLA 基因型以及肿瘤中的体系突变均有可能影响免疫治疗的疗效。
图 1. HLA等位基因的分类命名法
02
HLA 的检测
尽管一代测序法是当前 HLA 分型的主要方法,已应用于 HLA 组织配型实验室和各临床医院,但通量低和耗时长是主要缺点。其次,一代测序分离杂合标本中的 HLA 等位基因序列也需要更为复杂昂贵的方式才能实现。二代测序由于通量和速度的极大提升,单次分型即可完成产生全相的高分辨率 HLA 分型,因而迅速得到广泛应用。
基于探针杂交捕获的二代测序,可高通量、低成本的实现高分辨 HLA 分型。相较于基于 PCR 的靶标序列富集方式,杂交捕获对于序列多态性的高容忍度是一个突出的优势。但是在面对 HLA 这样的超高多态性靶标时,杂交捕获也可能会力有不逮。纳昂达针对这一挑战专门开发了多态性探针补充方案,以最少的探针数覆盖 HLA 数据库中的数万种 HLA 型别,保证各种型别都有错配数 ≤7 的探针可结合(图 2A)。如图 2B 所示,常规设计对杂合子文库的捕获效果不佳,HLA-DQB1 中的部分位点多态性出现丢失情形。而经多态性补充后的探针,可顺利捕获两种等位基因。
图 2. 纳昂达多态性探针补充方案
HLAtyping Panel v1.0 【catalog: 1001622 (16 rxn)、1001621 (96 rxn)】是纳昂达针对 HLA 基因全部外显子区域多态性优化设计的一款 Panel,可保证等位基因的均衡捕获,从而支持更可靠的 HLA 分型结果。本文中,我们主要分享 HLA 分型标准品测试和生信分析经验。
03
实验设计
HLA 分型的标准品为 UCLA Immunogenetics Center 的细胞系标准品 UCLA DNA Reference Panel,包含 24 种 Class I 和 12 种 Class II。HLAtyping Panel v1.0 靶向一系列 HLA 基因及免疫通路基因,覆盖基因组约 40 kb 区域。靶向捕获测序均在 Illumina 和 MGISEQ 双平台上进行,参考相应使用说明。涉及试剂见表 1。
表 1. 靶向捕获试剂信息
HLA-HD[2]、Athlates[3] 和OptiType[4] 软件应用于HLA分型的分析(表 2)。其中 HLA-HD 和 Athlates 可用于 HLA I 型和 II 型的分型, HLA-HD 可以一次性对所有 HLA I 型和 II 型进行分型鉴定,而 Athlates 每次只能对一种分型进行鉴定。OptiType 只能用于 HLA I 型分型且精度为 4 位。如无特别说明,三者使用的数据库版本均为 IPD-IMGT/HLA,版本号 3.37.0。
表 2. 分析软件列表
HLA I 型和 II 型的标准品构建的双平台文库经 HLAtyping Panel 捕获,覆盖区域的平均深度均 >500x,平均中靶率均>75%(图3)。由于 HLA 区域的多态性和高复杂度,在评估捕获数据时,我们仅选取主要染色体进行基因组比对。如果把参考基因组补丁纳入范围,将导致“脱靶”率较高。但无论哪种方式,均不影响后续的 HLA 分型。
图 3. HLAtyping Panel双平台捕获结果
04
Illumina平台HLA分型表现
我们首先使用 HLA-HD、Athlates 和 OptiType 对 HLA 的 I 型和 II 型共计 12 个标准品分析,具体结果见表 3。HLA-HD 和 Athlates 比 OptiType 的 HLA I 型分型更加准确,两者仅在 A 基因的 24 个 allele 上错误分型 1 个位点,而 OptiType 则在 A 和 C 基因上分型错误了 2 个和 1 个位点。而 HLA 的 II 型分型的结果来看 HLA-HD 和 Athlates 各有优劣,HLA-HD 在 DRB3/4/5 基因上分型上错误了 4 个位点,而 Athlates 则在 DPB1 基因上效果不佳,错误了 3 个位点的分型。
表 3. 12个标准品的HLA分型结果
进一步分析 HLA-HD 分型不准确的原因,我们发现主要原因在于使用 IMGT 数据库版本的差异。以 HLA I 型的 C1-106 样本为例,A 基因的一个 Allele 位点跟标准品的 HLA-A*02:01 不一致,而是 HLA-A*02:642。但当使用更早的 IMGT 数据库版本(3.32.0)分析时,HLA-HD 的分型的结果为 HLA-A*02:01:01,与标准品的分型相一致。实际上 HLA-A*02:642 在 IMGT 3.37 版中属于 HLA-A*02:01:01G group,也就是说 HLA-A*02:642 分型是正确的,只不过由于 IMGT 数据库新增分型产生了命名差异。存在此现象的还包括 C2-104、C2-112 样品,具体分型结果和说明见表 4。
由于 HLA-HD 未过滤去除比对质量低且局部深度较低的读长,C2-106 样本被错误判定为杂合子,增加了HLA-DRB5*01:20 分型。Athlates 可对 C2-106 样本进行正确的分型,不存在误判,也从侧面证明了这一点。
HLA-HD 和 Athlates 软件均将 C2-105 中 HLA-DQA1*05:01 分型为 HLA-DQA1*05:05:01,原因在于后者的匹配度更高。对于这一偏差,我们认为应当使用一代测序验证相应突变位点,再次判别。
表 4. HLA-HD的“错误”分型原因
05
MGI平台的HLA分型表现
我们使用 HLA-HD 和 Athlates 对 HLA I 型的 24 个标准品分析,具体结果见表 5 和 6。整体而言,HLA-HD 比 Athlates 的 HLA I 型分型更加准确,前者仅在 C 基因的 48 个 allele 上“错误”分型 2 个位点,而 Athlates 则在 A 和 C 基因上分型错误了 3 个和 4 个位点。但当使用更早的 IMGT 数据库版本(3.32)的时候,HLA-HD 的分型的结果与标准品参考分型完全一致。因此,在使用 NGS 进行 HLA 分型时,需考虑 IMGT 数据库更新的影响。
表 5. 24个标准品的HLA分型结果
表 6. HLA-HD的“错误”分型原因
06
结束语
NGS已经被证明可以有效减少 HLA 分型的不准确性和检测成本,同时还能检测 HLA 基因的全部信息。但面对日益增多的测序数据和不断更新的 IMGT/HLA 的数据库,如何从 NGS 数据中得到正确的 HLA 分型变得越来越重要。
当使用多态性优化设计的 HLAtyping Panel 进行双平台捕获测序时,不同分析软件下的 Call rate 均能达到 100%,36 种 HLA 标准品合计 72 个 Allele 的分型准确率也在 98.5% 以上。即使平均测序深度低至 50x 时,也依然可以达到上述指标,这表明捕获数据均一性较好,不存在因某些 HLA 基因缺失或捕获质量差,导致无法分型的情形。
尽管 HLA-HD 软件在 HLA 分型时表现更好,但依然存在错误分型的可能。与此同时 HLA 数据库的不同版本也对软件判断分型的结果带来了巨大的影响。因此,在实际应用中,应根据 HLA 变异数据库的特定人群频率和单倍型频率进行校正,进一步提高分型准确率。
部分厂商的全外显子 Panel 基于参考标准基因组设计,从而忽略了 HLA 区域的高度多态性。当未进行针对性探针补充时,真实样本的 HLA 区域捕获效果会显著差于其它区域。而纳昂达推出的全外显子 Panel 均已包含多态性优化设计的 HLAtyping Panel,有助于实现 HLA 分型。
07
订购信息
全外显子 Panel |
规格 |
货号 |
NEXome Core Panel, 96 rxn |
96 rxn |
1001851 |
NEXome Core Panel, 16 rxn |
16 rxn |
1001852 |
Exome Plus Panel v2.0, 96 rxn |
96 rxn |
1001841 |
Exome Plus Panel v2.0, 16 rxn |
16 rxn |
1001842 |
关于纳昂达科技
纳昂达科技 成立于 2011 年,秉承 “Nano Trans More ”的核心理念和 “靶向精准,用心服务诊断”的奋斗宗旨,致力于为科研院校、医疗机构、临检单位、产业公司、测序服务商等提供专业化和高质量的靶向测序产品与闭环解决方案。
公司深耕精准靶向领域,目前拥有 MGI 和 Illumina 双测序平台多款文库构建试剂盒和全套液相杂交试剂产品。明星产品还包括全外显子 Panel、泛实体瘤和血液肿瘤 Panel 以及呼吸道病毒 Panel 等,并提供全面完善的双平台捕获探针定制化服务。
面积 > 2,000 平米的高通量测序研发中心和 > 2,500平米的GMP级别(YY/T0287-2017idt ISO13485:2016)体外诊断试剂生产基地为产品创新与生产质量保驾护航。纳昂达的销售网络覆盖全国并已外延至海外地区。
公司将与客户共成长,对客户的需求全力以赴,为全球用户提供靶向测序解决方案和 IVD 试剂原料。
Nanodigmbio
Nanodigmbio
微信公众号 | nanodigmbiotech
参考文献:
[1] https://www.riken.jp/en/news_pubs/research_news/pr/2021/20211208_1/index.html
[2] Kawaguchi S, Higasa K, Shimizu M, et al. HLA‐HD: An accurate HLA typing algorithm for next‐generation sequencing data[J]. Human mutation, 2017, 38(7): 788-797.
[3] Liu C, Yang X. Using exome and amplicon-based sequencing data for high-resolution HLA typing with ATHLATES[M]//HLA Typing. Humana Press, New York, NY, 2018: 203-213.
[4] Szolek A, Schubert B, Mohr C, et al. OptiType: precision HLA typing from next-generation sequencing data[J]. Bioinformatics, 2014, 30(23): 3310-3316.